ستساعدك المقالة التالية: زيروكس فاكت سبوتر: مفاهيم التعدين في النص
إن FactSpotter من Xerox ليست أداة بحث رئيسية ستظهر لأول مرة كتحدي لمحركات البحث الحالية. لكن الميزات المضمنة فيه قد تمهد الطريق لأداة بحث مثالية مبنية على مفهوم ربط البيانات بدلاً من جمع البيانات.
جمع البيانات هو ما تفعله المحركات الرئيسية اليوم – ابحث عن الروابط المصنفة عبر النماذج الإحصائية أو الرياضية وادفعها إلى المستخدمين.
يعتزم العاملون في شركة Xerox إطلاقه FactSpotter كأداة للتنقيب عن النص تلتقط المفهوم والسياق والكلمات الرئيسية في الاستعلام لإرجاع النتائج ذات الصلة.
على سبيل المثال، سيؤدي البحث عن “خطاب ستيف جوبز بالأمس” إلى عرض خطابه بالأمس كأفضل نتيجة بدلاً من الروابط مع تسجيلاته الصوتية أو صوره أو أي بيانات أخرى في أي وقت آخر. إنها تقنية التقاط المفهوم (في هذه الحالة مفهوم الوقت) من الكلمات الرئيسية ومطابقته مع القواعد النحوية الأساسية في الاستعلام لإرجاع نتائج قريبة من المثالية التي تجعل FactSpotter منافسًا مناسبًا في الفضاء الدلالي.
الميزات البارزة الأخرى هي:
- التعرف على مفاهيم مثل “المباني” و”الناس”.
- ابحث في المستندات بلغات متعددة.
الآفاق
وقد ذكر المصنعون أن المحرك يعتمد على ربط البيانات، مما يشير إلى الاعتماد على الإطار الدلالي للويب الذي يوفر البيانات.
وهذا هو أحد الأسباب التي تجعلني أشعر أن FactSpotter قد لا يكون حلاً مناسبًا جدًا لإدارة المستندات فحسب (تخطط Xerox لإطلاقه أولاً لشركات التقاضي لإدارة مجموعة المستندات)، ولكنه قد يكون أيضًا رائدًا في التقنيات التي ستستخدم بطبيعتها الإطار الدلالي الذي سوف قوة شبكة المستقبل.
ال الويب الدلالي هو مفهوم إنشاء شبكة ويب حيث يتم وصف البيانات بطريقة يمكن للآلات فهمها. وستكون النتيجة القدرة على تصميم برنامج ويب يمزج البيانات بتنسيقات مختلفة متدفقة من مصادر مختلفة دون أي عوائق. وFactSpotter هي واحدة من تقنيات الجيل القادم التي يجب البحث عنها.