الأخبار التكنولوجية والاستعراضات والنصائح!

التلخيص، الإجابة على بحث الويب: مقابلة مع دميتري سوبوتين من SenseBot

ستساعدك المقالة التالية: التلخيص، الإجابة على بحث الويب: مقابلة مع دميتري سوبوتين من SenseBot

تعد محركات البحث المصدر الأول للمعلومات بقدر ما هي نقطة البداية للبحث. يعد تلخيص محتوى نتائج الاستعلام تقنية مبتكرة للحصول على استجابة ذكية من النظام. هذا هو المفهوم وراء SenseBot ويسعدني أن ديمتري سوبوتين خصص وقتًا للإجابة على بعض الأسئلة حول التطورات في SenseBot.

ما هي مفاهيم التكنولوجيا الرئيسية والمجالات المستهدفة لـ SenseBot؟

لقد توصلت لأول مرة إلى مفهوم الملخص كنوع من الاستجابة لاستعلام محرك البحث منذ عدة سنوات. منذ ذلك الحين، تحسنت أهمية النتائج التي تعرضها محركات البحث الرئيسية بشكل كبير. ومع ذلك، فقد زادت توقعات المستخدمين أيضًا. تحاول العديد من محركات البحث اليوم القيام بأكثر من مجرد عرض 10 روابط في صفحة النتائج الأولى.

وعلى مستوى عالٍ جدًا، نقرأ المصادر التي يعود بها محرك بحث رئيسي. نقوم بالتنقيب عن النص في كل مصدر، واستخراج المفاهيم الأساسية. نحن نقوم بتقييم أوجه التشابه بين المصادر وحتى نسقط تلك البعيدة، أي التي لا تتعلق بكتلة المصادر. نقوم بتعيين الترجيح للمفاهيم، ونضمن معاملة تفضيلية للمفاهيم التي تمثل الاستعلام. نقوم بعد ذلك بإجراء تلخيص متعدد المستندات، وإنشاء ملخص نصي من المستندات، وفقًا لخوارزمية خاصة. لذا فإن النتيجة الفعلية لبحث الويب هي ملخص لموضوع استعلام المستخدم.

يمكن تحقيق أفضل النتائج من خلال مجموعة من المستندات القريبة بالفعل من الموضوع، والتي تكون نصية في المقام الأول. يبدو أن محركات البحث والبوابات العمودية هي أفضل مجال للتطبيق بالنسبة لنا من هذا المنظور – المالية والطبية والقانونية والمكتبات وما إلى ذلك. أما بالنسبة لعمليات البحث العامة على الويب، فإن قدرًا من “الضجيج” أمر لا مفر منه، حتى بالنسبة للمصادر من البداية صفحة النتائج – من المفترض أنها الأكثر صلة.

ما هي التحديثات الجديدة التي تم توفيرها مؤخرا؟

لقد قمنا بتحسين ترجيح الاستعلام مع هذه الترقية الأخيرة. سيؤثر هذا على الحالات التي تكون فيها النتائج التي تعرضها Google بناءً على استعلام المستخدم مرتبطة جزئيًا فقط بموضوع الاستعلام. ما فعلناه هو إضافة المزيد من الوزن إلى المفاهيم المتعلقة بالاستعلام، مما يضمن أننا ننظر إلى محتوى المستند من خلال محور الاستعلام. كما ينطبق الترجيح على لغات متعددة بالإضافة إلى اللغة الإنجليزية. نحن نعمل باستمرار على تحسين خوارزمياتنا.

لقد قمنا أيضًا بطرح ترقية للأداء توفر الآن تحسنًا يصل إلى 50% مقارنة بالتوقيتات السابقة. Note أن يتم قضاء معظم الوقت في قراءة نتائج الويب؛ المعالجة الفعلية سريعة جدًا. إذا تم دمج SenseBot مع محرك بحث رئيسي أو بوابة تستضيف المستندات، فسيشاهد المستخدمون الملخصات للحظات.

هل يقوم المحرك بالبحث مباشرة من أي محرك بحث عمودي بناء على تقييم الاستعلام أو الكلمات الرئيسية؟

لا، على الرغم من أنها فكرة عظيمة. في هذه اللحظة، نقوم فقط بالاستعلام عن واحدة من الثلاثة الكبار، أيهما يفضله المستخدم. بالنسبة للقطاعات، لدينا أدوات منفصلة تسمح بتلخيص مجموعات من صفحات الويب أو المستندات المحددة.

هل هناك أي تطبيقات مستقبلية لـ SenseBot قيد التنفيذ؟ على سبيل المثال، مع الأخذ في الاعتبار أن المحرك يمكنه تلخيص المحتوى المفقود من الموسوعات عبر الإنترنت مثل ويكيبيديا؟

أرى عددًا من التطبيقات المستقبلية، معظمها مدمج مع محركات البحث (الرئيسية أو الرأسية) أو البوابات. سيكون البحث عن المؤسسات أمرًا طبيعيًا آخر. إن إخراج المحتوى ذي الصلة من خارج الصفحة الأولى من النتائج هو أمر يمكننا القيام به. أما بالنسبة لمجالات المحتوى، فإليك بعض الأمثلة التي نرى فيها توافقًا جيدًا:

  • التعليم: إنشاء مقدمات تلقائيًا لمجال معين من المعرفة أو الدراسة؛ إعداد الأساس لمقال حول موضوع ما.
  • المكتبات: تطبيقات البحث لأمناء المكتبات ورعاة المكتبات
  • الأخبار والأبحاث المالية: إعطاء سبق صحفي حول ما يحدث في مجال معين من الاقتصاد، والأسواق، في قطاع معين، وما إلى ذلك.
  • الذكاء التنافسي: تحليل مجموعة من المستندات عن منافس، أو منطقة مستهدفة من قبل عدد من المنافسين.
  • المعلومات الطبية: تقديم ملخص عن حالة طبية أو أعراض.
  • المعلومات القانونية: تقديم ملخص عن الوضع القانوني أو تطور المفهوم القانوني.

أما بالنسبة إلى ويكيبيديا، فأنا أعتبرها مصدرًا رائعًا للمعلومات، مع أنني أفضّل استخدامها كأحد المصادر. أطلق أحد مستخدمينا على SenseBot اسم “ويكيبيديا ميكانيكية”. لكن الاختلاف الرئيسي هو أننا نقدم محتوى غير محرر، حتى اللحظة، بناءً على ما يتم إرجاعه باعتباره المعلومات الأكثر صلة بواسطة محركات البحث. نعم، ملخصنا يكون تقريبيًا في بعض الأحيان؛ لكن النضارة والتنوع والافتقار إلى التحيز ربما تعوض عن الخشونة.

يتخذ SenseBot منهجًا خوارزميًا للبحث عندما يبدو الاتجاه أكثر نحو دمج الميزات الاجتماعية مثل تصنيف المستخدم والمحتوى المقدم من المستخدم (خاصة في مساحة البحث البديلة). ما هو رأيك في هذه التطورات والميزات الجديدة التي ستأتي إلى SenseBot؟

نعم، يبدو أن الاتجاه الرئيسي في الوقت الحالي هو البحث عن “التواصل الاجتماعي”. محركات البحث البديلة تحتفظ بقائمة شاملة ومراجعات لمحركات البحث بجميع أنواعها، والكثير منها يتضمن تصويت المستخدمين أو المشاركة بطريقة ما في اكتشاف النتائج الصحيحة. لكنني أعتقد أنه مع الحجم الهائل للويب، فإن المشاركة البشرية لا يمكن أن تساعد إلا إلى حد ما. لا تزال بحاجة إلى خوارزميات لاستخراج المعلومات وتنظيمها بطريقة مفيدة.

في النهاية، هدف أي محرك بحث هو رضا المستخدم، والذي يمكن التعبير عنه فيما إذا كان المستخدم قد وجد إجابة لاستفساره أم لا؛ وكم من الوقت قضى في البحث. إن الحصول على ملخص لأهم النتائج ذات الصلة قد يمنح المستخدم 80% من الإجابة في ثوانٍ معدودة – وفي كثير من الحالات تكون نسبة الـ 80% تلك كافية. قد يرضي الملخص المستخدم بالفعل، دون الحاجة إلى التعمق في المصادر الفردية. إذا أراد المستخدم التعمق أكثر، فإن الملخص يمكن أن يمنحه فكرة جيدة عن جودة المصادر، بحيث يذهب مباشرة إلى أولئك الذين يتحدثون بنفس الموجة حول الموضوع.

على سبيل المثال، لقد قمت للتو بإرسال استعلام “مسلح أوماها” إلى SenseBot، واختيار جوجل كمحرك. أعاد SenseBot ملخصًا موجزًا ​​عن إطلاق النار، مع التركيز بشكل خاص على هوية المسلح. وقد نقلت جميع الشبكات الإخبارية القصة بطريقتها الخاصة مع تفاصيل كثيرة. لكن الملخص، في بضع ثوانٍ فقط، أعطاني فكرة جيدة عما حدث، مع بعض التفاصيل الأساسية المستمدة من مصادر مختلفة. إنه مثل مشاهدة عدة شاشات تلفزيون في وقت واحد، والقدرة على الحصول على جوهر القصة.

من خلال إلقاء نظرة سريعة على الملخص، لاحظت أيضًا أن SenseBot أسقط مصدرين من أصل 8 مصادر أعادتها Google. لقد قمت بفحصهما – لقد كانا بالفعل سطحيين من حيث المحتوى!

كانت تلك قصة إخبارية، ولكن أنواع الاستعلامات التي يمكن لـ SenseBot أن تزدهر فيها حقًا هي عندما يحاول المستخدم فهم مفهوم جديد، أو البحث في موضوع معين.

شكرا ديمتري. يمكن للقراء تجربة ميزات محرك SenseBot من هنا.