الأخبار التكنولوجية والاستعراضات والنصائح!

بحث هاكيا الدلالي: الإجابة على ضعف الملاءمة القائمة على الكلمات الرئيسية

ستساعدك المقالة التالية: بحث هاكيا الدلالي: الإجابة على ضعف الملاءمة القائمة على الكلمات الرئيسية

قال جيمي ويلز، مؤسس ويكيبيديا، ذات مرة: “البحث جزء من البنية التحتية الأساسية للإنترنت. وهي مكسورة حاليًا. وبينما كان يشتغل بمفهوم محرك البحث مفتوح المصدر، قال الدكتور رضا سي بيركان هاكيا.كوم يعتقد أن الإصلاح يكمن في الدلالات.

يعتقد الرئيس التنفيذي ومؤسس محرك البحث القائم على “المعاني” أن مستقبل البحث يكمن في فهم ما يريده المستخدم بدلاً من الحصول على النتائج باستخدام مطابقات الكلمات الرئيسية.

تعد المحركات الدلالية واحدة من بين عدد كبير من خيارات البحث البديلة التي تظهر الآن لأول مرة عبر الويب. في حين أن العديد من الوافدين الجدد يركزون على تحسين واجهات المستخدم، أو تجميع البيانات من المحركات الموجودة بالفعل، فإن البحث الدلالي ربما يكون النهج التكنولوجي الأكثر صعوبة في حل المشكلة.

يعتمد Hakia على قاعدة بيانات دائمة التوسع من مطابقة المفاهيم التي تقول إنها ستساعد في فهم أفضل للاستعلامات الطويلة المعقدة وحتى الاستعلامات القائمة على الأسئلة التي لا تعالجها الأنظمة الحالية بشكل مناسب.

ما الذي يدير الدلالات؟

وبالنظر إلى مهمة فهم طوفان المعلومات الذي يمثله الويب حقًا، يبدو أن العمود الفقري التكنولوجي لشركة Hakia لديه الوصفة اللازمة لتوسيع نطاقه. ومن دون مزيد من اللغط، إليكم الحقائق:

يعتمد البحث الدلالي لـ Hakia بشكل أساسي على ثلاث تقنيات متطورة:

  1. OntoSem (مستودع الإحساس)
  2. QDEX (تقنية فهرسة الاستعلام)
  3. خوارزمية SemanticRank
  • OntoSem هو مستودع Hakia لعلاقات المفاهيم، وبعبارة أخرى، قاعدة بيانات لغوية حيث يتم تصنيف الكلمات إلى “الحواس” المختلفة التي تنقلها.
  • QDEX هو بديل Hakia للمؤشر المقلوب الذي تستخدمه معظم المحركات لحفظ محتوى الويب. يقوم QDEX باستخراج جميع الاستعلامات المحتملة المتعلقة بالمحتوى (الاستفادة من OntoSem للمعنى) وتصبح هذه بوابات إلى المستند الأصلي. تعمل هذه العملية على تقليل مجموعة البيانات التي يتعين على المفهرس التعامل معها بشكل كبير أثناء الاستعلام عن البيانات أثناء التنقل. ميزة عندما تفكر في مجموعة واسعة من البيانات التي سيتعين على المحرك البحث عنها إذا كانت فهرسًا مقلوبًا.
  • أخيرًا، تقوم خوارزمية SemanticRank بتصنيف المحتوى بشكل مستقل على أساس المزيد من تحليل الجمل. يتم أيضًا استخدام مصداقية المحتوى وعمره لتحديد مدى ملاءمته.

تقوم Hakia بإجراء تحليلات خالصة للمحتوى بغض النظر عن الروابط أو النقرات بين المستندات (وهي تتعارض مع النماذج الإحصائية لتحديد مدى الصلة).

من خلال الفهرسة والبحث القائمين على المحتوى فقط، ليست هناك حاجة لمراقبة نشاط المستخدم عبر ملفات تعريف الارتباط أو جافا سكريبت (تهدئة المخاوف المتعلقة بالخصوصية). في الواقع، لا يتم حفظ أي بيانات على نظام المستخدم دون الحصول على إذن صريح من المستخدم.

جوجل الخافق؟

مع التركيز المتزايد على إنشاء الجيل التالي من الويب وفقًا للمعايير الدلالية حيث يمكن للآلات تفسير البيانات بسلاسة، ستصبح محركات البحث الدلالية أكثر أهمية.

يدعي مهندسو هاكيا أنفسهم أن نموذجهم يحاكي التعلم البشري (الذي يتم تسريعه بشكل كبير). ومع ذلك، بقدر ما يتعلق الأمر بتفوق Google (SEOMarketTips)، كان الأشخاص في GooglePlex يوظفون خبراء في التعلم الآلي ومعالجة اللغات الطبيعية لفترة طويلة. ومن ثم لا يمكن القول أن جوجل غافلة عن إمكانات البحث الدلالي.

كما تظهر “هاكيا” في وقت يتحول فيه الإنترنت بشكل متزايد من شبكة “نصية” إلى تجربة أكثر تفاعلية (الفيديو والصوت). ومن ثم فإن مسألة الدلالات تتوسع إلى فهم المحتوى ككل. وهذا هو المكان الذي يجب على هاكيا الاستفادة منه.

في الختام، أود أن أوافق على ما علق عليه الدكتور رضا في منشور على موقع ReadWriteWeb – “البحث الدلالي هو بالتأكيد ترياق لضعف الملاءمة؛ لكن الوقت وحده هو الذي سيحدد مدى نجاح القيام بذلك”.