الأخبار التكنولوجية والاستعراضات والنصائح!

ما هي المطابقة العصبية من Google؟

ستساعدك المقالة التالية: ما هي المطابقة العصبية من Google؟

أعلنت Google مؤخرًا أنها تستخدم خوارزمية “المطابقة العصبية” لفهم المفاهيم بشكل أفضل. وقال داني سوليفان من جوجل إنه يتم استخدامه في 30% من استعلامات البحث.

نشرت Google مؤخرًا ورقة بحثية نجحت في مطابقة استعلامات البحث مع صفحات الويب باستخدام استعلام البحث وصفحات الويب فقط. على الرغم من أن هذه الخوارزمية قد لا تكون قيد الاستخدام، أو ربما تستخدم كجزء من مجموعة من الخوارزميات، إلا أنها بمثابة مثال لكيفية عمل خوارزمية “المطابقة العصبية”.

هل تستخدم Google الخوارزميات المنشورة؟

لا تستخدم Google دائمًا الخوارزميات المنشورة في براءات الاختراع والأوراق البحثية. ومع ذلك، يتم بالفعل استخدام عدد غير محدد من الخوارزميات المنشورة في خوارزميات بحث Google.

ويجب الإشارة أيضًا إلى أن Google لا تؤكد بشكل عام ما إذا كانت خوارزمية معينة قيد الاستخدام أم لا.

جوجل تناقش خوارزمية الذكاء الاصطناعي الجديدة

لقد ناقشت جوجل في الماضي الخوارزميات بشكل عام، مثل خوارزمية Panda وخوارزمية Penguin. ويبدو أن هذا هو الحال اليوم، حيث يقدم داني سوليفان أدلة حول خوارزمية “المطابقة العصبية” الجديدة.

تمت مناقشة هذه الخوارزمية الجديدة بواسطة داني سوليفان (في تغريدة) باعتبارها:

“… المطابقة العصبية، طريقة الذكاء الاصطناعي لربط الكلمات بالمفاهيم بشكل أفضل.”

يناقش داني سوليفان من Google المطابقة العصبية.

غرد داني سوليفان أيضًا:

“إن الطريقة التي يبحث بها الأشخاص غالبًا ما تختلف عن المعلومات التي يكتب الأشخاص حلولاً عنها.”

قام داني سوليفان بتغريد لقطة شاشة توضح كيف أن الكلمات لها معاني مختلفة.

الذكاء الاصطناعي والتعلم العميق وصفحات التصنيف

نشرت مدونة Google AI مؤخرًا رابطًا لورقة بحثية جديدة تسمى، تصنيف الصلة العميقة باستخدام التفاعلات المحسنة للاستعلام عن المستندات. على الرغم من أن بحث الخوارزمية هذا جديد نسبيًا، إلا أنه يعمل على تحسين طريقة الشبكة العصبية العميقة الثورية لإنجاز مهمة تُعرف باسم تصنيف ملاءمة المستند. تُعرف هذه الطريقة أيضًا باسم الاسترداد المخصص.

على الرغم من أنه لا يمكن القول بشكل قاطع أن هذا جزء مما تسميه جوجل المطابقة العصبية، إلا أنه يجعل البحث مثيرًا للاهتمام حول شيء مشابه لذلك.

هذه هي الطريقة التي تصف بها ورقة البحث الجديدة الاسترجاع المخصص:

“تصنيف مدى صلة الوثيقة، المعروف أيضًا باسم الاسترجاع المخصص… هو مهمة تصنيف المستندات من مجموعة كبيرة باستخدام الاستعلام ونص كل مستند فقط.”

توضح ورقة البحث أن هذا النوع من التصنيف يستخدم فقط استعلام البحث وصفحة الويب فقط. ويمضي في القول:

“يتناقض هذا مع أنظمة استرجاع المعلومات القياسية (IR) التي تعتمد على الإشارات النصية جنبًا إلى جنب مع بنية الشبكة (Page et al., 1999; Kleinberg, 1999) و/أو تعليقات المستخدم (Joachims, 2002).”

في البيان أعلاه، ينص على أن تصنيف مدى ملاءمة المستند يختلف عن تقنيات البحث الأخرى (أنظمة استرجاع المعلومات) التي تعتمد على “بنية الشبكة” ثم يستشهد بـ Larry Page، وهو مرجع إلى PageRank والروابط. ويستشهد أيضًا بكلينبرج، وهو إشارة إلى بحث جون كلاينبيرج حول استخدام الروابط لتصنيف صفحات الويب.

من الواضح أن تصنيف مدى ملاءمة المستند هو أسلوب جديد نسبيًا لتصنيف صفحات الويب وأنه لا يعتمد على إشارات الارتباط.

هل لا يستخدم تصنيف مدى ملاءمة المستندات في Google الروابط؟

الخوارزمية الجديدة التي تم نشرها في مدونة Google للذكاء الاصطناعي لا تستخدم عوامل التصنيف التقليدية بشكل مباشر. ومع ذلك، يتم استخدام عوامل التصنيف التقليدية أولا. ثم يتم استخدام جزء الاسترجاع المخصص من الخوارزمية.

تشير الورقة البحثية إلى أنها تعيد ترتيب صفحات الويب التي تم تصنيفها بالفعل.

وهذا يعني أنه مهما كانت إشارة التصنيف التي تنطلق، يجب على صفحة الويب القفز من خلالها للحصول على التصنيف، فهي لا تزال موجودة. ومع ذلك، فإن إشارات التصنيف التقليدية لا تحدد الصفحات التي سيتم تصنيفها في المراكز العشرة الأولى.

لذلك يمكن القول أن إشارات التصنيف التقليدية تخدم نوعًا من وظيفة التدقيق. تعمل إشارة الترتيب على إزالة الرسائل غير المرغوب فيها وتجمع المستندات الأكثر صلة.

ما تفعله هذه الخوارزمية الجديدة هو إعادة ترتيب صفحات الويب هذه وفقًا لمجموعة مختلفة تمامًا من المعايير لمطابقة ما أطلق عليه داني سوليفان “المرادفات الفائقة”.

وهذا الاستخدام لإشارات التصنيف أولاً هو ما يجعل هذه الخوارزمية مختلفة عن تلك الموجودة تم نشره في عام 2016، ويشار إليه باسم نموذج مطابقة الملاءمة العميقة (درم).

إليك ما قاله البحث الجديد، عند مقارنة DRMM بهذه الخوارزمية الجديدة:

“في النموذج القائم على التفاعل، يتم إحداث ترميزات واضحة بين أزواج الاستعلامات والمستندات. وهذا يسمح بالنمذجة المباشرة للمصطلحات المطابقة تمامًا أو شبه المطابقة (على سبيل المثال، المرادفات)، وهو أمر بالغ الأهمية لتصنيف الصلة.

في الواقع، قوه وآخرون. (2016) أظهر أن DRMM القائم على التفاعل يتفوق على الأساليب السابقة القائمة على التمثيل. من ناحية أخرى، تعد النماذج القائمة على التفاعل أقل كفاءة، حيث لا يمكن فهرسة تمثيل المستند بشكل مستقل عن الاستعلام. ومع ذلك، فإن هذا أقل أهمية، عندما تقوم طرق تصنيف الملاءمة بإعادة ترتيب أهم المستندات التي تم إرجاعها بواسطة محرك الأشعة تحت الحمراء التقليدي، وهو السيناريو الذي نأخذه في الاعتبار هنا.

ماذا تفعل الخوارزمية في الواقع؟

الغرض من الخوارزمية هو مطابقة استعلام البحث بصفحة الويب، وذلك باستخدام استعلام البحث ونص صفحة الويب نفسها فقط. لن يتم ترقية صفحات الويب المصنفة بواسطة هذا النوع من الخوارزميات إلى أعلى المواضع بفضل الروابط أو الكلمات الرئيسية، نظرًا لأن هذا النوع من الخوارزميات يدور حول “مطابقة الملاءمة”.

“نحن نستكشف عدة نماذج جديدة لتصنيف مدى صلة الوثيقة، بناءً على نموذج مطابقة الصلة العميقة (DRMM)… على عكس DRMM، الذي يستخدم ترميزات غير حساسة للسياق للمصطلحات وتفاعلات مصطلحات الاستعلام والوثيقة، فإننا نقوم بإدخال ترميزات غنية حساسة للسياق في جميع نماذجنا ، مستوحاة من ميزات مطابقة N-gram التلافيفية الخاصة بـ PACRR (Hui et al.,2017)، ولكنها ممتدة بعدة طرق بما في ذلك طرق عرض متعددة للاستعلام ومدخلات المستندات.

المحتوى هو أكثر أهمية

هل هذا يعني أنه يجب على الناشرين استخدام المزيد من المرادفات؟ لقد بدا لي دائمًا أن إضافة المرادفات هو شكل من أشكال البريد العشوائي للكلمات الرئيسية. لقد اعتبرته دائمًا اقتراحًا ساذجًا.

الغرض من فهم Google للمرادفات هو ببساطة فهم سياق الصفحة ومعناها. في رأيي، يعد التواصل بشكل واضح ومتسق أكثر أهمية من إرسال بريد عشوائي إلى الصفحة باستخدام الكلمات الرئيسية والمرادفات.

ما صرحت به جوجل رسميًا هو أنها قادرة على فهم المفاهيم. لذلك، بطريقة ما، يعد فهمًا أكثر طبيعية لكيفية حل صفحة الويب للمشكلة المضمنة في استعلام البحث. وفقا للإعلان الرسمي لشركة جوجل:

“…لقد وصلنا الآن إلى النقطة التي يمكن أن تساعدنا فيها الشبكات العصبية على تحقيق قفزة كبيرة للأمام من فهم الكلمات إلى فهم المفاهيم. تتيح لنا التضمينات العصبية، وهو نهج تم تطويره في مجال الشبكات العصبية، تحويل الكلمات إلى تمثيلات أكثر غموضًا للمفاهيم الأساسية، ثم مطابقة المفاهيم الموجودة في الاستعلام مع المفاهيم الموجودة في المستند. نحن نسمي هذه التقنية المطابقة العصبية.”

هل هذه المطابقة العصبية؟

من الممكن أن تحتوي المطابقة العصبية على عناصر من هذه الخوارزمية ممزوجة بعناصر من خوارزميات أخرى. ما إذا كان Google يستخدم هذه الخوارزمية الدقيقة أقل أهمية من فهم أن ترتيب المستندات باستخدام استعلام البحث ومحتوى صفحة الويب فقط أمر ممكن.

إن فهم ذلك سيساعد الناشرين على تجنب الدوران باستراتيجيات غير مفيدة مثل إضافة المرادفات.

يوضح هذا النوع الجديد من تصنيف الذكاء الاصطناعي كيف يمكن إنشاء نتائج بحث لا يتم تصنيفها بشكل مباشر حسب عوامل التصنيف التقليدية مثل الروابط أو الكلمات الرئيسية. وهذا يتطلب اهتمامًا أكبر بأشياء مثل نية المستخدم وفهم كيفية مساعدة صفحة المحتوى للمستخدم.

إقرأ الورقة البحثية هنا: تصنيف الصلة العميقة باستخدام التفاعلات المحسنة للاستعلام عن المستندات