الأخبار التكنولوجية والاستعراضات والنصائح!

تسرب عوامل ترتيب بحث Yandex: الرؤى

ستساعدك المقالة التالية: تسرب عوامل ترتيب بحث Yandex: الرؤى

يحاول مجتمع التسويق عبر البحث فهم مستودع Yandex المسرب الذي يحتوي على ملفات تسرد ما يشبه عوامل تصنيف البحث.

قد يبحث البعض عن أدلة قابلة للتنفيذ لتحسين محركات البحث، ولكن ربما لا تكون هذه هي القيمة الحقيقية.

الاتفاق العام هو أنه سيكون مفيدًا للحصول على فهم عام لكيفية عمل محركات البحث.

إذا كنت تريد اختراقات أو اختصارات، فهذه ليست هنا. ولكن إذا كنت تريد فهم المزيد حول كيفية عمل محرك البحث. هناك الذهب.

– ريان جونز (@RyanJones) 29 يناير 2023

هناك الكثير لنتعلمه

ريان جونز (@ريانجونز) يعتقد أن هذا التسرب هو صفقة كبيرة.

إنه بالفعل تم تحميل بعض نماذج التعلم الآلي في Yandex على جهازه الخاص للاختبار.

رايان مقتنع بأن هناك الكثير لنتعلمه ولكن الأمر سيستغرق أكثر من مجرد فحص قائمة عوامل التصنيف.

يشرح ريان:

“على الرغم من أن Yandex ليس Google، إلا أن هناك الكثير الذي يمكننا تعلمه من هذا فيما يتعلق بالتشابه.

يستخدم Yandex الكثير من التقنيات التي ابتكرتها Google. يشيرون إلى نظام ترتيب الصفحات بالاسم، ويستخدمون Map Reduce وBERT والعديد من الأشياء الأخرى أيضًا.

من الواضح أن العوامل ستختلف وستختلف الأوزان المطبقة عليها أيضًا، لكن أساليب علوم الكمبيوتر في كيفية تحليل مدى صلة النص وربط النص وإجراء العمليات الحسابية ستكون متشابهة جدًا عبر محركات البحث.

أعتقد أنه يمكننا استخلاص الكثير من المعلومات من عوامل التصنيف، ولكن مجرد النظر إلى القائمة المسربة وحدها لا يكفي.

عندما تنظر إلى الأوزان الافتراضية المطبقة (قبل تعلم الآلة)، هناك أوزان سلبية يفترض أن مُحسنات محركات البحث إيجابية أو العكس.

هناك أيضًا الكثير من عوامل التصنيف المحسوبة في الكود مقارنة بما تم إدراجه في قوائم عوامل التصنيف العائمة.

يبدو أن هذه القائمة مجرد عوامل ثابتة ولا تأخذ في الاعتبار كيفية حساب مدى صلة الاستعلام أو العديد من العوامل الديناميكية التي تتعلق بمجموعة النتائج لهذا الاستعلام.

أكثر من 200 عامل تصنيف

من الشائع، بناءً على التسريب، أن ياندكس يستخدم 1923 عامل تصنيف (البعض يقول أقل).

كريستوف كيمبر (الملف الشخصي على لينكدإن)، مؤسس Link Research Tools، أن أصدقاءه أخبروه أن هناك العديد من عوامل التصنيف.

شارك كريستوف:

“لقد رأى الأصدقاء:

  • 275 عوامل التخصيص
  • 220 عامل “نضارة الويب”.
  • 3186 عوامل البحث عن الصور
  • 2,314 عامل بحث عن الفيديو

هناك الكثير ليتم رسم خرائطه.

ربما يكون الأمر الأكثر إثارة للدهشة بالنسبة للكثيرين هو أن ياندكس لديه مئات العوامل للروابط.

النقطة المهمة هي أنه أكثر بكثير من أكثر من 200 عامل تصنيف يستخدمه Google للمطالبة به.

وحتى جون مولر من Google قال إن Google ابتعدت عن عوامل التصنيف التي تزيد عن 200 عامل.

لذلك ربما يساعد ذلك صناعة البحث على الابتعاد عن التفكير في خوارزمية Google بهذه المصطلحات.

لا أحد يعرف خوارزمية جوجل بأكملها؟

والأمر اللافت للنظر بشأن تسرب البيانات هو أنه تم جمع عوامل التصنيف وتنظيمها بطريقة بسيطة.

ويثير التسريب تساؤلات حول فكرة أن خوارزمية جوجل تخضع لحراسة مشددة وأن لا أحد، حتى في جوجل، يعرف الخوارزمية بأكملها.

هل من الممكن أن يكون هناك جدول بيانات في Google يحتوي على أكثر من ألف عامل تصنيف؟

يشكك كريستوف سيمبر في فكرة أن لا أحد يعرف خوارزمية جوجل.

علق كريستوف على مجلة محرك البحث:

“قال أحدهم على LinkedIn إنه لا يستطيع أن يتخيل أن Google “توثق” عوامل التصنيف بهذه الطريقة.

ولكن هذه هي الطريقة التي يجب بها بناء نظام معقد كهذا. هذا التسريب من مصدر موثوق للغاية.

لدى Google رمز يمكن تسريبه أيضًا.

إن العبارة المتكررة في كثير من الأحيان والتي تقول إنه حتى موظفي Google لا يعرفون عوامل التصنيف تبدو دائمًا سخيفة بالنسبة لشخص تقني مثلي.

سيكون عدد الأشخاص الذين لديهم كل التفاصيل صغيرًا جدًا.

ولكن يجب أن يكون موجودًا في الكود، لأن الكود هو ما يدير محرك البحث.

ما هي أجزاء ياندكس المشابهة لجوجل؟

تلقي ملفات Yandex المسربة نظرة خاطفة على كيفية عمل محركات البحث.

لا تظهر البيانات كيفية عمل Google. ولكنه يوفر فرصة لعرض جزء من كيفية تصنيف محرك البحث (ياندكس) لنتائج البحث.

لا ينبغي الخلط بين ما تحتويه البيانات وما قد تستخدمه Google.

ومع ذلك، هناك أوجه تشابه مثيرة للاهتمام بين محركي البحث.

MatrixNet ليس RankBrain

إحدى الأفكار المثيرة للاهتمام التي يبحث عنها البعض تتعلق بشبكة ياندكس العصبية المسماة MatrixNet.

MatrixNet هي تقنية قديمة تم تقديمها في عام 2009 (رابط archive.org للإعلان).

على عكس ما يدعي البعض، فإن MatrixNet ليست نسخة Yandex من RankBrain من Google.

Google RankBrain عبارة عن خوارزمية محدودة تركز على فهم 15% من طلبات البحث التي لم ترها Google من قبل.

كشف مقال في بلومبرج عن RankBrain في عام 2015. ويذكر المقال أنه تمت إضافة RankBrain إلى خوارزمية Google في ذلك العام، بعد ست سنوات من تقديم Yandex MatrixNet (Archive.org لقطة من المقال).

تصف مقالة بلومبرج الغرض المحدود لـ RankBrain:

“إذا رأى RankBrain كلمة أو عبارة ليست على دراية بها، فيمكن للآلة تخمين الكلمات أو العبارات التي قد يكون لها معنى مماثل وتصفية النتيجة وفقًا لذلك، مما يجعلها أكثر فعالية في التعامل مع البحث الذي لم يسبق له مثيل استفسارات.”

من ناحية أخرى، MatrixNet هي خوارزمية للتعلم الآلي تقوم بالكثير من الأشياء.

أحد الأشياء التي تقوم بها هو تصنيف استعلام البحث ثم تطبيق خوارزميات الترتيب المناسبة على هذا الاستعلام.

هذا جزء مما ينص عليه إعلان اللغة الإنجليزية لعام 2016 لخوارزمية 2009:

“تسمح MatrixNet بإنشاء صيغة تصنيف طويلة ومعقدة للغاية، والتي تأخذ في الاعتبار عددًا كبيرًا من العوامل المختلفة ومجموعاتها.

ميزة أخرى مهمة في MatrixNet هي أنها تسمح بتخصيص صيغة تصنيف لفئة معينة من استعلامات البحث.

وبالمناسبة، فإن تعديل خوارزمية التصنيف، على سبيل المثال، لعمليات البحث عن الموسيقى، لن يؤدي إلى تقويض جودة التصنيف بالنسبة للأنواع الأخرى من الاستعلامات.

تشبه خوارزمية التصنيف الآلات المعقدة التي تحتوي على العشرات من الأزرار والمفاتيح والرافعات وأجهزة القياس. بشكل عام، أي دورة واحدة لأي مفتاح منفرد في آلية ما ستؤدي إلى تغيير شامل في الآلة بأكملها.

ومع ذلك، تسمح MatrixNet بضبط معلمات محددة لفئات محددة من الاستعلامات دون التسبب في إصلاح كبير للنظام بأكمله.

بالإضافة إلى ذلك، يمكن لـ MatrixNet اختيار الحساسية تلقائيًا لنطاقات محددة من عوامل التصنيف.

تقوم MatrixNet بعمل أكثر بكثير من RankBrain، ومن الواضح أنهما ليسا متماثلين.

ولكن الأمر الرائع في MatrixNet هو مدى ديناميكية عوامل التصنيف من حيث أنها تصنف استعلامات البحث وتطبق عوامل مختلفة عليها.

تتم الإشارة إلى MatrixNet في بعض وثائق عوامل التصنيف، لذا من المهم وضع MatrixNet في السياق الصحيح بحيث يتم عرض عوامل التصنيف في الضوء المناسب وتكون أكثر منطقية.

قد يكون من المفيد قراءة المزيد عن خوارزمية Yandex للمساعدة في فهم تسرب Yandex.

يقرأ: الذكاء الاصطناعي وخوارزميات التعلم الآلي من ياندكس

تتوافق بعض عوامل Yandex مع ممارسات تحسين محركات البحث (SEO).

دومينيك وودمان (@dom_woodman) لديه بعض الملاحظات المثيرة للاهتمام حول التسرب.

تتزامن بعض عوامل التصنيف المسربة مع بعض ممارسات تحسين محركات البحث مثل تغيير نص الرابط:

قم بتغيير النص الأساسي الخاص بك يا عزيزي!

4/س pic.twitter.com/qSGH4xF5UQ

– دومينيك وودمان (@dom_woodman) 27 يناير 2023

أليكس بوراكس (@alex_buraks) وقد نشرت ميجا Twitter موضوع حول الموضوع الذي له أصداء لممارسات تحسين محركات البحث.

أحد هذه العوامل التي أبرزها Alex يتعلق بتحسين الروابط الداخلية لتقليل عمق الزحف للصفحات المهمة.

لقد شجع جون مولر من Google الناشرين منذ فترة طويلة على التأكد من ارتباط الصفحات المهمة بشكل بارز بها.

لا يشجع مولر على دفن الصفحات المهمة في عمق بنية الموقع.

شارك جون مولر في عام 2020:

“لذا فإن ما سيحدث هو أننا سنرى أن الصفحة الرئيسية مهمة حقًا، وأن الأشياء المرتبطة بالصفحة الرئيسية مهمة أيضًا بشكل عام.

وبعد ذلك… بينما نبتعد عن الصفحة الرئيسية، سنعتقد أن هذا على الأرجح أقل أهمية.”

من المهم إبقاء الصفحات المهمة قريبة من الصفحات الرئيسية التي يدخل إليها زوار الموقع.

لذا، إذا كانت الروابط تشير إلى الصفحة الرئيسية، فسيتم النظر إلى الصفحات المرتبطة من الصفحة الرئيسية على أنها أكثر أهمية.

لم يقل جون مولر أن عمق الزحف هو عامل التصنيف. لقد قال ببساطة إنها تشير إلى Google بالصفحات المهمة.

تستخدم قاعدة Yandex التي استشهد بها Alex عمق الزحف من الصفحة الرئيسية كقاعدة تصنيف.

#1 عمق الزحف هو عامل الترتيب.

اجعل صفحاتك المهمة أقرب إلى الصفحة الرئيسية:
– الصفحات العليا: نقرة واحدة من الصفحة الرئيسية
– الصفحات المهمة: <3 نقرات pic.twitter.com/BB1YPT9Egk

– أليكس بوراكس (@alex_buraks) 28 يناير 2023

من المنطقي اعتبار الصفحة الرئيسية بمثابة نقطة البداية ذات الأهمية ومن ثم حساب أهمية أقل كلما نقر الشخص بعيدًا عنها في عمق الموقع.

هناك أيضًا أوراق بحثية من Google تحتوي على أفكار مماثلة (نموذج سيرفر معقول، نموذج Random Surfer)، الذي قام بحساب احتمال وصول متصفح عشوائي إلى صفحة ويب معينة ببساطة عن طريق اتباع الروابط.

وجد Alex عاملاً يعطي الأولوية للصفحات الرئيسية المهمة:

#3 الروابط الخلفية من الصفحات الرئيسية أكثر أهمية من الصفحات الداخلية.

منطقي. pic.twitter.com/Mts9jHsRjE

– أليكس بوراكس (@alex_buraks) 28 يناير 2023

كانت القاعدة الأساسية لتحسين محركات البحث منذ فترة طويلة هي الاحتفاظ بالمحتوى المهم على بعد بضع نقرات فقط من الصفحة الرئيسية (أو من الصفحات الداخلية التي تجذب الروابط الواردة).

تحديث Yandex Vega… هل يتعلق بالخبرة والموثوقية؟

قامت Yandex بتحديث محرك البحث الخاص بها في عام 2019 بتحديث يسمى Vega.

يتميز تحديث Yandex Vega بشبكات عصبية تم تدريبها على يد خبراء في الموضوع.

كان الهدف من تحديث 2019 هذا هو تقديم نتائج البحث بصفحات متخصصة وموثوقة.

لكن مسوقي البحث الذين يبحثون في المستندات لم يعثروا بعد على أي شيء يرتبط بأشياء مثل السيرة الذاتية للمؤلف، والتي يعتقد البعض أنها مرتبطة بالخبرة والمرجعية التي تبحث عنها جوجل.

تعلم، تعلم، تعلم

نحن في الأيام الأولى للتسرب وأظن أنه سيؤدي إلى فهم أكبر لكيفية عمل محركات البحث بشكل عام.