الأخبار التكنولوجية والاستعراضات والنصائح!

ربط خوارزميات ترتيب المسافة

ستساعدك المقالة التالية: ربط خوارزميات ترتيب المسافة

هناك نوع من خوارزمية الارتباط التي لم تتم مناقشتها على نطاق واسع، ولكنها ليست كافية تقريبًا. تهدف هذه المقالة إلى تقديم مقدمة لخوارزميات تصنيف المسافة والارتباط. إنه شيء قد يلعب دورًا في كيفية تصنيف المواقع. في رأيي أنه من المهم أن تكون على علم بهذا.

هل تستخدم جوجل هذا؟

في حين أن الخوارزمية قيد النظر هي من براءة اختراع قدمتها شركة جوجل، إلا أن البيان الرسمي لشركة جوجل حول براءات الاختراع والأوراق البحثية هو أنها تنتج الكثير منها وأنها لا تستخدم كلها وأحيانا يتم استخدامها بطريقة مختلفة عن ما هو موصوف.

ومع ذلك، يبدو أن تفاصيل هذه الخوارزمية تشبه الخطوط العريضة لما قالته Google رسميًا حول كيفية تعاملها مع الروابط.

تعقيد الحسابات

هناك قسمين لبراءة الاختراع () التي توضح مدى تعقيد الحسابات:

“لسوء الحظ، يتطلب هذا الاختلاف في نظام PageRank حل النظام بأكمله لكل بذرة على حدة. وبالتالي، مع زيادة عدد الصفحات الأولية، يزداد تعقيد الحساب خطيًا، مما يحد من عدد البذور التي يمكن استخدامها عمليًا.

ومن ثم فإن المطلوب هو طريقة وجهاز لإنتاج تصنيف لصفحات الويب باستخدام عدد كبير من الصفحات الأولية المتنوعة…”

يشير ما سبق إلى صعوبة إجراء هذه الحسابات على نطاق واسع على شبكة الإنترنت بسبب العدد الكبير من نقاط البيانات. تنص على أنه من الأسهل حساب الحسابات بتقسيمها حسب مجالات الموضوع.

الأمر المثير للاهتمام في هذا البيان هو أن خوارزمية Penguin الأصلية تم حسابها مرة واحدة في السنة أو أكثر. المواقع التي تمت معاقبتها إلى حد كبير ظلت معاقبًا حتى التاريخ التالي الذي يبدو عشوائيًا حيث قامت Google بإعادة حساب نتيجة Penguin.

عند نقطة معينة، لا بد أن البنية التحتية لشركة Google قد تحسنت. تعمل Google باستمرار على بناء البنية التحتية الخاصة بها ولكن من الواضح أنها لا تعلن عن ذلك. ال نظام فهرسة الويب للكافيين هو أحد الاستثناءات.

تم طرح Penguin في الوقت الحقيقي في خريف عام 2016.

ومن الجدير بالذكر أن هذه الحسابات صعبة. ويشير هذا إلى احتمال قيام جوجل بإجراء حسابات دورية للويب بالكامل، ثم تعيين درجات بناءً على المسافات من المواقع الموثوقة إلى بقية المواقع. وهكذا، تم إجراء عملية حسابية عملاقة واحدة في السنة.

لذا، عندما يتم حساب SERP عبر PageRank، يتم حساب درجات المسافة أيضًا. يبدو هذا مشابهًا إلى حد كبير للعملية التي نعرفها باسم خوارزمية البطريق.

“يقوم النظام بعد ذلك بتعيين أطوال الروابط بناءً على خصائص الروابط وخصائص الصفحات المرفقة بالروابط. يقوم النظام بعد ذلك بحساب أقصر المسافات من مجموعة الصفحات الأولية إلى كل صفحة في مجموعة الصفحات بناءً على أطوال الروابط بين الصفحات. بعد ذلك، يحدد النظام درجة التصنيف لكل صفحة في مجموعة الصفحات بناءً على أقصر المسافات المحسوبة.

ماذا يفعل النظام؟

يقوم النظام بإنشاء نتيجة تعتمد على أقصر مسافة بين المجموعة الأولية والصفحات المرتبة المقترحة. يتم استخدام النتيجة لترتيب هذه الصفحات.

لذلك فهو في الأساس عبارة عن تراكب أعلى درجة نظام ترتيب الصفحات للمساعدة في التخلص من الروابط التي تم التلاعب بها، استنادًا إلى النظرية القائلة بأن الروابط التي تم التلاعب بها سيكون لها بطبيعة الحال مسافة أطول من اتصالات الارتباط بين صفحة البريد العشوائي والمجموعة الموثوقة.

يمكن القول أن ترتيب صفحة الويب يتكون من ثلاث عمليات.

  • الفهرسة
  • تصنيف
  • تعديل الترتيب (عادةً ما يتعلق بالتخصيص)

هذا تخفيض كبير في عملية التصنيف. هناك الكثير مما يحدث.

ومن المثير للاهتمام أن عملية التصنيف عن بعد تحدث أثناء جزء التصنيف من العملية. في ظل هذه الخوارزمية، لا توجد فرصة لترتيب العبارات ذات المعنى ما لم تكن الصفحة مرتبطة بالمجموعة الأولية.

وهنا ما يقول:

“أحد الاختلافات المحتملة لنظام PageRank الذي من شأنه أن يقلل من تأثير هذه التقنيات هو تحديد عدد قليل من الصفحات “الموثوقة” (يشار إليها أيضًا باسم الصفحات الأولية) واكتشاف الصفحات الأخرى التي من المحتمل أن تكون جيدة عن طريق اتباع الروابط من الصفحات الموثوقة “.

يعد هذا تمييزًا مهمًا، وهو معرفة أي جزء من عملية التصنيف يتم فيه حساب مجموعة البذور لأنه يساعدنا في صياغة استراتيجية التصنيف الخاصة بنا.

وهذا يختلف عن شيء Yahoo TrustRank. تبين أن YTR متحيزة.

يمكن القول أن Majestic’s Topical TrustFlow هو نسخة محسنة، على غرار ورقة بحثية أظهرت أن استخدام مجموعة البذور التي يتم تنظيمها حسب المواضيع المتخصصة يكون أكثر دقة. أظهرت الأبحاث أيضًا أن تنظيم خوارزمية مجموعة البذور حسب الموضوع أفضل بعدة أوامر من عدم القيام بذلك.

وبالتالي، فمن المنطقي أن تقوم خوارزمية الترتيب عن بعد من Google أيضًا بتنظيم مجموعة البذور الخاصة بها حسب مجموعات المواضيع المتخصصة.

كما أفهم هذا، فإن براءة اختراع Google هذه تحسب المسافات بين مجموعة البذور وتعين درجات المسافة.

رسم بياني مخفض للارتباط

“في شكل مختلف من هذا التجسيد، تشكل الروابط المرتبطة بأقصر المسافات المحسوبة رسمًا بيانيًا مصغرًا.”

ما يعنيه هذا هو أن هناك خريطة للإنترنت تُعرف عمومًا باسم Link Graph، ثم هناك نسخة أصغر من الرسم البياني للارتباط الذي يتم ملؤه بصفحات الويب التي تم تصفية الصفحات غير المرغوب فيها. المواقع التي تحصل بشكل أساسي على روابط خارج الرسم البياني للارتباط المصغر قد لا تدخل إلى الداخل أبدًا. وبالتالي فإن الروابط القذرة لا تحظى بأي جذب.

ما هو الرسم البياني للارتباط المخفض؟

سأبقي هذا قصيرًا وحلوًا. رابط الوثيقة أدناه.

ما تحتاج حقًا إلى معرفته هو هذا الجزء:

“كان النجاح المبكر لخوارزميات التصنيف القائمة على الارتباط يعتمد على افتراض أن الروابط تشير ضمنًا إلى ميزة الصفحات المستهدفة. ومع ذلك، توجد اليوم العديد من الروابط لأغراض أخرى غير منح السلطة. تتسبب مثل هذه الروابط في حدوث تشويش في تحليل الارتباط وتضر بجودة استرجاعها.

ومن أجل توفير نتائج بحث عالية الجودة، من المهم اكتشافها وتقليل تأثيرها… وبمساعدة أحد المصنفين، يتم اكتشاف هذه الروابط المزعجة وإسقاطها. وبعد ذلك، يتم تنفيذ خوارزميات تحليل الارتباط على الرسم البياني للارتباط المصغر.

اقرأ هذه المقالة التي تشرح الرسوم البيانية للارتباط المخفض.

اقرأ ملف PDF هذا للمزيد معلومات حول الرسوم البيانية الارتباط المخفض.

إذا كنت تحصل على روابط من مواقع مثل المؤسسات الإخبارية، فقد يكون من العدل افتراض أنها موجودة داخل الرسم البياني للارتباط المصغر. لكن هل هم جزء من مجموعة البذور؟ ربما لا ينبغي لنا أن نستحوذ على ذلك.

هل هذا هو السبب وراء عدم وجود مُحسّنات محرّكات البحث السلبية في Google؟

“…الروابط المرتبطة بأقصر المسافات المحسوبة تشكل رسمًا بيانيًا مخفضًا”

يختلف الرسم البياني للارتباط المخفض عن الرسم البياني للارتباط. يمكن القول أن الرسم البياني للارتباط هو خريطة للإنترنت بالكامل منظمة من خلال علاقات الارتباط بين المواقع أو الصفحات أو حتى أجزاء من الصفحات.

ثم هناك رسم بياني مصغر للارتباط، وهو عبارة عن خريطة لكل شيء باستثناء مواقع معينة لا تستوفي معايير محددة.

يمكن أن يكون الرسم البياني للارتباط المصغر عبارة عن خريطة للويب مطروحًا منها المواقع غير العشوائية. لن يكون للمواقع الموجودة خارج الرسم البياني للارتباط المصغر أي تأثير على المواقع الموجودة داخل الرسم البياني للارتباط، لأنها موجودة في الخارج.

ربما يكون هذا هو السبب وراء عدم تسبب موقع البريد العشوائي الذي يرتبط بموقع عادي في حدوث تأثير سلبي على موقع غير بريد عشوائي. ونظرًا لأن موقع البريد العشوائي يقع خارج الرسم البياني للارتباط المخفض، فليس له أي تأثير على الإطلاق. يتم تجاهل الارتباط.

هل يمكن أن يكون هذا هو السبب وراء ثقة Google الشديدة في اكتشاف الروابط غير المرغوب فيها وأن تحسين محركات البحث السلبي غير موجود؟

المسافة من مجموعة البذور تساوي قوة تصنيف أقل؟

لا أعتقد أنه من الضروري محاولة تحديد مجموعة البذور. الأهم من ذلك، في رأيي، هو أن تكون على دراية بالأحياء المحلية ومدى ارتباط ذلك بالمكان الذي تحصل فيه على روابطك.

في وقت من الأوقات، اعتاد Google على عرض نقاط تصنيف الصفحات لكل صفحة علنًا، حتى أتمكن من تذكر أنواع المواقع التي تميل إلى الحصول على درجات منخفضة. هناك فئة من المواقع ذات تصنيف صفحات منخفض وMoz DA منخفض، ولكنها مرتبطة بشكل وثيق بالمواقع التي في رأيي من المحتمل أن تكون على بعد بضع نقرات من المجموعة الأولية.

ما يقيسه Moz DA هو تقدير تقريبي لسلطة الموقع. إنها أداة جيدة. ومع ذلك، فإن ما يقيسه Moz DA قد لا يكون على مسافة من مجموعة البذور، وهو ما لا يمكن معرفته لأنه سر من أسرار Google.

لذلك أنا لا أتخلى عن أداة Moz DA، استمر في استخدامها. أنا فقط أقترح أنك قد ترغب في توسيع معاييرك وتعريف الرابط المفيد.

ماذا يعني أن تكون قريبًا من مجموعة البذور؟

من وثيقة الفصل الدراسي بجامعة ستانفورد، تتساءل الصفحة 17: ما هي فكرة القرب الجيدة؟ الإجابات هي:

  • اتصالات متعددة
  • جودة الاتصال
  • اتصالات مباشرة وغير مباشرة
  • الطول، الدرجة، الوزن

وهذا هو الاعتبار المثير للاهتمام.

يبعد

هناك العديد من الأشخاص الذين يشعرون بالقلق بشأن نسب النص الأساسي، وDA/PA للروابط الواردة، لكنني أعتقد أن هذه الاعتبارات قديمة إلى حد ما.

إن القلق بشأن DA/PA هو ارتداد إلى القلق بشأن الحصول على روابط من الصفحات ذات تصنيف الصفحات 4 أو أكثر، وهي ممارسة بدأت من درجة تصنيف الصفحات التي تم اختيارها عشوائيًا، وهي الرقم أربعة.

عندما نتحدث أو نفكر في كيفية النظر في الروابط في سياق التصنيف، فقد يكون من المفيد اعتبار التصنيف عن بعد جزءًا من تلك المحادثة.

اقرأ براءة الاختراع هنا
https://www.google.com/patents/US9165040