الأخبار التكنولوجية والاستعراضات والنصائح!

نسبة النقر إلى الظهور كعامل تصنيف: 4 أوراق بحثية تحتاج إلى قراءتها

ستساعدك المقالة التالية: نسبة النقر إلى الظهور كعامل تصنيف: 4 أوراق بحثية تحتاج إلى قراءتها

كانت هناك العديد من المناقشات حول نسبة النقر إلى الظهور (CTR) والتصنيفات. يقول البعض أن نسبة النقر إلى الظهور هي عامل تصنيف، بينما يصر آخرون على أنها جزء من التعلم الآلي ومراقبة الجودة. تدعي مجموعة ثالثة أنهم الثلاثة بالإضافة إلى كيس من رقائق البطاطس.

بغض النظر عن المعسكر الذي ستنصب فيه خيمتك، إليك أربع أوراق بحثية أعتقد أنها مفيدة لفهم دور نسبة النقر إلى الظهور في تصنيفات محركات البحث وتحسين محركات البحث.

ثورستن يواكيمز ودراسة نسبة النقر إلى الظهور

Thorsten Joachims هو باحث مرتبط بجامعة كورنيل. وقد أنتج العديد من الأوراق البحثية المؤثرة، من بينها بحث حول استخدام نسبة النقر إلى الظهور (CTR) لأغراض خوارزميات محركات البحث. تحقق من له صفحة الباحث العلمي من جوجل الذي يستشهد بجميع الأبحاث التي أجراها حول هذا الموضوع.

إذا كنت تريد التعرف على كيفية استخدام محركات البحث لنسبة النقر إلى الظهور، فهذا هو الشخص الذي يجب أن تبدأ معه.

إذا كنت مهتمًا بفهم الأدوار المحتملة لنسبة النقر إلى الظهور في محركات البحث، فإن هذه الأوراق البحثية الأربعة التي كتبها يواكيمز ستكون مفيدة.

1. تحسين محركات البحث بنسبة النقر إلى الظهور

تحسين محركات البحث باستخدام بيانات النقر(PDF) هي ورقة بحثية من عام 2002. قدمت هذه الورقة البحثية مفهوم استخدام بيانات نسبة النقر إلى الظهور كمؤشرات لمدى صلة روابط نتائج البحث واستخدام تلك المعلومات لتصنيف صفحات الويب بشكل أفضل.

يُظهر كون هذه الورقة البحثية تعود إلى عام 2002 مدى قدم البحث في نسبة النقر إلى الظهور. تعد دراسة نسبة النقر إلى الظهور للحصول على معلومات ذات صلة مجالًا ناضجًا للبحث. لقد تقدمت الأبحاث المتعلقة بمحركات البحث إلى ما هو أبعد من هذا المجال.

ومع ذلك، من المهم فهم كيفية استخدام نسبة النقر إلى الظهور فعليًا. توفر هذه المعرفة أساسًا للفهم. بمجرد أن يكون لديك أساس من الفهم، ستكون أقل عرضة للخداع من خلال التكهنات التي لا أساس لها حول نسب النقر إلى الظهور ودورها في تصنيف صفحات الويب.

وإليك ما تنص عليه الورقة البحثية:

“الهدف من هذه الورقة هو تطوير طريقة تستخدم بيانات النقر للتدريب، وهي سجل الاستعلام لمحرك البحث فيما يتعلق بسجل الروابط التي نقر عليها المستخدمون في التصنيف المقدم.

…الفكرة الرئيسية هي أن بيانات النقر هذه يمكن أن توفر بيانات تدريب في شكل تفضيلات نسبية.

في رأيي، تعترف هذه الورقة بالقيود في الخوارزمية. تقتصر الخوارزميات على معرفة أي من الروابط العشرة الأكثر صلة بالموضوع. لكنه لا يتعلم شيئًا عن صفحات الويب في الصفحات الثانية والثالثة أو الرابعة من صفحات نتائج محرك البحث (SERPs).

وهذا ما تلاحظه الورقة البحثية:

“… هناك اعتماد بين الروابط المقدمة للمستخدم، وتلك التي يتلقى النظام تعليقات بشأنها.”

منذ بداية بحث نسبة النقر إلى الظهور، كان من المفهوم أن بيانات نسبة النقر إلى الظهور من أعلى 10 من نتائج SERP كانت ذات قيمة محدودة ولكنها مهمة. تشير الورقة البحثية أيضًا إلى أن استخدام هذا النوع من الخوارزميات كان مفتوحًا أمام البريد العشوائي وأنه يجب اتخاذ الخطوات اللازمة لجعله محصنًا ضد البريد العشوائي.

وهذا ما لاحظه ثورستن يواكيمز:

“..قد يكون من الممكن أيضًا استكشاف الآليات التي تجعل الخوارزمية قوية ضد “البريد العشوائي”. ليس من الواضح حاليًا إلى أي مدى يمكن لمستخدم واحد التأثير بشكل ضار على وظيفة التصنيف من خلال النقر المتكرر على روابط معينة.

هذه معلومات مهمة لأنها توضح أنه حتى في عام 2002 كان الباحثون يفكرون في كيفية منع النقرات غير المرغوب فيها. ما يعنيه هذا هو أن النصيحة بالنقر فوق القائمة الخاصة بالشخص للتصويت لصالح مواقعه الخاصة ربما لا تعمل.

2. مفهوم نسبة النقر إلى الظهور باعتبارها ردود فعل متحيزة

هذه الورقة التي كتبها مع باحث من جامعة ستانفورد بعنوان، تفسير بيانات النقر بدقة باعتبارها تعليقات ضمنية – 2005 (بي دي إف) . تعد هذه ورقة بحثية مهمة لأنها تقدم مفهومًا مفاده أن بيانات نسبة النقر إلى الظهور قد لا تكون موثوقة إلى هذا الحد.

إليك كيفية تعبير ورقة بحث نسبة النقر إلى الظهور عن فكرة أن بيانات نسبة النقر إلى الظهور مزعجة:

“تبحث هذه الورقة في مدى موثوقية التعليقات الضمنية الناتجة عن بيانات النقر في بحث WWW. من خلال تحليل عملية اتخاذ القرار لدى المستخدمين باستخدام تتبع العين ومقارنة التعليقات الضمنية مع الأحكام اليدوية ذات الصلة، نستنتج أن النقرات مفيدة ولكنها متحيزة. وفي حين أن هذا يجعل تفسير النقرات كأحكام ذات صلة مطلقة أمرًا صعبًا، إلا أننا نظهر أن التفضيلات النسبية المستمدة من النقرات دقيقة إلى حد معقول في المتوسط.

تهتم هذه الورقة بفهم الروابط التي قام المستخدمون بمسحها ضوئيًا، إذا قام المستخدمون بمسحها من الأعلى إلى الأسفل، وما هي الروابط التي يظل المستخدمون عالقين فيها قبل النقر عليها وكيف يؤثر العنوان والوصف التعريفي في SERPs على قرارات المستخدم بالنقر فوق رابط واحد فوق الآخر. وهذا هو تأثير العنوان والوصف التعريفي على سلوك المستخدمين، وهو التحيز الذي اكتشفته هذه الورقة البحثية.

ومع ذلك، كانت الورقة متفائلة بأنه نظرًا لوجود كمية كبيرة من البيانات التي سيتم استخراجها، يمكن تطبيق التعلم الآلي من أجل الوصول إلى تحديدات دقيقة حول الروابط الأكثر أهمية من الروابط الأخرى.

توصلت الورقة البحثية حول نسبة النقر إلى الظهور إلى هذا الاستنتاج:

“تشير نتائجنا إلى أن قرارات النقر التي يتخذها المستخدم تتأثر بأهمية النتائج، ولكنها متحيزة بسبب الثقة التي يتمتع بها في وظيفة الاسترجاع، والجودة الشاملة لمجموعة النتائج. وهذا يجعل من الصعب تفسير النقرات على أنها تعليقات مطلقة.

ومع ذلك، فإننا ندرس العديد من الاستراتيجيات لتوليد إشارات ردود الفعل النسبية من النقرات، والتي تبين أنها تتوافق بشكل جيد مع الأحكام الصريحة. …حقيقة أن التعليقات الضمنية من النقرات متاحة بسهولة بكميات غير محدودة تقريبًا قد تتغلب على فجوة الجودة هذه، إذا تم تفسير التعليقات الضمنية بشكل صحيح باستخدام أساليب التعلم الآلي…”

أعتقد أنه من المهم ملاحظة أن هذه الورقة البحثية لا تهتم بالعثور على البريد العشوائي أو بإيجاد مواقع منخفضة الجودة لاستبعادها. إنها ببساطة تهتم بالعثور على المواقع ذات الصلة التي ترضي المستخدمين.

3. التعلم الآلي ومحاكاة نسبة النقر إلى الظهور

أما الورقة البحثية الثالثة فهي أيضاً من عام 2005. وهذه الورقة بعنوان: تقييم قوة التعلم من ردود الفعل الضمنية . الهدف من هذه الورقة هو فهم متى تكون بيانات نسبة النقر إلى الظهور مفيدة ومتى تكون بيانات نسبة النقر إلى الظهور متحيزة وأقل فائدة.

هكذا صاغت الورقة المشكلة والحل:

“… تميل هذه البيانات إلى أن تكون صاخبة ومتحيزة… في هذه الورقة، ندرس طريقة للتعلم من الملاحظات الضمنية واستخدام النمذجة لفهم متى تكون فعالة.”

تعتبر هذه الورقة مثيرة للاهتمام بشكل خاص لأنها تقدم إمكانية نمذجة سلوك المستخدم واستخدام تلك البيانات بدلاً من سلوك المستخدم الفعلي. تشير هذه الورقة أيضًا إلى التعلم المعزز، وهو التعلم الآلي.

هنا رابط ل مقدمة للتعلم المعزز. ويستخدم مثال طفل يتعلم أن النار جيدة لأنها تبعث الحرارة. لكن علم لاحقًا أن النار سيئة إذا اقتربت منها.

وهكذا عرضت الورقة البحثية:

“يتطلب هذا النوع من التعلم التفاعلي إما تشغيل أنظمة مع مستخدمين حقيقيين، أو إنشاء عمليات محاكاة لتقييم أداء الخوارزمية.

البديل، الذي غالبًا ما يستخدم في التعلم المعزز، هو بناء بيئة محاكاة. ومن الواضح أن هذا له عيب أنه مجرد محاكاة، ولكن له أيضًا مزايا كبيرة. فهو يسمح باختبار الخوارزميات بشكل أسرع من الاعتماد على مشاركة المستخدم. كما يسمح باستكشاف معلمات سلوك المستخدم. على وجه الخصوص، يمكننا استخدام نموذج لاستكشاف مدى قوة خوارزمية التعلم للتشويش في بيانات التدريب.

هذا حقا رائع. إنه يوضح كيف يمكن لمحرك البحث استخدام التعلم الآلي لفهم سلوك المستخدم ثم تدريب الخوارزمية بدون بيانات نسبة النقر إلى الظهور الفعلية ولكن باستخدام نسبة النقر إلى الظهور المحاكاة.

وهذا يعني أن محرك البحث يمكنه نظريًا وضع نموذج لسلوك المستخدم على صفحات الويب حتى لو لم يتم تصنيف تلك الصفحات في الصفحة الأولى من SERPs. وهذا يتغلب على القيود التي لوحظت في البحث الذي أجري في عام 2002.

4. نية المستخدم ونسبة النقر إلى الظهور – 2008

الورقة البحثية النهائية التي أريد أن أقدمها لكم هي، تعلم التصنيفات المتنوعة مع قطاع الطرق متعددي الأسلحة (بي دي إف). لا تستخدم هذه الورقة البحثية هذه العبارة. ويستخدم العبارة، .

تركز هذه الورقة على أهمية إظهار النتائج التي ترضي معظم المستخدمين. وإرضاء أكبر عدد من المستخدمين يعني فهم النقرات التي تؤدي إلى أقل قدر من النقرات للعودة إلى محرك البحث، وهو ما يُعرف أيضًا بالتخلي.

إن إرضاء جميع المستخدمين يعني عرض أنواع مختلفة من صفحات الويب. تختلف نية المستخدم للعديد من استعلامات البحث.

ما هو مناسب لمستخدم واحد هو أقل صلة بمستخدم آخر. وبالتالي، من المهم إظهار نتائج بحث متنوعة، وليس نفس النوع من الإجابات عشر مرات.

إليك ما تقوله الورقة حول عرض أنواع متعددة من النتائج:

… أظهرت دراسات المستخدمين أن التنوع في الرتب العليا غالبًا ما يكون مفضلاً. نقدم خوارزميتين للتعلم عبر الإنترنت تتعلمان بشكل مباشر تصنيفًا متنوعًا للمستندات استنادًا إلى سلوك النقر لدى المستخدمين. لقد أظهرنا أن هذه الخوارزميات تقلل من نسبة التخلي، أو بدلاً من ذلك، تزيد من احتمالية العثور على مستند ذي صلة في أعلى المواضع k في التصنيف.

وهذا ما تقوله الصحف عن رضا المستخدمين:

“…لقد أخذت الخوارزميات السابقة لتعلم التصنيف أهمية كل مستند بشكل مستقل عن المستندات الأخرى. في الواقع، أظهرت الأبحاث الحديثة أن هذه التدابير لا ترتبط بالضرورة برضا المستخدمين…”

وإليكم الجزء الذي يوضح المشكلة التي حلتها محركات البحث اليوم:

“… غالبًا ما يكون لاستعلامات الويب معانٍ مختلفة باختلاف المستخدمين… مما يشير إلى أن التصنيف الذي يشتمل على مستندات متنوعة قد يكون أفضل.”

الجانب السلبي الوحيد لهذا النوع من خوارزمية نسبة النقر إلى الظهور لتحديد رضا المستخدم هو أنه قد لا يعمل بشكل جيد مع المواضيع التي يكون فيها ما يريده المستخدمون في حالة تغيير.

“نتوقع أن تؤدي مثل هذه الخوارزمية أفضل أداء عندما يكون عدد قليل من المستندات عرضة لتحولات جذرية في شعبيتها. “

اقرأ بحث نسبة النقر إلى الظهور

وهناك لديك. هذه، في رأيي، أربع أوراق بحثية مهمة يجب قراءتها قبل تكوين رأي حول دور نسبة النقر إلى الظهور (CTR) في تصنيف صفحات الويب.

من المهم ملاحظة أن أول ورقة بحثية تم الاستشهاد بها في هذه المقالة تعود إلى عام 2002. أما الورقة البحثية الأخيرة فهي من عام 2008. وهذا يعطي فكرة عن مدى نضج البحث في نسبة النقر إلى الظهور. لم تعد معظم الأبحاث اليوم تركز على نسبة النقر إلى الظهور. ويركز على الذكاء الاصطناعي.

ومع ذلك، إذا كنت مهتمًا ببيانات نسبة النقر إلى الظهور وكيف يمكن أن تلعب دورًا في التصنيف، فسوف تستفيد من قراءة هذه الأوراق البحثية الأربعة.