الأخبار التكنولوجية والاستعراضات والنصائح!

كيف يقوم Google بتحليل محتوى صفحة الويب ووزنه

ستساعدك المقالة التالية: كيف يقوم Google بتحليل محتوى صفحة الويب ووزنه

أوضح مارتن سبليت في ندوة Duda عبر الويب مفهومًا يسمى Centerpiece Annotation الذي يناقش كيفية تحليل Google للمحتوى على صفحة الويب.

لن أعيد طرح السؤال لأنه خارج الموضوع إلى حد ما وطويل.

ولكن ما يناقشه مارتن هو كيفية قيام Google بفصل النموذج المعياري لصفحة الويب ثم يلخص من بنية محتوى النص موضوع صفحة الويب.

يذكر ما يسمى بالتعليق التوضيحي المركزي.

وأوضح مارتن سبليت:

“نحن نقوم فقط بتحليل المحتوى، ولا أعرف ما قلناه علنًا حول هذا الأمر، لكنني أعتقد أنني طرحته في إحدى حلقات البودكاست.

لذلك ربما أستطيع أن أقول إن لدينا شيئًا يسمى التعليق التوضيحي المركزي، على سبيل المثال، وهناك بعض التعليقات التوضيحية الأخرى لدينا حيث ننظر إلى المحتوى الدلالي، بالإضافة إلى شجرة التخطيط المحتملة.

ولكن بشكل أساسي يمكننا قراءة ذلك من بنية المحتوى في HTML بالفعل ومعرفة ذلك “أوه! يبدو أن هذا من خلال كل عمليات معالجة اللغة الطبيعية التي قمنا بها على محتوى النص بأكمله الذي حصلنا عليه هنا، يبدو أن هذا يتعلق في المقام الأول بالموضوع أ، طعام الكلاب.

لقطة شاشة لمارتن سبليت وهو يناقش التعليق التوضيحي للقطعة المركزية

يتحدث مارتن التالي عن كيفية قيام تحليل الصفحة بفصل صفحة الويب إلى أجزاء مكونة، بعضها ليس له صلة بالقطعة المركزية.

ويوضح أن أجزاء الصفحة يتم وزنها بشكل مختلف. الترجيح هو إشارة إلى مدى أهمية عنصر الصفحة. لذا، إذا حصل القسم على درجة ترجيح خفيفة، فليس من المهم أن يتم ترجيحه بدرجة أعلى.

وتابع مارتن:

“ثم هناك هذا الشيء الآخر هنا، والذي يبدو وكأنه روابط لمنتجات ذات صلة ولكنه ليس في الحقيقة جزءًا من القطعة المركزية. إنه ليس المحتوى الرئيسي حقًا هنا. يبدو أن هذه أشياء إضافية.

وبعد ذلك هناك مجموعة من النموذج النموذجي أو، “مرحبًا، لقد اكتشفنا أن القائمة تبدو متشابهة إلى حد كبير في كل هذه الصفحات والقوائم. يبدو هذا مشابهًا إلى حد كبير لتلك القائمة الموجودة لدينا في جميع الصفحات الأخرى لهذا النطاق، على سبيل المثال، أو رأينا هذا من قبل. نحن لا ننتقل فعليًا حسب المجال أو نقول، “أوه، هذه تبدو كقائمة.”

نحن نكتشف ما يبدو وكأنه قالب معياري، ثم يتم وزنه بشكل مختلف أيضًا.

متعلق ب: 9 علامات HTML (و11 سمة) يجب أن تعرفها لتحسين محركات البحث

محتوى خارج الموضوع يحظى باهتمام أقل

يذكر مارتن بعد ذلك كيف أنه بعد قيام Google بتحديد موضوع صفحة الويب، إذا كان القسم خارج الموضوع، فلن يتم إعطاء هذا القسم خارج الموضوع نفس القدر من الاهتمام، على الأرجح لأغراض التصنيف.

يشرح مارتن:

“لذلك، إذا كان لديك محتوى على صفحة لا يرتبط بالموضوع الرئيسي لبقية المحتوى، فقد لا نعطيه نفس القدر من الاهتمام كما تعتقد.

ما زلنا نستخدم هذه المعلومات لاكتشاف الارتباط ومعرفة بنية موقعك وكل ذلك.

ولكن إذا كانت الصفحة تحتوي على 10000 كلمة عن طعام الكلاب ثم 3000 أو 2000 أو 1000 كلمة عن الدراجات، فمن المحتمل أن هذا ليس محتوى جيدًا للدراجات.

هذا مثير للاهتمام حقًا لأنه يبدو أنه يوضح أنه عندما يحدد Google موضوع الصفحة، فقد لا يحظى المحتوى خارج الموضوع بفرصة للتصنيف أو كما يقول مارتن، لا يتم منحه “أ”.

سأل جيسون بارنارد:

“يبدو لي وكأنك تخمن HTML5 الدلالي. هل يمنحك HTML5e الدلالي أي مساعدة أم أنك لا تهتم؟ ليس هناك داعي؟”

ما كان جيسون يشير إليه هو ترميز HTML5 الذي يحدد الأقسام المختلفة لصفحة الويب، مثل الرأس والتنقل والتذييل وما إلى ذلك.

في بداية مناقشة مارتن كان يشير إلى تحليل بنية المحتوى والنص الفعلي. إذن الموضوع الآن ينجرف قليلاً هنا إلى البنية الدلالية لـ HTML5.

أجاب مارتن:

“إنها تساعدنا، ولكنها ليست الشيء الوحيد الذي نبحث عنه. نعم.”

متعلق ب: تمت الإجابة على 3 أسئلة حول HTML والترميز

شرح القطعة المركزية

التعليق التوضيحي هو ملاحظة تشرح شيئًا ما. القطعة المركزية هي شيء يُقصد به أن يكون مركز الاهتمام.

يبدو أن التعليق التوضيحي المركزي يشبه ملخصًا لموضوع المحتوى الرئيسي.

يشرح مارتن كيف يقوم Google بتقسيم الصفحة إلى أقسام مختلفة ووزن الأجزاء الموجودة خارج التعليق التوضيحي المركزي بشكل مختلف.

ويذكر أيضًا كيف أن أجزاء الصفحة التي تختلف عن الموضوع الرئيسي لا تعطي الكثير من الاهتمام، وهو ما يعني على ما يبدو أنه قد لا يكون محتوى يمكن تصنيفه.

الاقتباس

ندوة Duda عبر الويب حول العرض الأساسي

شاهد مارتن سبليت وهو يشرح كيف يقوم Google بتحليل صفحة ويب عند علامة الدقيقة 28:42: