الأخبار التكنولوجية والاستعراضات والنصائح!

كيفية إقناع Google بفهرسة موقعك باستخدام تقرير التغطية

ستساعدك المقالة التالية: كيفية إقناع Google بفهرسة موقعك باستخدام تقرير التغطية

لا يمكنك أن تطلق على نفسك اسم SEO تقني إذا كنت لا تستخدم تقرير تغطية فهرس Google Search Console.

إنها أداة لا تقدر بثمن لفهم:

  • ما هي عناوين URL التي تم الزحف إليها وفهرستها بواسطة Google وتلك التي لم يتم الزحف إليها.
  • والأهم من ذلك، لماذا قام محرك البحث بهذا الاختيار بشأن عنوان URL.

التقرير يبدو من السهل نسبيًا اتباعه من خلال نظام ألوان إشارة المرور الخاص به.

  • أحمر (خطأ): قف! لا تتم فهرسة الصفحات.
  • أصفر (صالح مع تحذيرات): إذا كان لديك وقت فراغ، توقف، وإلا، اضغط على البنزين وانطلق! قد تتم فهرسة الصفحات.
  • أخضر (صالح): كل ​​شيء على ما يرام. تتم فهرسة الصفحات.

المشكلة هي أن هناك منطقة رمادية كبيرة (مستبعد).

وعندما تقرأ التفاصيل، يبدو أن قواعد الطريق مكتوبة بلغة أجنبية. جوجليش.

لذلك، سنقوم اليوم بترجمة أنواع الحالة في تقرير تغطية الفهرس إلى عناصر إجراءات تحسين محركات البحث التي يجب عليك اتخاذها لتحسين الفهرسة وزيادة الأداء العضوي.

هنا لانتهاك محدد؟ لا تتردد في استخدام الروابط السريعة:

التأثير على تحسين محركات البحث: معالجة هذه الجرائم كأولوية.

مزيد من التفكير مطلوب: قد تتطلب هذه الإجراءات أو لا تتطلب اتخاذ إجراء، اعتمادًا على استراتيجية تحسين محركات البحث لديك.

الوضع الطبيعي: لا رد فعل مطلوب.

المشكلات المؤثرة على تحسين محركات البحث (SEO) في تقرير تغطية الفهرس

لا تركز فقط على إصلاح الأخطاء فقط. غالبًا ما يتم دفن المكاسب الأكبر في تحسين محركات البحث (SEO) في المنطقة الرمادية المستبعدة.

فيما يلي مشكلات تقرير تغطية الفهرس التي تهم حقًا تحسين محركات البحث، وهي مدرجة حسب ترتيب الأولوية، حتى تعرف أين يجب أن تلفت انتباهك أولاً.

تم اكتشافه – غير مفهرس حاليًا

سبب: يكون عنوان URL معروفًا لـ Google، غالبًا عن طريق الروابط أو خريطة موقع XML، وهو موجود في قائمة انتظار الزحف، ولكن Googlebot لم يتمكن من الزحف إليه بعد. يشير هذا إلى وجود مشكلة في ميزانية الزحف.

كيف تصلحها: إذا كان الأمر مجرد عدد قليل من الصفحات، فقم بتشغيل الزحف يدويًا عن طريق إرسال عناوين URL في Google Search Console.

إذا كان هناك عدد كبير، فاستثمر الوقت في إصلاح طويل المدى لبنية موقع الويب (بما في ذلك بنية عنوان URL وتصنيف الموقع والربط الداخلي) لحل مشكلات ميزانية الزحف من مصدرها.

تم الزحف إليه – غير مفهرس حاليًا

سبب: قام Googlebot بالزحف إلى عنوان URL ووجد أن المحتوى لا يستحق تضمينه في الفهرس. ويرجع ذلك في أغلب الأحيان إلى مشكلات الجودة مثل المحتوى الرقيق أو المحتوى القديم أو صفحات المدخل أو البريد العشوائي الذي أنشأه المستخدم. إذا كان المحتوى جديرًا ولكن لم تتم فهرسته، فمن المحتمل أن تتعثر بسبب العرض.

كيف تصلحها: مراجعة محتوى الصفحة.

إذا فهمت سبب اعتبار Googlebot أن محتوى الصفحة ليس ذا قيمة كافية لفهرسته، فاطرح على نفسك سؤالًا ثانيًا. هل يجب أن تكون هذه الصفحة موجودة على موقع الويب الخاص بي؟

إذا كانت الإجابة لا، 301 أو 410 عنوان URL. إذا كانت الإجابة بنعم، أضف علامة noindex حتى تتمكن من حل مشكلة المحتوى. أو إذا كان عنوان URL يستند إلى معلمة، فيمكنك منع الزحف إلى الصفحة باستخدام أفضل ممارسات التعامل مع المعلمة.

إذا بدا أن المحتوى ذو جودة مقبولة، فتحقق مما يتم عرضه بدون JavaScript. يستطيع Google فهرسة المحتوى الذي تم إنشاؤه بواسطة JavaScript، ولكنها عملية أكثر تعقيدًا من HTML نظرًا لوجود موجتين من الفهرسة عندما يتعلق الأمر بجافا سكريبت.

تقوم الموجة الأولى بفهرسة الصفحة بناءً على HTML الأولي من الخادم. هذا ما تراه عند النقر بزر الماوس الأيمن وعرض مصدر الصفحة.

الفهارس الثانية تعتمد على DOM، والتي تتضمن كلاً من HTML وJavaScript المقدم من جانب العميل. هذا ما تراه عند النقر بزر الماوس الأيمن والفحص.

ويكمن التحدي في تأجيل الموجة الثانية من الفهرسة حتى تتوفر لدى Google موارد العرض المتاحة. وهذا يعني أن فهرسة المحتوى المعتمد على JavaScript تستغرق وقتًا أطول من محتوى HTML فقط. في أي مكان من أيام حتى بضعة أسابيع من وقت الزحف إليه.

لتجنب التأخير في الفهرسة، استخدم العرض من جانب الخادم بحيث يكون كل المحتوى الأساسي موجودًا في HTML الأولي. يجب أن يتضمن ذلك عناصر تحسين محركات البحث البطل مثل عناوين الصفحات والعناوين الأساسية والبيانات المنظمة وبالطبع المحتوى والروابط الرئيسية.

مكررة بدون الكنسي الذي حدده المستخدم

سبب: يعتبر Google الصفحة محتوى مكررًا، ولكن لم يتم وضع علامة عليها بعنوان أساسي واضح. قررت Google أن هذه الصفحة لا ينبغي أن تكون الصفحة الأساسية، وبالتالي استبعدتها من الفهرس.

كيف تصلحها: قم بوضع علامة صريحة على العنوان الأساسي الصحيح، باستخدام الروابط rel=canonical، لكل عنوان URL قابل للزحف على موقع الويب الخاص بك. يمكنك فهم الصفحة التي اختارها Google لتكون الصفحة الأساسية من خلال فحص عنوان URL في Google Search Console.

عنوان URL مكرر، ولم يتم تحديده باعتباره عنوان URL أساسيًا

سبب: كما هو مذكور أعلاه، باستثناء في هذه الحالة، لقد طلبت صراحةً فهرسة عنوان URL هذا، على سبيل المثال عن طريق إرساله في خريطة موقع XML الخاصة بك.

كيف تصلحها: قم بوضع علامة واضحة على العنوان الأساسي الصحيح، باستخدام الروابط rel=canonical، لكل عنوان URL قابل للزحف على موقع الويب الخاص بك وتأكد من تضمين الصفحات الأساسية فقط في خريطة موقع XML الخاصة بك.

مكرر، اختار Google عنوانًا أساسيًا مختلفًا عن المستخدم

سبب: تحتوي الصفحة على رابط rel=canonical، ولكن Google لا يوافق على هذا الاقتراح وقد اختار عنوان URL مختلفًا لفهرسته باعتباره الرابط الأساسي.

كيف تصلحها: افحص عنوان URL لرؤية عنوان URL الأساسي الذي حددته Google. إذا كنت تتفق مع Google، قم بتغيير الرابط rel=canonical. بخلاف ذلك، اعمل على بنية موقع الويب الخاص بك لتقليل كمية المحتوى المكرر وإرسال إشارات تصنيف أقوى إلى الصفحة التي ترغب في أن تكون الصفحة الأساسية.

لم يتم العثور على عنوان URL المقدم (404)

سبب: عنوان URL الذي أرسلته، على الأرجح عبر خريطة موقع XML، غير موجود.

كيف تصلحها: أنشئ عنوان URL أو قم بإزالته من خريطة موقع XML الخاصة بك. يمكنك تجنب هذا الخطأ بشكل منهجي باتباع أفضل الممارسات الخاصة بخرائط مواقع XML الديناميكية.

خطأ في إعادة التوجيه

سبب: واجه Googlebot مشكلة في عملية إعادة التوجيه. يحدث هذا غالبًا بسبب سلاسل إعادة التوجيه التي يبلغ طولها خمسة عناوين URL أو أكثر، أو حلقات إعادة التوجيه، أو عنوان URL فارغ، أو عنوان URL طويل للغاية.

كيف تصلحها: استخدم أداة تصحيح الأخطاء مثل Lighthouse أو أداة رمز الحالة مثل httpstatus.io لفهم سبب تعطيل عملية إعادة التوجيه وبالتالي كيفية معالجتها.

تأكد من أن عمليات إعادة التوجيه 301 تشير دائمًا مباشرةً إلى الوجهة النهائية، حتى لو كان ذلك يعني تعديل عمليات إعادة التوجيه القديمة.

خطأ في الخادم (5xx)

سبب: تعرض الخوادم رمز استجابة HTTP 500 (المعروف أيضًا باسم خطأ داخلي في الخادم) عندما يتعذر عليها تحميل الصفحة. يمكن أن يكون السبب في ذلك مشكلات أوسع نطاقًا في الخادم، ولكن في أغلب الأحيان يكون السبب هو انقطاع اتصال قصير بالخادم مما يمنع Googlebot من الزحف إلى الصفحة.

كيف تصلحها: إذا كان الأمر يتعلق بـ “مرة واحدة في القمر الأزرق”، فلا تقلق. سوف يختفي الخطأ من تلقاء نفسه بعد مرور بعض الوقت. إذا كانت الصفحة مهمة، فيمكنك استدعاء Googlebot إلى عنوان URL عن طريق طلب الفهرسة ضمن فحص عنوان URL. إذا كان الخطأ متكررًا، فتحدث مع مهندس النظام/القائد الفني/شركة الاستضافة لتحسين البنية التحتية للخادم.

الزحف الشذوذ

سبب: هناك شيء ما يمنع الزحف إلى عنوان URL، ولكن حتى Google لا يعرف ما هو بالضبط.

كيف تصلحها: قم بإحضار الصفحة باستخدام أداة فحص عنوان URL لمعرفة ما إذا تم إرجاع أي رموز استجابة على مستوى 4xx أو 5xx. إذا لم يقدم ذلك أية أدلة، فأرسل عناوين URL إلى فريق التطوير لديك.

مفهرسة، على الرغم من حظرها بواسطة Robots.Txt

سبب: فكر في ملف robots.txt باعتباره المعادل الرقمي لعلامة “ممنوع الدخول” الموجودة على باب مفتوح. وبينما يلتزم Googlebot بهذه التعليمات، فإنه يفعل ذلك وفقًا لنص القانون، وليس روحه.

لذلك قد تكون لديك صفحات غير مسموح بها على وجه التحديد في ملف robots.txt تظهر في نتائج البحث. لأنه إذا كانت الصفحة المحظورة تحتوي على إشارات تصنيف قوية أخرى، مثل الروابط، فقد يعتبرها Google ذات صلة بالفهرس.

على الرغم من عدم الزحف إلى الصفحة. ولكن نظرًا لأن محتوى عنوان URL هذا غير معروف لمحرك البحث Google، فإن نتيجة البحث تبدو على هذا النحو.

كيف تصلحها: لمنع ظهور صفحة ما في SERPs بشكل نهائي، لا تستخدم ملف robots.txt. تحتاج إلى استخدام علامة noindex أو منع الوصول المجهول إلى الصفحة باستخدام المصادقة.

اعلم أن عناوين URL التي تحتوي على علامة noindex سيتم أيضًا الزحف إليها بشكل أقل تكرارًا، وإذا كانت موجودة لفترة طويلة، فسيؤدي ذلك في النهاية إلى قيام Google بمتابعة روابط الصفحة أيضًا، مما يعني أنهم لن يضيفوا تلك الروابط إلى قائمة انتظار الزحف وإشارات التصنيف لن يتم تمريرها إلى الصفحات المرتبطة.

مزيد من التفكير مطلوب

تحدث العديد من مشكلات تقرير تغطية فهرس Google Search Console بسبب التوجيهات المتعارضة.

ليس الأمر أن أحدهما على حق والآخر على خطأ. كل ما عليك فعله هو أن تكون واضحًا بشأن هدفك وأن تتأكد من أن جميع إشارات الموقع تدعم هذا الهدف.

مفهرسة، لم يتم تقديمها في خريطة الموقع

سبب: تم اكتشاف عنوان URL بواسطة Google، على الأرجح من خلال رابط، وتم فهرسته. ولكن لم يتم تقديمه في خريطة موقع XML.

ما يجب القيام به: إذا كانت عناوين URL ذات صلة بتحسين محركات البحث، فأضفها إلى خريطة موقع XML الخاصة بك. سيضمن ذلك فهرسة سريعة للمحتوى الجديد أو تحديثات المحتوى الموجود.

بخلاف ذلك، فكر فيما إذا كنت تريد فهرسة عناوين URL. لا يتم تصنيف عناوين URL بناءً على مزاياها فقط. تؤثر كل صفحة مفهرسة بواسطة Google على كيفية تقييم خوارزميات الجودة لسمعة المجال.

غالبًا ما تكون فهرسة الصفحات، ولكن لم يتم إرسالها في خريطة الموقع، علامة على أن الموقع يعاني من تضخم الفهرس – حيث تم إدراج عدد كبير جدًا من الصفحات ذات القيمة المنخفضة في الفهرس.

يحدث هذا عادةً بسبب الصفحات التي يتم إنشاؤها تلقائيًا مثل مجموعات التصفية أو صفحات الأرشيف أو صفحات العلامات أو ملفات تعريف المستخدمين أو ترقيم الصفحات أو المعلمات المارقة. يؤدي تضخم الفهرس إلى الإضرار بقدرة النطاق على ترتيب جميع عناوين URL الخاصة به.

تم حظره بواسطة Robots.Txt

سبب: لن يقوم Googlebot بالزحف إلى عنوان URL لأنه محظور بواسطة ملف robots.txt. لكن هذا لا يعني أن الصفحة لن تتم فهرستها بواسطة Google. عندما تبدأ في رؤية التحذيرات “مفهرسة، على الرغم من حظرها بواسطة ملف robots.txt” ضمن تقرير تغطية الفهرس.

ما يجب القيام به: للتأكد من عدم فهرسة الصفحة بواسطة Google، قم بإزالة كتلة ملف robots.txt واستخدم توجيه noindex.

تم حظر عنوان URL المقدم بواسطة Robots.Txt

سبب: عنوان URL الذي أرسلته، على الأرجح عبر خريطة موقع XML، محظور أيضًا بواسطة ملف robots.txt الخاص بك.

ما يجب القيام به: قم إما بإزالة عنوان URL من خريطة موقع XML، إذا كنت لا ترغب في الزحف إليه وفهرسته، أو إزالة قاعدة الحظر من ملف robots.txt، إذا كنت تريد ذلك. إذا كنت تستخدم خدمة استضافة لا تسمح لك بتعديل هذا الملف، فقم بتغيير مضيفي الويب.

تم وضع علامة “Noindex” على عنوان URL المُرسل

سبب: تم وضع علامة noindex على عنوان URL الذي أرسلته، على الأرجح عبر خريطة موقع XML، إما عبر العلامات الوصفية لبرامج الروبوت أو في علامات X-Robots لرأس HTTP.

ما يجب القيام به: قم إما بإزالة عنوان URL من خريطة موقع XML، إذا كنت لا ترغب في الزحف إليه وفهرسته، أو قم بإزالة توجيه noindex، إذا كنت تريد ذلك.

عنوان URL المقدم يُرجع طلبًا غير مصرح به (401)

سبب: ليس مصرحًا لـ Google بالزحف إلى عنوان URL الذي أرسلته، مثل الصفحات المحمية بكلمة مرور.

ما يجب القيام به: إذا لم يكن هناك سبب لحماية المحتوى من الفهرسة، فقم بإزالة شرط التفويض. بخلاف ذلك، قم بإزالة عنوان URL من خريطة موقع XML.

يحتوي عنوان URL المقدم على مشكلة في الزحف

سبب: هناك شيء ما يسبب مشكلة في الزحف، ولكن حتى Google لا يمكنه وضع اسم له.

ما يجب القيام به: حاول تصحيح أخطاء الصفحة باستخدام أداة فحص عنوان URL. تحقق من أوقات تحميل الصفحة والموارد المحظورة وما إذا كان هناك أي كود JavaScript لا داعي له.

إذا لم يؤدي ذلك إلى نتائج مفيدة، فالجأ إلى الطريقة القديمة لتحميل عنوان URL على هاتفك المحمول وشاهد ما يحدث على الصفحة وفي الكود.

يبدو أن عنوان URL المقدم هو Soft 404

سبب: اعتبر Google أن عنوان URL الذي أرسلته، على الأرجح عبر خريطة موقع XML، هو soft 404 – أي أن الخادم يستجيب برمز نجاح 200 لكن الصفحة:

  • غير موجود.
  • يحتوي على محتوى قليل أو لا يحتوي على أي محتوى (المعروف أيضًا باسم المحتوى الرقيق)، مثل صفحات الفئات الشاغرة.
  • يحتوي على عملية إعادة توجيه مطبقة إلى عنوان URL مقصود غير ذي صلة، مثل الصفحة الرئيسية.

ما يجب القيام به: إذا كانت الصفحة غير موجودة بالفعل وتمت إزالتها عمدًا، فقم بإرجاع 410 لإلغاء الفهرسة بشكل أسرع. تأكد من عرض صفحة “لم يتم العثور عليها” المخصصة للمستخدم. ما لم يكن هناك محتوى مشابه على عنوان URL آخر، ففي هذه الحالة قم بتنفيذ إعادة التوجيه 301 لتمرير إشارات التصنيف.

إذا بدت الصفحة تحتوي على قدر كبير من المحتوى، فتأكد من قدرة Google على عرض كل هذا المحتوى. إذا كانت تعاني حقًا من محتوى رقيق، وإذا لم يكن للصفحة سبب لوجودها، 410 أو 301، إذا كان الأمر كذلك، فقم بإزالتها من خريطة موقع XML الخاصة بك حتى لا تلفت انتباه Google، وأضف علامة noindex واعمل على فترة أطول -مصطلح الحل لتعزيز الصفحة بمحتوى قيم.

إذا كانت هناك عملية إعادة توجيه معمول بها إلى صفحة غير ذات صلة، فقم بتغييرها إلى صفحة ذات صلة، أو إذا لم يكن ذلك ممكنًا، إلى 410.

لينة 404

سبب: نفس ما ورد أعلاه، لكنك لم تطلب فهرسة الصفحة على وجه التحديد.

ما يجب القيام به: كما هو مذكور أعلاه، قم إما بإظهار المزيد من المحتوى لـ Google، 301 أو 410 حسب الاقتضاء.

الأوضاع الطبيعية في تقرير تغطية الفهرس

ليس الهدف هو فهرسة كل عنوان URL لموقعك، والذي يُعرف أيضًا باسم الصالح، على الرغم من أن الرقم يجب أن يرتفع بشكل مطرد مع نمو موقعك.

الهدف هو فهرسة الإصدار الأساسي من الصفحات ذات الصلة بتحسين محركات البحث.

ليس من الطبيعي فحسب، بل إنه من المفيد أيضًا أن يتم تصنيف عدد من الصفحات على أنها مستبعدة في تقرير تغطية الفهرس، ولكن من المفيد أيضًا أن يتم تصنيف عدد من الصفحات على أنها مستبعدة.

يوضح هذا أنك تدرك أن Google حكمت على سمعة نطاقك استنادًا إلى جميع الصفحات المفهرسة واتخذت الإجراءات المناسبة لاستبعاد الصفحات التي يجب أن تكون موجودة على موقع الويب الخاص بك، ولكن لا يلزم أن تؤخذ في الاعتبار في طريقة عرض Google للمحتوى الخاص بك.

المقدمة والمفهرسة

سبب: لقد قمت بإرسال الصفحة عن طريق خريطة موقع XML أو واجهة برمجة التطبيقات (API) أو يدويًا داخل Google Search Console وقام Google بفهرستها.

لا حاجة للإصلاح: إلا إذا كنت لا تريد أن تكون عناوين URL هذه في الفهرس.

صفحة بديلة مع العلامة الأساسية المناسبة

سبب: نجح Google في معالجة العلامة rel=canonical.

لا حاجة للإصلاح: تشير الصفحة بالفعل بشكل صحيح إلى عنوانها الأساسي. لا يوجد شيء آخر للقيام به.

تم الاستبعاد بواسطة علامة “Noindex”.

سبب: قام Google بالزحف إلى الصفحة واحترم علامة noindex.

لا حاجة للإصلاح: ما لم تكن تريد أن تكون عناوين URL هذه في الفهرس، وفي هذه الحالة، قم بإزالة توجيه noindex.

الصفحة مع إعادة التوجيه

سبب: تم الزحف إلى إعادة التوجيه 301 أو 302 بنجاح بواسطة Google. تمت إضافة عنوان URL المقصود إلى قائمة انتظار الزحف وتمت إزالة عنوان URL الأصلي من الفهرس.

سيتم تمرير إشارات الترتيب بدون تخفيف بمجرد زحف Google إلى عنوان URL المقصود والتأكد من أن عنوان URL المقصود يحتوي على محتوى مشابه.

لا حاجة للإصلاح: سوف ينخفض ​​هذا الاستبعاد بشكل طبيعي بمرور الوقت أثناء معالجة عمليات إعادة التوجيه.

لم يتم العثور عليه (404)

سبب: اكتشف Google عنوان URL بطريقة أخرى غير خريطة موقع XML، مثل رابط من موقع ويب آخر. عندما تم الزحف إليها، عرضت الصفحة رمز الحالة 404. ونتيجة لذلك، سيزحف Googlebot إلى عنوان URL بشكل أقل تكرارًا مع مرور الوقت.

لا حاجة للإصلاح: إذا كانت الصفحة غير موجودة حقًا بسبب إزالتها عمدًا، فلا حرج في إعادة 404. لا توجد عقوبة من Google مقابل تجميع رموز 404. هذه أسطورة.

ولكن هذا لا يعني أنها دائمًا أفضل الممارسات. إذا كان عنوان URL يحتوي على أي إشارات تصنيف، فسيتم فقدانها في الفراغ 404. لذا، إذا كانت لديك صفحة أخرى ذات محتوى مشابه، ففكر في التغيير إلى إعادة التوجيه 301.

تم حظره بواسطة أداة إزالة الصفحة

سبب: تم إرسال طلب إزالة عنوان URL داخل Google Search Console.

لا حاجة للإصلاح: ستنتهي صلاحية طلب الإزالة بشكل طبيعي بعد 90 يومًا. وبعد هذه الفترة، قد يقوم Google بإعادة فهرسة الصفحة.

لتلخيص

وبشكل عام الوقاية خير من العلاج. غالبًا ما تؤدي بنية موقع الويب المدروسة جيدًا والتعامل مع الروبوتات إلى تقرير تغطية فهرس Google Search Console نظيف وواضح.

ولكن بما أن معظمنا يرث عمل الآخرين، بدلاً من البناء من الصفر، فهو أداة لا تقدر بثمن لمساعدتك على تركيز الاهتمام حيث تشتد الحاجة إليه.

تأكد من مراجعة التقرير كل شهر لمراقبة تقدم Google في الزحف إلى موقعك وفهرسته وتوثيق تأثير تغييرات تحسين محركات البحث.

المزيد من الموارد: