الأخبار التكنولوجية والاستعراضات والنصائح!

المشكلات الخمسة الأكثر شيوعًا في فهرسة Google حسب حجم موقع الويب

ستساعدك المقالة التالية: المشكلات الخمسة الأكثر شيوعًا في فهرسة Google حسب حجم موقع الويب

جوجل منفتحة بشأن حقيقة ذلك لا يقوم بفهرسة جميع الصفحات التي يمكنه العثور عليها. باستخدام Google Search Console، يمكنك رؤية الصفحات التي لم تتم فهرستها على موقع الويب الخاص بك.

توفر لك Google Search Console أيضًا معلومات مفيدة حول المشكلة المحددة التي حالت دون فهرسة الصفحة.

تتضمن هذه المشكلات أخطاء الخادم و404 وتلميحات بأن الصفحة قد تحتوي على محتوى رقيق أو مكرر.

لكننا لا نستطيع أبدًا رؤية أي بيانات توضح المشكلات الأكثر شيوعًا عبر الويب بالكامل.

لذلك… قررت جمع البيانات والإحصائيات بنفسي!

في هذه المقالة، سنستكشف مشكلات الفهرسة الأكثر شيوعًا والتي تمنع صفحاتك من الظهور في بحث Google.

الفهرسة 101

الفهرسة تشبه بناء مكتبة، لكن بدلاً من الكتب، تتعامل Google مع مواقع الويب.

إذا كنت تريد أن تظهر صفحاتك في البحث، فيجب فهرستها بشكل صحيح. وبعبارات الشخص العادي، يتعين على Google العثور عليها وحفظها.

وبعد ذلك، يمكن لـ Google تحليل محتواها لتحديد الاستعلامات التي قد تكون ذات صلة بها.

يعد الحصول على الفهرسة شرطًا أساسيًا للحصول على حركة مرور عضوية من Google. وكلما تمت فهرسة المزيد من صفحات موقع الويب الخاص بك، لديك فرص أكبر للظهور في نتائج البحث.

ولهذا السبب من المهم جدًا بالنسبة لك معرفة ما إذا كان بإمكان Google فهرسة المحتوى الخاص بك.

إليك ما فعلته لتحديد مشكلات الفهرسة

تتضمن مهامي اليومية تحسين مواقع الويب من الناحية الفنية لتحسين محركات البحث لجعلها أكثر وضوحًا في Google ونتيجة لذلك، يمكنني الوصول إلى عشرات المواقع في Google Search Console.

قررت استخدام هذا من أجل جعل مشكلات الفهرسة شائعة على أمل… حسنًا، أقل شيوعًا.

ومن أجل الشفافية، قمت بتحليل المنهجية التي قادتني إلى بعض الاستنتاجات المثيرة للاهتمام.

المنهجية

لقد بدأت بإنشاء عينة من الصفحات، والجمع بين البيانات من مصدرين:

  • لقد استخدمت البيانات من عملائنا التي كانت متاحة لي بسهولة.
  • لقد طلبت من محترفي تحسين محركات البحث (SEO) الآخرين مشاركة البيانات مجهولة المصدر معي، من خلال نشر ملف Twitter الاستطلاع والتواصل مع بعض مُحسنات محركات البحث مباشرةً.

كبار المسئولين الاقتصاديين، أحتاج إلى 3-10 دقائق من وقتك.
هل يمكنك مساعدتي في بحثي حول الفهرسة ومشاركة بعض إحصائيات GSC غير الحساسة معي؟
عندما أجد بعض الأفكار المثيرة للاهتمام، سأقوم بنشر مقال حول ذلك.

شكرا لكم مقدما! من فضلك ص / ر

🙏🙏 https://t.co/vAwMulQtsx

– توميك رودزكي (@ TomekRudzki) 9 نوفمبر 2020

أثبت كلاهما مصادر مثمرة للمعلومات.

استبعاد الصفحات غير القابلة للفهرسة

من مصلحتك ترك بعض الصفحات خارج الفهرسة. يتضمن ذلك عناوين URL القديمة، والمقالات التي لم تعد ذات صلة، ومعلمات التصفية في التجارة الإلكترونية، والمزيد.

يمكن لمشرفي المواقع التأكد من أن Google يتجاهلهم بعدة طرق، بما في ذلك ملف robots.txt وعلامة noindex.

إن أخذ مثل هذه الصفحات في الاعتبار من شأنه أن يؤثر سلبًا على جودة النتائج التي توصلت إليها، لذلك قمت بإزالة الصفحات التي تستوفي أيًا من المعايير أدناه من العينة:

  • تم الحظر بواسطة ملف robots.txt.
  • تم وضع علامة noindex.
  • إعادة التوجيه.
  • إرجاع رمز الحالة HTTP 404.

استبعاد الصفحات غير القيمة

لتحسين جودة عينتي بشكل أكبر، أخذت في الاعتبار فقط تلك الصفحات المضمنة في خرائط الموقع.

بناءً على تجربتي، خرائط الموقع هي أوضح تمثيل لعناوين URL القيمة من موقع ويب معين.

بالطبع، هناك العديد من مواقع الويب التي تحتوي على رسائل غير مرغوب فيها في خرائط مواقعها. حتى أن البعض يقوم بتضمين عناوين URL نفسها في خرائط المواقع وملفات robots.txt الخاصة بهم.

لكنني اهتمت بذلك في الخطوة السابقة.

تصنيف البيانات

لقد وجدت أن مشكلات الفهرسة الشائعة تختلف باختلاف حجم موقع الويب.

إليك كيفية تقسيم البيانات:

  • مواقع ويب صغيرة (تصل إلى 10 آلاف صفحة).
  • مواقع الويب المتوسطة (من 10 آلاف إلى 100 ألف صفحة).
  • مواقع كبيرة (تصل إلى مليون صفحة).
  • مواقع ضخمة (أكثر من مليون صفحة).

ونظرًا للاختلافات في حجم مواقع الويب في عينتي، كان علي أن أجد طريقة لتطبيع البيانات.

يمكن لموقع ويب كبير جدًا يعاني من مشكلة معينة أن يفوق المشكلات التي قد تواجهها مواقع الويب الأصغر الأخرى.

لذلك قمت بفحص كل موقع على حدة لفرز مشكلات الفهرسة التي يواجهونها. ثم قمت بتعيين نقاط لمشكلات الفهرسة بناءً على عدد الصفحات التي تأثرت بمشكلة معينة على موقع ويب معين.

والحكم هو…

فيما يلي أهم خمس مشكلات وجدتها على مواقع الويب بجميع أحجامها.

  1. تم الزحف إليه – غير مفهرس حاليًا (مشكلة في الجودة).
  2. محتوى مكرر.
  3. تم اكتشافه – غير مفهرس حاليًا (مشكلة تتعلق بميزانية الزحف/الجودة).
  4. لينة 404.
  5. مشكلة الزحف.

دعونا كسر هذه أسفل.

جودة

تتضمن مشكلات الجودة أن تكون صفحاتك ضعيفة المحتوى أو مضللة أو متحيزة بشكل مفرط.

إذا كانت صفحتك لا توفر محتوى فريدًا وقيمًا يريد Google عرضه للمستخدمين، فسوف تجد صعوبة في فهرسته (ولا ينبغي أن تتفاجأ).

محتوى مكرر

قد يتعرف Google على بعض صفحاتك كمحتوى مكرر، حتى لو لم تكن تقصد حدوث ذلك.

إحدى المشكلات الشائعة هي العلامات الأساسية التي تشير إلى صفحات مختلفة. والنتيجة هي عدم فهرسة الصفحة الأصلية.

إذا كان لديك محتوى مكررًا، فاستخدم سمة العلامة الأساسية أو إعادة التوجيه 301.

سيساعدك هذا على التأكد من أن الصفحات نفسها على موقعك لا تتنافس مع بعضها البعض على مرات المشاهدة والنقرات والروابط.

ميزانية الزحف

ما هي ميزانية الزحف؟ واستنادًا إلى عدة عوامل، لن يقوم Googlebot بالزحف إلا إلى قدر معين من عناوين URL على كل موقع ويب.

وهذا يعني أن التحسين أمر حيوي؛ فلا تدعه يضيع وقته في صفحات لا تهمك.

404 لينة

تعني أخطاء 404 أنك أرسلت صفحة محذوفة أو غير موجودة للفهرسة. تعرض Soft 404 معلومات “لم يتم العثور عليها”، ولكنها لا تُرجع رمز حالة HTTP 404 إلى الخادم.

تعد إعادة توجيه الصفحات المحذوفة إلى صفحات أخرى لا صلة لها بالموضوع خطأً شائعًا.

قد تظهر أيضًا عمليات إعادة التوجيه المتعددة كأخطاء 404 الناعمة. نسعى جاهدين لتقصير سلاسل إعادة التوجيه الخاصة بك قدر الإمكان.

مشكلة الزحف

هناك العديد من مشكلات الزحف، ولكن إحدى المشكلات المهمة هي مشكلة ملف robots.txt. إذا عثر Googlebot على ملف robots.txt لموقعك ولكن لم يتمكن من الوصول إليه، فلن يزحف إلى الموقع على الإطلاق.

أخيرًا، دعونا نلقي نظرة على النتائج لأحجام مواقع الويب المختلفة.

المواقع الصغيرة

حجم العينة: 44 موقعاً

  1. تم الزحف إليه، ولم يتم فهرسته حاليًا (مشكلة في الجودة أو ميزانية الزحف).
  2. محتوى مكرر.
  3. قضية الميزانية الزحف.
  4. لينة 404.
  5. مشكلة الزحف.

المواقع المتوسطة

حجم العينة: 8 مواقع

  1. محتوى مكرر.
  2. تم اكتشافه، ولم تتم فهرسته حاليًا (مشكلة تتعلق بميزانية الزحف/الجودة).
  3. تم الزحف إليه، ولم تتم فهرسته حاليًا (مشكلة تتعلق بالجودة).
  4. soft 404 (مشكلة الجودة).
  5. مشكلة الزحف.

المواقع الكبيرة

حجم العينة: 9 مواقع

  1. تم الزحف إليه، ولم تتم فهرسته حاليًا (مشكلة تتعلق بالجودة).
  2. تم اكتشافه، ولم تتم فهرسته حاليًا (مشكلة تتعلق بميزانية الزحف/الجودة).
  3. محتوى مكرر.
  4. لينة 404.
  5. مشكلة الزحف.

مواقع ضخمة

حجم العينة: 9 مواقع

  1. تم الزحف إليه، ولم تتم فهرسته حاليًا (مشكلة تتعلق بالجودة).
  2. تم اكتشافه، ولم تتم فهرسته حاليًا (مشكلة تتعلق بميزانية الزحف/الجودة).
  3. محتوى مكرر (مكرر، عنوان URL المقدم لم يتم تحديده كعنوان أساسي).
  4. لينة 404.
  5. مشكلة الزحف.

الوجبات السريعة الرئيسية حول مشكلات الفهرسة الشائعة

ومن المثير للاهتمام أنه وفقًا لهذه النتائج، يعاني حجمان من مواقع الويب من نفس المشكلات. يوضح هذا مدى صعوبة الحفاظ على الجودة في حالة المواقع الكبيرة.

  • أكبر من 100 ألف، ولكن أصغر من مليون.
  • أكبر من 1 مليون.

لكن الوجبات السريعة هي:

  • حتى مواقع الويب الصغيرة نسبيًا (10 آلاف+) قد لا تتم فهرستها بالكامل بسبب عدم كفاية ميزانية الزحف.
  • كلما كان موقع الويب أكبر، أصبحت مشكلات الميزانية/الجودة أكثر إلحاحًا.
  • مشكلة المحتوى المكرر خطيرة ولكنها تتغير طبيعتها اعتمادًا على موقع الويب.

ملاحظة أ Note حول عناوين URL غير المعروفة لـ Google

أثناء بحثي، أدركت أن هناك مشكلة شائعة أخرى تمنع فهرسة الصفحات.

ربما لم تكن قد حصلت على مكانها في التصنيف أعلاه ولكنها لا تزال مهمة، وقد فوجئت برؤيتها لا تزال تحظى بشعبية كبيرة.

أنا أتحدث عن الصفحات اليتيمة.

قد لا تحتوي بعض الصفحات على موقع الويب الخاص بك على روابط داخلية تؤدي إليها.

إذا لم يكن هناك مسار لـ Googlebot للعثور على صفحة عبر موقع الويب الخاص بك، فقد لا يعثر عليها على الإطلاق.

ما هو الحل؟ إضافة روابط من الصفحات ذات الصلة.

يمكنك أيضًا إصلاح ذلك يدويًا عن طريق إضافة الصفحة اليتيمة إلى خريطة الموقع الخاصة بك. ولسوء الحظ، لا يزال العديد من مشرفي المواقع يهملون القيام بذلك.

المزيد من الموارد: