الأخبار التكنولوجية والاستعراضات والنصائح!

كيفية استخدام التعلم الآلي لأبحاث المنافسين لتحسين محركات البحث

ستساعدك المقالة التالية: كيفية استخدام التعلم الآلي لأبحاث المنافسين لتحسين محركات البحث

مع الرغبة المتزايدة باستمرار لدى محترفي تحسين محركات البحث (SEO) لتعلم لغة Python، لم يكن هناك وقت أفضل أو أكثر إثارة للاستفادة من إمكانات التعلم الآلي (ML) وتطبيقها على تحسين محركات البحث (SEO).

هذا صحيح بشكل خاص في أبحاث منافسيك.

في هذا العمود، ستتعلم كيف يساعد التعلم الآلي في مواجهة التحديات الشائعة في أبحاث منافسي تحسين محركات البحث، وكيفية إعداد نموذج ML الخاص بك وتدريبه، وكيفية أتمتة التحليل الخاص بك، والمزيد.

هيا بنا نقوم بذلك!

لماذا نحتاج إلى التعلم الآلي في أبحاث المنافسين لتحسين محركات البحث؟

سيقوم معظم محترفي تحسين محركات البحث (SEO) الذين يعملون في الأسواق التنافسية، إن لم يكن جميعهم، بتحليل SERPs ومنافسيهم التجاريين لمعرفة ما يفعله موقعهم لتحقيق مرتبة أعلى.

في عام 2003، استخدمنا جداول البيانات لجمع البيانات من SERPs، مع أعمدة تمثل جوانب مختلفة من المنافسة مثل عدد الروابط إلى الصفحة الرئيسية، وعدد الصفحات، وما إلى ذلك.

بعد فوات الأوان، كانت الفكرة صحيحة ولكن التنفيذ كان ميؤوسًا منه بسبب القيود المفروضة على برنامج Excel في إجراء تحليل قوي إحصائيًا في الوقت القصير المطلوب.

وإذا لم تكن حدود جداول البيانات كافية، فقد تغير المشهد قليلاً منذ ذلك الحين كما هو الحال الآن:

  • نتائج البحث عن الجوّال.
  • وسائل التواصل الاجتماعي.
  • تجربة بحث Google أكثر تعقيدًا.
  • سرعة الصفحة.
  • بحث شخصي.
  • مخطط.
  • أطر جافا سكريبت وغيرها من تقنيات الويب الجديدة.

ما ورد أعلاه ليس بأي حال من الأحوال قائمة شاملة للاتجاهات ولكنه يعمل على توضيح مجموعة متزايدة باستمرار من العوامل التي يمكن أن تفسر ميزة منافسيك ذوي التصنيف الأعلى في Google.

التعلم الآلي في سياق تحسين محركات البحث (SEO).

لحسن الحظ، مع أدوات مثل Python/R، لم نعد خاضعين لحدود جداول البيانات. يمكن لـ Python/R التعامل مع الملايين إلى المليارات من صفوف البيانات.

إذا كان هناك أي شيء، فإن الحد هو جودة البيانات التي يمكنك إدخالها في نموذج ML الخاص بك والأسئلة الذكية التي تطرحها على بياناتك.

باعتبارك أحد محترفي تحسين محركات البحث (SEO)، يمكنك إحداث فرق حاسم في حملة تحسين محركات البحث (SEO) الخاصة بك عن طريق تجاوز الضوضاء واستخدام التعلم الآلي على بيانات المنافسين لاكتشاف:

  • ما هي عوامل التصنيف التي يمكن أن تفسر بشكل أفضل الاختلافات في التصنيف بين المواقع؟
  • ما هو المعيار الفائز.
  • ما هي قيمة تغيير الوحدة في العامل من حيث الرتبة.

مثل أي مسعى علمي (بيانات)، هناك عدد من الأسئلة التي يجب الإجابة عليها قبل أن نبدأ في البرمجة.

ما هو نوع مشكلة تعلم الآلة في تحليل المنافسين؟

يحل ML عددًا من المشكلات سواء كانت تتعلق بتصنيف الأشياء (التصنيف) أو التنبؤ برقم مستمر (الانحدار).

في حالتنا الخاصة، نظرًا لأن جودة مُحسّنات محرّكات البحث الخاصة بالمنافس تتم الإشارة إليها من خلال تصنيفه في Google، وهذا الترتيب عبارة عن رقم مستمر، فإن مشكلة تعلم الآلة هي مشكلة انحدار.

مقياس النتيجة

نظرًا لأننا نعلم أن مشكلة تعلم الآلة هي مشكلة انحدار، فإن مقياس النتيجة هو المرتبة. وهذا منطقي لعدة أسباب:

  • لن تعاني الرتبة من الموسمية؛ تصنيفات العلامات التجارية للآيس كريم لعمليات البحث [ice cream] لن تنخفض قيمتها لأنه فصل الشتاء، على عكس مقياس “المستخدمين”.
  • ترتيب المنافس هو بيانات طرف ثالث ومتاح باستخدام أدوات تحسين محركات البحث التجارية، على عكس حركة مرور المستخدمين والتحويلات.

ما هي الميزات؟

بعد معرفة مقياس النتيجة، يجب علينا الآن تحديد المتغيرات المستقلة أو مدخلات النموذج المعروفة أيضًا باسم الميزات. ستختلف أنواع البيانات الخاصة بالميزة، على سبيل المثال:

  • الطلاء الأول الذي يتم قياسه بالثواني سيكون رقمًا.
  • المشاعر مع الفئات الإيجابية والمحايدة والسلبية ستكون عاملاً.

بطبيعة الحال، تريد تغطية أكبر عدد ممكن من الميزات المهمة بما في ذلك التقنية والمحتوى/تجربة المستخدم والمواقع الخارجية لإجراء أبحاث المنافسين الأكثر شمولاً.

ما هي الرياضيات؟

بما أن التصنيفات رقمية، وأننا نريد توضيح الفرق في الترتيب، فمن الناحية الرياضية:

الرتبة ~ w_1*feature_1 + w_2*feature_2 + … + w_n*feature_n

~ (المعروفة باسم “تيلدا”) تعني “موضح بواسطة”

n كونها الميزة n

w هو ترجيح الميزة

استخدام التعلم الآلي لكشف أسرار المنافسين

بعد أن أصبح لدينا إجابات على هذه الأسئلة، نحن على استعداد لمعرفة الأسرار التي يمكن أن يكشفها التعلم الآلي عن منافسيك.

في هذه المرحلة، سنفترض أن بياناتك (المعروفة في هذا المثال باسم “serps_data”) قد تم ضمها وتحويلها وتنظيفها وهي الآن جاهزة للنمذجة.

كحد أدنى، ستحتوي هذه البيانات على بيانات التصنيف والميزات التي تريد اختبارها في Google.

على سبيل المثال، يمكن أن تتضمن أعمدتك ما يلي:

  • Google_rank.
  • سرعة الصفحة.
  • المشاعر.
  • Flesch_kincaid_reading_ease.
  • Amp_version_available.
  • عمق الموقع.
  • Internal_page_rank.
  • عدد Referring_commains.
  • avg_domain_authority_backlinks.
  • title_keyword_string_distance.

تدريب نموذج ML الخاص بك

لتدريب النموذج الخاص بك، نستخدم XGBoost لأنه يميل إلى تقديم نتائج أفضل من نماذج تعلم الآلة الأخرى.

البدائل التي قد ترغب في تجربتها بالتوازي هي LightGBM (خاصة لمجموعات البيانات الأكبر حجمًا)، وRandomForest، وAdaboost.

حاول استخدام كود Python التالي لـ XGBoost لمجموعة بيانات SERPs الخاصة بك:

#استيراد المكتبات

استيراد xgboost كـ xgb استيراد الباندا كـ pd serps_data = pd.read_csv(‘serps_data.csv’)

# تعيين متغيرات النموذج

# بيانات SERPs الخاصة بك مع كل شيء ما عدا عمود google_rank

serp_features = serps_data.drop(columns = [‘Google_rank’])

# بيانات SERPs الخاصة بك باستخدام عمود google_rank فقط

rank_actual = serps_data.Google_rank

# إنشاء نموذج

serps_model = xgb.XGBRegressor(objective=’reg:linear’, Random_state=1231)

#تناسب النموذج

serps_model.fit(serp_features, Rank_actual)

# توليد التنبؤات النموذجية

rank_pred = serps_model.predict(serp_features)

# تقييم دقة النموذج

MSE = mean_squared_error(rank_actual، rank_pred)

Note أن ما ورد أعلاه أساسي جدًا. في سيناريو العميل الحقيقي، قد ترغب في تجربة عدد من خوارزميات النماذج على عينة بيانات تدريب (حوالي 80% من البيانات)، وتقييمها (باستخدام بيانات 20% المتبقية)، وتحديد أفضل نموذج.

إذن ما هي الأسرار التي يمكن أن يخبرنا بها نموذج التعلم الآلي هذا؟

المحركات الأكثر تنبؤية للرتبة

يعرض الرسم البياني ميزات SERP الأكثر تأثيرًا أو عوامل التصنيف بترتيب تنازلي من حيث الأهمية.

في هذه الحالة بالذات، كان العامل الأكثر أهمية هو “title_keyword_dist” الذي يقيس مسافة السلسلة بين علامة العنوان والكلمة الرئيسية المستهدفة. فكر في هذا باعتباره صلة علامة العنوان بالكلمة الرئيسية.

ليس من المستغرب بالنسبة لممارس تحسين محركات البحث، ومع ذلك، فإن القيمة هنا هي تقديم أدلة تجريبية لجمهور الأعمال غير الخبراء الذي لا يفهم الحاجة إلى تحسين علامات العنوان.

العوامل الأخرى الجديرة بالملاحظة في هذه الصناعة هي:

  • لا كعك محلاة: عدد ملفات تعريف الارتباط.
  • dom_ready_time_ms: قياس سرعة الصفحة.
  • no_template_words: لحساب عدد الكلمات خارج قسم محتوى النص الرئيسي.
  • link_root_domains_links: عدد الروابط إلى المجالات الجذر.
  • no_scaled_images: عدد الصور التي تم تغيير حجمها والتي تحتاج إلى تغيير حجمها بواسطة المتصفح لعرضها.

يختلف كل سوق أو صناعة عن الآخر، لذا فإن ما ورد أعلاه ليس نتيجة عامة لتحسين محركات البحث بأكملها!

ما هي قيمة عامل التصنيف؟

وفي حالة سوق أخرى، يمكننا أيضًا معرفة مقدار الرتبة التي سيتم تسليمها.

في الرسم البياني أعلاه، لدينا قائمة بالعوامل وتغير الترتيب لكل تغيير إيجابي في الوحدة في هذا العامل.

على سبيل المثال، لكل وحدة زيادة في طول الوصف التعريفي بمقدار حرف واحد، هناك انخفاض مماثل في تصنيف Google بمقدار 0.1.

إذا أخرجنا هذا من سياقه، فهذا يبدو سخيفًا. ومع ذلك، نظرًا لأن معظم الأوصاف التعريفية مملوءة، فهذا يعني أن تغيير الوحدة بعيدًا عن متوسط ​​طول الوصف التعريفي سيؤدي بعد ذلك إلى انخفاض في تصنيف بحث Google.

المعيار الفائز لعامل التصنيف

يوجد أدناه رسم بياني يوضح متوسط ​​طول علامة العنوان لصناعة مختلفة عن تلك المذكورة أعلاه، والذي يتضمن أيضًا خطًا مناسبًا بشكل أفضل:

على الرغم من توصية أفضل ممارسات تحسين محركات البحث (SEO) باستخدام ما يصل إلى 70 حرفًا لطول علامة العنوان، فإن البيانات الموضحة أعلاه توضح أن الطول الأمثل الفعلي في هذه الصناعة هو 60 حرفًا.

بفضل التعلم الآلي، لا يمكننا فقط إظهار أهم العوامل، ولكن عند إجراء بحث عميق يمكننا أيضًا رؤية المعيار الفائز.

أتمتة تحليل منافسيك في مجال تحسين محركات البحث (SEO) باستخدام التعلم الآلي

يعد تطبيق التعلم الآلي أعلاه أمرًا رائعًا للحصول على بعض الأفكار لتقسيم اختبار AB وتحسين برنامج تحسين محركات البحث (SEO) من خلال طلبات التغيير المبنية على الأدلة.

من المهم أيضًا أن ندرك أن هذا التحليل يصبح أكثر قوة عندما يكون مستمرًا.

لماذا؟

لأن تحليل ML هو مجرد لقطة من SERPs لنقطة زمنية واحدة.

إن الحصول على تدفق مستمر لجمع البيانات وتحليلها يعني أنك تحصل على صورة أكثر صدقًا لما يحدث بالفعل مع SERPs في مجال عملك.

هذا هو المكان الذي تصبح فيه مستودعات البيانات وأنظمة لوحة المعلومات المصممة خصيصًا لتحسين محركات البحث مفيدة، وهذه المنتجات متاحة اليوم.

ما تفعله هذه الأنظمة هو:

  • استوعب بياناتك من أدوات تحسين محركات البحث المفضلة لديك يوميًا.
  • الجمع بين البيانات.
  • استخدم ML لعرض الرؤى الموضحة أعلاه في الواجهة الأمامية التي تختارها مثل Google Data Studio.

لإنشاء نظام آلي خاص بك، يجب عليك النشر في البنية التحتية السحابية مثل Amazon خدمات الويب (AWS) أو Google Cloud Platform (GCP) ما يسمى ETL، أي الاستخراج والتحويل والتحميل.

لشرح:

  • استخراج – الاتصال اليومي لواجهات برمجة تطبيقات أداة تحسين محركات البحث (SEO).
  • التحويل – تنظيف بياناتك وتحليلها باستخدام تعلم الآلة كما هو موضح أعلاه.
  • التحميل – إيداع النتيجة النهائية في مستودع البيانات الخاص بك.

وبالتالي تتم عملية جمع البيانات وتحليلها وتصورها تلقائيًا في مكان واحد.

ليرة تركية؟

يعد البحث والتحليل عن المنافسين في مجال تحسين محركات البحث (SEO) أمرًا صعبًا نظرًا لوجود العديد من عوامل التصنيف التي يجب التحكم فيها.

أدوات جداول البيانات لا تستطيع ذلك، وذلك بسبب كميات البيانات المعنية (ناهيك عن القدرات الإحصائية التي توفرها لغات علم البيانات مثل بايثون).

عند إجراء تحليل منافسي تحسين محركات البحث (SEO) باستخدام التعلم الآلي، من المهم أن نفهم أن هذه مشكلة انحدار، وأن المتغير المستهدف هو تصنيف Google، وأن الفرضيات هي عوامل التصنيف.

يمكن أن يخبرك استخدام التعلم الآلي على منافسيك ما هي الدوافع الرئيسية، وتحديد المعايير الفائزة فيما بينهم، وإبلاغك بمدى الارتقاء في التصنيف الذي يمكن أن تحققه تحسيناتك.

التحليل عبارة عن لقطة فقط، لذا للبقاء على قمة المنافسين، قم بأتمتة هذه العملية باستخدام الاستخراج والتحويل والتحميل (ETL).

المزيد من الموارد: