الأخبار التكنولوجية والاستعراضات والنصائح!

تجميع الكلمات الرئيسية الدلالية لأكثر من 10000 كلمة رئيسية [With Script]

ستساعدك المقالة التالية: تجميع الكلمات الرئيسية الدلالية لأكثر من 10000 كلمة رئيسية [With Script]

يمكن أن يساعد تجميع الكلمات الرئيسية الدلالية في الارتقاء ببحث كلماتك الرئيسية إلى المستوى التالي.

في هذه المقالة، ستتعرف على كيفية استخدام ورقة Google التعاونية التي تتم مشاركتها حصريًا مع قراء مجلة محرك البحث.

سترشدك هذه المقالة خلال استخدام ورقة Google Colab، وهي عرض رفيع المستوى لكيفية عملها تحت الغطاء، وكيفية إجراء التعديلات لتناسب احتياجاتك.

ولكن أولاً، لماذا تجميع الكلمات الرئيسية على الإطلاق؟

حالات الاستخدام الشائعة لتجميع الكلمات الرئيسية

فيما يلي بعض حالات الاستخدام لتجميع الكلمات الرئيسية.

بحث أسرع عن الكلمات الرئيسية:

  • قم بتصفية الكلمات الرئيسية ذات العلامات التجارية أو الكلمات الرئيسية التي ليس لها قيمة تجارية.
  • قم بتجميع الكلمات الرئيسية ذات الصلة معًا لإنشاء المزيد من المقالات المتعمقة.
  • قم بتجميع الأسئلة والإجابات ذات الصلة معًا لإنشاء الأسئلة الشائعة.

حملات البحث المدفوعة:

  • أنشئ قوائم كلمات رئيسية سلبية للإعلانات باستخدام مجموعات بيانات كبيرة بشكل أسرع – توقف عن إهدار المال على الكلمات الرئيسية غير المرغوب فيها!
  • قم بتجميع الكلمات الرئيسية المتشابهة في أفكار حملات الإعلانات.

فيما يلي مثال على البرنامج النصي الذي يجمع الأسئلة المتشابهة معًا، وهو مثالي لمقالة متعمقة!

مشاكل مع الإصدارات السابقة من هذه الأداة

إذا كنت تتابع أعمالي Twitter، ستعرف أنني كنت أقوم بتجربة تجميع الكلمات الرئيسية منذ فترة من الوقت.

الإصدارات السابقة من هذا البرنامج النصي كانت مبنية على ممتازة مكتبة PolyFuzz استخدام مطابقة TF-IDF.

أثناء إنجاز المهمة، كانت هناك دائمًا بعض المجموعات التي تخدش الرأس والتي شعرت أنه يمكن تحسين النتيجة الأصلية عليها.

سيتم تجميع الكلمات التي تشترك في نمط مماثل من الحروف حتى لو لم تكن مرتبطة لغويًا.

على سبيل المثال، لم يتمكن من تجميع كلمات مثل “دراجة” مع “دراجة”.

الإصدارات السابقة من البرنامج النصي كانت بها مشكلات أخرى أيضًا:

  • لم يكن يعمل بشكل جيد في لغات أخرى غير الإنجليزية.
  • لقد أدى ذلك إلى إنشاء عدد كبير من المجموعات التي لم يكن من الممكن تجميعها.
  • لم يكن هناك الكثير من السيطرة على كيفية إنشاء المجموعات.
  • كان البرنامج النصي يقتصر على 10000 صف تقريبًا قبل انتهاء المهلة بسبب نقص الموارد.

تجميع الكلمات الرئيسية الدلالية باستخدام التعلم العميق ومعالجة اللغات الطبيعية (NLP)

تقدم سريعًا لمدة أربعة أشهر حتى الإصدار الأخير الذي تمت إعادة كتابته بالكامل لاستخدام أحدث تقنيات دمج الجمل التعليمية العميقة.

تحقق من بعض هذه المجموعات الدلالية رهيبة!

هل لاحظت أن كلمة “سخان” و”حرارة” و”دافئة” موجودة ضمن نفس مجموعة الكلمات الرئيسية؟

أو ماذا عن البيع بالجملة والسائبة؟

الكلب والكلب الألماني، عيد الميلاد وعيد الميلاد؟

يمكنه أيضًا تجميع الكلمات الرئيسية بأكثر من مائة لغة مختلفة!

ميزات البرنامج النصي الجديد مقابل التكرارات السابقة

بالإضافة إلى تجميع الكلمات الرئيسية الدلالية، تمت إضافة التحسينات التالية إلى الإصدار الأحدث من هذا البرنامج النصي.

  • دعم لتجميع أكثر من 10000 كلمة رئيسية في وقت واحد.
  • تم تقليل عدم وجود مجموعات عنقودية.
  • القدرة على اختيار نماذج مختلفة مدربة مسبقًا (على الرغم من أن النموذج الافتراضي يعمل بشكل جيد!).
  • القدرة على اختيار مدى ارتباط المجموعات ارتباطًا وثيقًا.
  • اختيار الحد الأدنى لعدد الكلمات الرئيسية المراد استخدامها لكل مجموعة.
  • الكشف التلقائي عن ترميز الأحرف ومحددات CSV.
  • تجميع متعدد اللغات.
  • يعمل مع العديد من عمليات تصدير الكلمات الرئيسية الشائعة خارج الصندوق. (بيانات Search Console أو AdWords أو أدوات الكلمات الرئيسية التابعة لجهات خارجية مثل Ahrefs وSemrush).
  • يعمل مع أي ملف CSV يحتوي على عمود يسمى “الكلمة الرئيسية”.
  • سهل الاستخدام (يعمل البرنامج النصي عن طريق إدراج عمود جديد يسمى اسم المجموعة إلى أي قائمة من الكلمات الرئيسية التي تم تحميلها).

كيفية استخدام البرنامج النصي في خمس خطوات (البدء السريع)

للبدء، سوف تحتاج إلى أضغط على هذا الرابط، ثم اختر خيار فتح في كولاب كما هو موضح أدناه.

قم بتغيير نوع وقت التشغيل إلى GPU عن طريق تحديد > .

حدد > الكل من أعلى شريط التنقل من داخل Google Colaboratory، (أو فقط اضغط على Ctrl+F9).

قم بتحميل ملف بتنسيق ‎.csv يحتوي على عمود يسمى “الكلمة الرئيسية” عند المطالبة بذلك.

يجب أن يكون التجميع سريعًا إلى حد ما، ولكنه يعتمد في النهاية على عدد الكلمات الرئيسية والنموذج المستخدم.

بشكل عام، يجب أن تكون جيدًا لـ 50000 كلمة رئيسية.

إذا رأيت خطأ Cuda نفاد الذاكرة، فأنت تحاول تجميع عدد كبير جدًا من الكلمات الرئيسية في نفس الوقت!

(تجدر الإشارة إلى أنه يمكن بسهولة تعديل هذا البرنامج النصي ليعمل على جهاز محلي دون حدود Google Colaboratory.)

إخراج البرنامج النصي

سيتم تشغيل البرنامج النصي وإلحاق المجموعات بملفك الأصلي بعمود جديد يسمى اسم المجموعة.

يتم تعيين أسماء المجموعات باستخدام الكلمة الأساسية الأقصر طولًا في المجموعة.

على سبيل المثال، تم تعيين اسم المجموعة لمجموعة الكلمات الرئيسية التالية على أنه “جوارب الألبكة” لأن هذه هي أقصر كلمة رئيسية في المجموعة.

بمجرد اكتمال التجميع، يتم حفظ ملف جديد تلقائيًا، مع إلحاق المجمع في عمود جديد بالملف الأصلي.

كيف تعمل أداة تجميع المفاتيح

يعتمد هذا البرنامج النصي على خوارزمية التجميع السريعة ويستخدم النماذج التي تم تدريبها مسبقًا على نطاق واسع على كميات كبيرة من البيانات.

وهذا يجعل من السهل حساب العلاقات الدلالية بين الكلمات الرئيسية باستخدام النماذج الجاهزة.

(ليس من الضروري أن تكون عالم بيانات لتستخدمه!)

في الواقع، على الرغم من أنني جعلته قابلاً للتخصيص لأولئك الذين يحبون التعديل والتجربة، فقد اخترت بعض الإعدادات الافتراضية المتوازنة التي يجب أن تكون معقولة لحالات استخدام معظم الأشخاص.

يمكن تبديل النماذج المختلفة داخل وخارج البرنامج النصي اعتمادًا على المتطلبات (تجميع أسرع، ودعم أفضل متعدد اللغات، وأداء دلالي أفضل، وما إلى ذلك).

بعد الكثير من الاختبارات، وجدت التوازن المثالي بين السرعة والدقة باستخدام محول MiniLM-L6-v2 الذي يوفر توازنًا رائعًا بين السرعة والدقة.

إذا كنت تفضل استخدام النموذج الخاص بك، فيمكنك فقط التجربة، ويمكنك استبدال النموذج الحالي المدرب مسبقًا بأي من النماذج المدرجة هنا أو على معانقة نموذج الوجه Hub.

المبادلة في النماذج المدربة مسبقًا

يعد التبديل في النماذج أمرًا سهلاً مثل استبدال المتغير باسم المحول المفضل لديك.

على سبيل المثال، يمكنك تغيير النموذج الافتراضي all-miniLM-L6-v2 إلى all-mpnet-base-v2 عن طريق تحرير:

المحول = ‘الكل-miniLM-L6-v2’

ل

محول = ‘جميع mpnet-base-v2

هنا يمكنك تعديله في ورقة Google التعاونية.

المفاضلة بين دقة المجموعة وعدم وجود مجموعات عنقودية

الشكوى الشائعة من التكرارات السابقة لهذا البرنامج النصي هي أنه أدى إلى عدد كبير من النتائج غير المجمعة.

ولسوء الحظ، سيكون الأمر دائمًا بمثابة موازنة بين دقة المجموعة مقابل عدد المجموعات.

سيؤدي إعداد دقة المجموعة الأعلى إلى عدد أكبر من النتائج غير المجمعة.

هناك متغيران يمكن أن يؤثرا بشكل مباشر على حجم ودقة جميع المجموعات:

min_cluster_size

و

دقة الكتلة

لقد قمت بتعيين الإعداد الافتراضي على 85 (/100) لدقة المجموعة والحد الأدنى لحجم المجموعة وهو 2.

أثناء الاختبار، وجدت أن هذا هو المكان المثالي، لكن لا تتردد في التجربة!

إليك مكان تعيين هذه المتغيرات في البرنامج النصي.

هذا كل شيء! آمل أن يكون هذا البرنامج النصي لتجميع الكلمات الرئيسية مفيدًا لعملك.

المزيد من الموارد: