الأخبار التكنولوجية والاستعراضات والنصائح!

Regex لتحسين محركات البحث: دليل للتعبيرات العادية (مع حالات الاستخدام)

ستساعدك المقالة التالية: Regex لتحسين محركات البحث: دليل للتعبيرات العادية (مع حالات الاستخدام)

ربما تكون قد سمعت عن التعبير العادي ولكنك لست متأكدًا تمامًا من كيفية استخدامه في تحسين محركات البحث أو ما إذا كان يتناسب مع استراتيجيتك الخاصة.

تشبه التعبيرات العادية، أو “regex”، لغة برمجة مضمنة لعمليات البحث النصية التي تسمح لك بتضمين سلاسل بحث معقدة، ومطابقات جزئية وأحرف البدل، وعمليات بحث غير حساسة لحالة الأحرف، وتعليمات متقدمة أخرى.

يمكنك اعتبارها بمثابة البحث عن نمط، بدلاً من سلسلة محددة من النص.

ولذلك، يمكنهم مساعدتك في العثور على مجموعات كاملة من نتائج البحث التي قد تبدو للوهلة الأولى أنها لا تحتوي على الكثير من القواسم المشتركة مع بعضها البعض.

تعبيرات Regex هي لغة خاصة بها، وفي المرة الأولى التي ترى فيها واحدة، يمكن أن تبدو غريبة تمامًا.

ولكن من السهل جدًا تعلمها ويمكن استخدامها عبر JavaScript وPython ولغات البرمجة الأخرى، مما يجعلها أداة SEO متعددة الاستخدامات وقوية.

في هذا الدليل، ستتعرف على عوامل تشغيل التعبير العادي الشائعة، وكيفية استخدام مرشحات التعبير العادي الأكثر تقدمًا لتحسين محركات البحث، وكيفية استخدام التعبير العادي في Google Analytics وGoogle Search Console، والمزيد.

ستجد أمثلة على التعبير العادي في العمل بطرق مختلفة في تحسين محركات البحث أيضًا.

كيف تبدو ريجكس؟

يتضمن التعبير العادي عادةً مجموعة من النصوص التي ستتطابق تمامًا في نتائج البحث، إلى جانب العديد من عوامل التشغيل التي تعمل مثل أحرف البدل لتحقيق مطابقة النمط بدلاً من مطابقة النص تمامًا.

يمكن أن يتضمن ذلك حرف بدل مكون من حرف واحد، أو مطابقة لحرف واحد أو أكثر، أو مطابقة لصفر أو أكثر من الأحرف، بالإضافة إلى أحرف اختيارية، وتعبيرات فرعية متداخلة بين قوسين، ووظائف “أو”.

ومن خلال الجمع بين هذه العمليات المختلفة معًا، يمكنك إنشاء تعبير معقد يمكنه تحقيق نتائج بعيدة المدى جدًا ولكنها محددة للغاية.

مشغلي Regex المشتركين

تتضمن بعض الأمثلة على عوامل التشغيل العادية الشائعة ما يلي:

. مطابقة حرف البدل لأي حرف واحد.

.* تطابق لصفر أو أكثر من الأحرف.

.+ تطابق لشخصية واحدة أو أكثر.

د مطابقة لأي رقم رقمي واحد من 0 إلى 9.

؟ يتم إدراجه بعد الحرف لجعله جزءًا اختياريًا من التعبير.

| يشير الخط العمودي أو حرف “الأنبوب” إلى وظيفة “أو”.

^ يستخدم للإشارة إلى بداية السلسلة.

$ يستخدم للدلالة على نهاية السلسلة.

( ) يستخدم لتداخل تعبير فرعي.

\ تم إدراجه قبل عامل التشغيل أو الحرف الخاص “للهروب” منه.

تسمح بعض لغات البرمجة، مثل JavaScript، بتضمين “العلامات” بعد نمط regex نفسه، ويمكن أن يؤثر ذلك بشكل أكبر على النتيجة:

g إرجاع جميع التطابقات بدلاً من المطابقة الأولى فقط.

i يقوم بإرجاع نتائج غير حساسة لحالة الأحرف.

m يقوم بتنشيط وضع الخطوط المتعددة.

يقوم بتنشيط وضع “dotall”.

u يقوم بتنشيط دعم Unicode الكامل.

y يبحث في موضع النص المحدد (الوضع “الثابت”).

كما ترون، تبدأ عوامل التشغيل والعلامات معًا في تكوين لغة منطقية معقدة، مما يمنحك القدرة على تحقيق نتائج محددة للغاية عبر مجموعات بيانات كبيرة وغير مرتبة.

كيف تستخدم Regex لتحسين محركات البحث؟

يمكن استخدام Regex لاستكشاف الاستعلامات التي تستخدمها شرائح المستخدمين المختلفة، والاستعلامات الشائعة في مناطق محتوى محددة، والاستعلامات التي توجه حركة المرور إلى أجزاء معينة من موقعك، والمزيد.

في هذه المقالة، أوضح هاملت باتيستا كيفية استخدام التعبير العادي في بايثون لتحليل ملفات سجل الخادم، على سبيل المثال.

وفي هذا المقال، أوضح لك كريس لونج كيفية استخدام التعبير العادي لاستخراج موضع وعنصر واسم مسارات التنقل المرتبطة بكل عنوان URL لموقعك كجزء من عملية بحث وتجزئة قابلة للتطوير للكلمات الرئيسية.

جوجل تشجع محترفو تحسين محركات البحث (SEO) لمشاركة أمثلة حول كيفية استخدامهم للتعبير العادي Twitter باستخدام الهاشتاج #performanceregex.

فيما يلي بعض النصائح من SEO Twitter (ستلاحظ أنه وسم هادئ جدًا – أضف الأمثلة الخاصة بك إذا كانت لديك!):

استخدم slug$ في أحد الفلاتر لرؤية قائمة بكل صفحة/كلمة رئيسية تنتهي بـ “slug”. مهم جدًا إذا كان عليك إدارة مواقع الويب الكبيرة 🖤#performanceregex

– هانز جيريميا جاكس (@HannesJaacks) 31 ديسمبر 2021

لقد قمت بتجميع مكتبة واسعة جدًا من #التعبيرات العادية ل #googlesearchconsole. 😉

راسلني بأي أفكار أخرى، ويسعدني إضافتها. @دانييلوايسبيرج @DanielHereMe @ سايروس شيبرد @5le @DataChaz #performanceregex #regex #سيو https://t.co/BKX9UCGrOU

– جي سي شوينارد (ChouinardJC) 17 يونيو 2021

استخدام Regex في Google Analytics

أحد الاستخدامات الأكثر شيوعًا للتعبير العادي لتحسين محركات البحث هو Google Analytics، حيث يمكن استخدام التعبيرات العادية لإعداد المرشحات بحيث لا ترى سوى البيانات التي تريد رؤيتها.

وبهذا المعنى، يتم استخدام التعبير لاستبعاد النتائج، بدلاً من إنشاء مجموعة من نتائج البحث الشاملة.

على سبيل المثال، إذا كنت تريد استبعاد البيانات من عناوين IP على شبكتك المحلية، فيمكنك تصفية 192.168.*.* لإزالة النطاق الكامل من 192.168.0.0 إلى 192.168.255.255.

المزيد من مرشحات Regex SEO المتقدمة

وكمثال أكثر تعقيدًا، لنتخيل أن لديك علامتين تجاريتين: regex247 وregex365.

قد ترغب في تصفية النتائج التي تطابق أي مجموعة من عناوين URL التي تحتوي على أسماء العلامات التجارية هذه، مثل regex247.biz أو www.regex365.org.

إحدى الطرق للقيام بذلك هي باستخدام تعبير “أو” بسيط إلى حد ما:

.*regex247.*|.*regex365.*

سيؤدي هذا إلى إزالة جميع عناوين URL المطابقة من بيانات Analytics، بما في ذلك مسارات المجلدات الفرعية وعناوين URL لصفحات محددة تظهر في أسماء النطاقات هذه.

كلمة للتحذير

تجدر الإشارة إلى أنه – على غرار ملف robots.txt الخاص بك – يمكن لتعبير regex المكتوب بشكل سيئ أن يقوم بسهولة بتصفية معظم أو كل بياناتك عن طريق تضمين مطابقة أحرف البدل غير المقيدة.

والخبر السار هو أنه في العديد من حالات تحسين محركات البحث، يتم تطبيق الفلتر فقط على بياناتك في مرحلة إعداد التقارير، ومن خلال تحرير أو حذف تعبير regex الخاص بك، يمكنك استعادة الرؤية الكاملة لبياناتك.

يمكنك أيضًا اختبار التعبيرات العادية على عدد من أدوات الاختبار عبر الإنترنت، لمعرفة ما إذا كانت تحقق النتيجة المقصودة – مما يتيح لك “وضع الحماية” لتعبيرات التعبير العادي الخاصة بك قبل السماح لها بالفقد عبر مجموعة البيانات بأكملها.

لإنشاء فلاتر التعبير العادي في Google Analytics، انتقل أولاً إلى نوع التقرير الذي تريد إنشاءه (على سبيل المثال > > أو > > /).

أسفل الرسم البياني، أعلى جدول البيانات، ابحث عن مربع البحث وانقر لعرض خيارات التصفية المتقدمة.

يمكنك هنا تضمين البيانات أو استبعادها بناءً على بُعد أو مقياس معين. في القائمة المنسدلة بعد تحديد البُعد الخاص بك، اختر ثم أدخل التعبير الخاص بك في مربع النص.

“أو” و”و” في Google Analytics Regex

لإنشاء تعبير “أو” في Google Analytics، ما عليك سوى تضمين حرف الأنبوب (رمز الحد الرأسي |) بين الأجزاء المناسبة من تعبيرك.

لا تدعم التعبيرات العادية في Google Analytics عبارات “و” ضمن تعبير عادي واحد؛ ومع ذلك، يمكنك فقط إضافة مرشح آخر لتحقيق ذلك.

أسفل التعبير العادي الأول، ما عليك سوى النقر وإدخال التعبير العادي التالي. بهذه الطريقة، يمكنك تجميع أي عدد تريده من التعبيرات وستتم معالجتها كعبارة “و” منطقية واحدة عند تصفية بياناتك.

استخدام Regex في Google Search Console

في عام 2021، بدأت Google Search Console في دعم بناء جملة Re2 للتعبير العادي، مما يسمح لمشرفي المواقع بتضمين البيانات واستبعادها داخل واجهة المستخدم.

ستجد جميع الأحرف الأولية التي يدعمها Google Search Console في مرجع بناء جملة RE2 regex هذا على جيثب.

في وقت كتابة هذا التقرير، كان هناك حد لعدد الأحرف يبلغ 4096 حرفًا (وهو ما يكفي عادةً…).

يمكن للأمثلة التي يمكنك استخدامها في Search Console تصفية طلبات البحث التي تحتوي على علامة تجارية معينة والصيغ التي يمكن للمستخدمين كتابتها، مثل Facebook:

.*facebook.*|face*book.*|fb.*|fbook.*|f*book.*

قم بتصفية المستخدمين الذين يجدون موقع الويب الخاص بك من خلال مصطلحات النية “التجارية”:

.*(الأفضل|الأعلى|البديل|البديل|مقابل|مقابل|المراجعة*).*

متعلق ب:

لماذا يعد Regex مهمًا لتحسين محركات البحث؟

وأخيرا، لماذا كل هذا مهم؟

حسنًا، الأمر كله يتعلق بالتحكم في بياناتك وتصفية الأجزاء منها التي لا تساعدك على تحسين مُحسنات محركات البحث – سواء كانت صفحات أو أجزاء معينة من موقع الويب الخاص بك، أو حركة المرور من مصدر أو وسيط معين، أو موقعك المحلي بيانات الشبكة.

يمكنك إنشاء تعبيرات regex بسيطة جدًا لتحقيق مرشح “تضمين” أو “استبعاد” أساسي، أو كتابة تعبيرات أطول تعمل بشكل مشابه لتعليمات البرمجة لتحقيق نتائج معقدة ومحددة للغاية.

ومن خلال التعبير العادي المناسب لكل حملة، يمكنك التحقق من أن جهود تحسين محركات البحث (SEO) الخاصة بك تحقق أهدافك وطموحاتك ونتائجك – وهي طريقة قوية لإثبات عائد الاستثمار الإيجابي على استثماراتك المستقبلية في تحسين محركات البحث (SEO).

المزيد من الموارد: