الأخبار التكنولوجية والاستعراضات والنصائح!

تحسين محركات البحث متعددة اللغات: إنه في الواقع تحدي كبير جدًا بالنسبة لـ Google لتحديد لغة الاستعلام

ستساعدك المقالة التالية: تحسين محركات البحث متعددة اللغات: إنه في الواقع تحدي كبير جدًا بالنسبة لـ Google لتحديد لغة الاستعلام

هناك العديد من الكلمات التي تكتب بنفس الطريقة ولكن لها معاني مختلفة بناءً على اللغة والموقع. مثال بسيط للغاية هو كلمة “كرة القدم”. في الولايات المتحدة وكندا، تشير هذه الكلمة إلى لعبة يتم لعبها باستخدام كرة يتم رميها في الهواء وحملها نحو الهدف؛ بينما تشير في المملكة المتحدة وأستراليا إلى لعبة يتم لعبها عن طريق ركل الكرة داخل المرمى (تُعرف أيضًا باسم “كرة القدم” للأمريكيين). إذًا، كيف يحدد Google معنى كلمة معينة يبحث عنها المستخدم؟

تحدي الاستعلام

في كل مرة يقوم شخص ما بإجراء إحدى عمليات البحث الغامضة هذه على Google، تحتاج خوارزمية Google على الفور إلى معرفة اللغة المفضلة للمستخدم لفهم فئة النتائج التي يجب إرجاعها حتى قبل تحديد تصنيفات تلك النتائج.

في حين يتم كتابة كلمة كرة القدم بنفس الطريقة من قبل جميع المتحدثين باللغة الإنجليزية، فإن الجمهور البشري لن يعرف نوع اللعبة التي تتم الإشارة إليها في المحادثة ما لم يعرف من أين أتى الشخص الذي يتحدث عن اللعبة. في كلتا اللعبتين، هناك ميزات متشابهة مثل قدر كبير من الجري والتمرير وحتى ركل المرمى.

لقطة شاشة لـ Google.com مقابل Google.com.mx. 5-30-14

المزايا المنطوقة

في محادثة أو بيان منطوق قصير جدًا، ربما لن يكون هناك أي أدلة دلالية يمكن أن تساعد المستمع في معرفة نوع كرة القدم التي تتم الإشارة إليها. إذا سأل أحدهم للتو: “ما هو وقت مباراة كرة القدم؟” أو “هل تلعب كرة القدم؟”، فالإجابة تعتمد على نوع كرة القدم المحدد. (عند الاستماع إلى عبارات غامضة، قد يكون هناك شيوع لللكنة، ولكن هذه الميزة لن تكون موجودة للعبارات المكتوبة في مربع البحث.) ومع ذلك، إذا تم توسيع المحادثة، فسيتمكن المستمع في النهاية من معرفة ما إذا كانت اللغة الأساسية أم لا. الموضوع هو كرة القدم الأمريكية أو كرة القدم.

كما هو الحال في المحادثة المنطوقة، في الاستعلامات الأطول، ستستخدم Google أيضًا كلمات مجاورة للمصطلح الغامض للمساعدة في تحسين الاستعلام. قد يعني طلب بحث مثل “ملعب كرة قدم” أن المستخدم يبحث عن كرة قدم، ويعني “هدف ملعب كرة قدم” أنه استعلام كرة قدم أمريكي (أو كندي). علاوة على ذلك، يستخدم Google كلمات استعلام إضافية مقترنة بالتوقيت لفهم الاستعلام. “ما هو وقت مباراة كرة القدم؟” سيكون البحث الذي تم البحث عنه في أحد أيام مباريات NFL يوم الأحد مؤشرًا رائعًا على نية الاستعلام لدى المستخدم.

استعلام بكلمة واحدة

عندما يكون الاستعلام عبارة عن كلمة واحدة فقط، يصبح الأمر أكثر صعوبة بكثير. من المؤكد أن معرفة نوع الرياضة التي يبحث عنها المستخدم يمثل تحديًا، ولكن على الأقل يشير كلا الإصدارين إلى لعبة ما. يمكن أن يعرض Google نتائج لكلا التعريفين لكرة القدم، لكن ذلك لن يمثل تجربة مستخدم جيدة جدًا. لن يفهم الأمريكي الذي يسعى للحصول على اتحاد كرة القدم الأميركي سبب وجود نتائج لكرة القدم في صفحة البحث.

تستطيع Google أن تفلت من إرجاع فئات مختلفة من النتائج في استعلامات غامضة مثل “فتات الخبز” لأن المستخدم يفهم أن فتات الخبز يمكن أن يكون لها معاني متعددة. في لقطة الشاشة أدناه، تعرض Google نتائج للوصفات وعنصر تصميم مسار التنقل ومنتج وكتاب. كل هذه الأمور منطقية، وليس هناك أي معنى لفشل جوجل في تفسير الاستعلام. إن إضافة نتيجة من ثقافة أو لغة أخرى أمر أكثر صعوبة.

بحث Google عن Breadcrumbs لقطة الشاشة 5-30

ويعد هذا تحديًا أكبر بالنسبة لعشرات الأمثلة حيث تعني الكلمة شيئًا واحدًا في لغة ما، ولكن لها معنى مختلف تمامًا في لغة أخرى. في اللغة الإنجليزية، “الهدية” هي شيء لطيف تقدمه للناس، بينما في الألمانية، الهدية هي السم. في فرنسا، كلمة “الألم” هي الخبز، بينما في اللغة الإنجليزية، هو شيء نحاول جاهدين تجنبه. (بالنسبة لبعض الأمثلة غير الملونة، قم بإلقاء نظرة على هذا موضوع رديت.)

تحديد أولويات اللغة لتجربة المستخدم

إذا قامت Google بإرجاع النتائج عبر لغات متعددة، فمن المحتمل أن يعتقد المستخدم أن هناك خطأ ما في Google ويستخدم محرك بحث آخر. والأكثر أهمية في هذه الحالات هو أن يحدد Google اللغة المفضلة للمستخدم بشكل صحيح ويعرض النتائج ذات الصلة فقط.

إذا كانت هناك كلمات أخرى مصاحبة للكلمة متعددة الاستخدام، فيمكن لـ Google استخدامها لمطابقة لغة المستخدم وإرجاع أفضل نتيجة. كما كان من قبل، التحدي الحقيقي هو عندما يكون هناك استعلام من كلمة واحدة فقط.

لمحاولة تحليل لغة المستخدم، ستعتمد Google بشكل كبير على سجل المستخدم السابق مع البحث وفي معظم الأوقات سيكون هذا هو كل ما يحتاجون إليه. من المرجح أن يرغب المستخدم الذي يبحث عادةً باللغة الإنجليزية في الحصول على نتيجة باللغة الإنجليزية. سيكون الاستعلام عن “كرة القدم” الذي يقترب إلى حد ما من الاستعلام عن “Steelers” بمثابة إشارة قوية إلى أن المستخدم غير مهتم بنتائج كرة القدم. التعمق في سجل المستخدم الكامل للمستخدم الذي نقر عليه نتائج كأس العالم في الماضي ربما كنت مهتمًا بنتائج كرة القدم. بالنسبة لأولئك الذين يحبون نظريات المؤامرة، من المحتمل أن تستخدم جوجل بيانات مثل التاريخ السابق لمشاهدة مقاطع الفيديو الرياضية YouTube أو الوقت الذي يتم قضاؤه في المواقع الرياضية باستخدام Doubleclick لإعادة استهداف وحدات البكسل لمنحها صورة أكثر اكتمالًا للمستخدم. (راجع تفضيلات إعلانات Google [Canadian link] لما يعرفونه عن أنشطتك الفردية)

خمسة روافع لتحديد تفضيلات اللغة

ومع ذلك، حتى مع كل البيانات التي جمعوها عن المستخدمين، ستكون هناك حالات كثيرة لن يساعد فيها التاريخ الماضي. في هذه الحالات، يبحث Google في خمس مناطق مختلفة لمساعدتهم في تحديد كيفية تفسير الاستعلام. (أن صفحة دعم Adwords تدعي أنها تستخدم إعدادات المستخدم فقط لـ Adwords على الأقل، ولكن من المرجح أن تصاحب إعلانات اللغات الأخرى أي لغة تحددها لتكون الاستعلام.)

تفضيلات حساب المستخدم

إذا كان لدى المستخدم حساب في Google، ففي الوقت الذي قام فيه بإعداد الحساب، كان عليه إما اختيار اللغة والموقع في عملية الاشتراك أو تم اختياره افتراضيًا. إذا كانت إعدادات المستخدم تشير إلى أن تفضيلاته هي الإنجليزية والولايات المتحدة، فسوف تفترض Google أولاً أن اللغة المحتملة لأي طلب بحث ستكون الإنجليزية الأمريكية. تقوم هذه التفضيلات أيضًا بملء تفضيلات البحث الافتراضية، والتي يمكن العثور عليها ضمن إعدادات البحث في صفحة بحث جوجل.

إذا قرر مستخدم حساب Google أنه يريد بدء رؤية النتائج بلغة أو لغة أخرى، فسيحتاج إلى تغيير تفضيلات اللغة الخاصة به يدويًا. يمكن تغييرها فقط للبحث ضمن خيارات إعدادات البحث أو لجميع منتجات Google ضمن إعدادات الحساب. سيؤثر تغيير تفضيلات اللغة والموقع على أي مكان يجري فيه المستخدم عمليات بحث مسجلة الدخول، بما في ذلك أجهزة الكمبيوتر والأجهزة المحمولة الأخرى.

اعدادات المتصفح

نظرًا لأنه ليس لدى جميع مستخدمي الإنترنت حسابات Google أو يقومون بتسجيل الدخول دائمًا، إذا كانوا من أصحاب حسابات Google، فإن أول نسخة احتياطية من Google لإعدادات اللغة على مستوى الحساب هي إعداد مماثل على مستوى المتصفح. يوجد في جميع المتصفحات الحديثة إعداد افتراضي يعلن عن تفضيلات اللغة الخاصة بالمستخدم. ستستخدم Google موقع المتصفح وتفضيلاته كدليل أساسي لنية لغة المستخدم.

في معظم الحالات، يتم ضبط إعدادات اللغة بشكل افتراضي على الطريقة التي قام بها المستخدم بتثبيت المتصفح. إذا تم تنزيل المتصفح باللغة الإنجليزية من نسخة أمريكية، فمن المحتمل أن يتم تعيينه على اللغة الإنجليزية والولايات المتحدة.

بالنسبة لمتصفح Chrome وFirefox، يمكن تعديل هذه الإعدادات على مستوى المتصفح، ومع ذلك، لتغيير إعدادات IE وSafari، يجب أن يتم ذلك بالفعل على مستوى النظام – وهو تغيير كبير جدًا لإجراء بعض اختبارات Google.

تفضيلات لغة Chrome لقطة الشاشة بتاريخ 14-5-30

تحديد الموقع الجغرافي

في كثير من الأحيان، لا يمنح مجرد الاعتماد على حساب Google أو إعدادات المتصفح خوارزمية Google ثقة كاملة في اللغة المطلوبة للاستعلام. لإضافة درجة أعلى من اليقين، سوف يرون مكان تواجد المستخدم فعليًا.

بشكل عام، يعتمد Google على المواقع الفعلية للمستخدم بشكل كبير من أجل استهداف نتائج البحث بشكل أفضل. سيشاهد المستخدم في الولايات المتحدة الذي يبحث عن “العمالقة” على الساحل الشرقي للولايات المتحدة المزيد من نتائج فريق نيويورك جاينتس في أول نتائج جوجل – حتى خلال فترة الركود في الدوري الوطني لكرة القدم الأمريكية، بينما سيشاهد مستخدم الساحل الغربي المزيد من نتائج سان فرانسيسكو نتائج العمالقة – حتى خلال موسم MLB خارج الموسم.

بالنسبة للعديد من الاستعلامات، لن تكون هناك درجة كبيرة من الاختلاف في نتائج البحث التي يتم إجراؤها على Google.com من مواقع مختلفة، ولكن ستكون هناك بعض الاستعلامات التي تشهد بعض التحولات الرئيسية. على سبيل المثال، سيكون الاستعلام عن كلمة “كرة القدم” متطابقًا تقريبًا في الولايات المتحدة وكندا والمملكة المتحدة؛ بينما سيكون الاستعلام عن كلمة “عطلة” مختلفًا تمامًا في المملكة المتحدة عما هو عليه في الولايات المتحدة.

نطاق المستوى الأعلى لنطاق Google

على الرغم من أن الموقع الفعلي يعد دليلًا مهمًا لهدف لغة المستخدم، إلا أنه نادرًا ما يتجاوز أيًا من إعدادات اللغة على مستوى الحساب أو المتصفح. ومع ذلك، فإن Google TLD (على سبيل المثال، Google.com مقابل Google.co.uk) حيث تم إجراء الاستعلام يمكن أن يتجاوز هذه الإعدادات.

Google.com.br لقطة الشاشة 5-30

عادةً، سينتقل المستخدم الذي قام بتسجيل الدخول إلى Google.com افتراضيًا حتى لو كان مسافرًا خارج الولايات المتحدة. ستتم إعادة توجيه المستخدم الذي لم يسجل الدخول إلى Google TLD المحلي مهما كانت إعدادات المتصفح الخاصة به تشير إلى أنه يفضل اللغة الإنجليزية والولايات المتحدة.

يعد TLD عاملاً مهمًا جدًا في تحديد اللغة التي سيتم عرض النتائج بها، وإذا كان هناك تسلسل هرمي في معالجة تحديد اللغة في Google، فيمكن أن يكون ذلك أولًا أو ببساطة يسير جنبًا إلى جنب مع استهداف الموقع. يمكن أن يكون TLD واحدًا من أفضل الأدلة التي تمتلكها Google بشأن نية اللغة إذا اختار المستخدم عمدًا نطاق TLD المحدد.

على سبيل المثال، من المحتمل جدًا أن يرغب المستخدم في الولايات المتحدة الذي أجرى بحثًا على Google.com.br في رؤية النتائج باللغة البرتغالية. من ناحية أخرى، قد يكون هذا دليلًا سيئًا إذا تم توجيه المستخدم ببساطة إلى TLD هذا من خلال موقعه كمسافر. في مثال المسافر، فإن المقيم في الولايات المتحدة الذي يسافر إلى ألمانيا والذي أجرى بحث Google أثناء تسجيل الخروج من حسابه، سيرى Google.de بشكل افتراضي بسبب موقعه. قد يؤدي اعتماد Google على TLD كمحدد لنية اللغة الخاصة بها إلى إعطاء المستخدم نتائج سيئة.

إذا بحث هذا المستخدم عن كلمة “مفيد” فسوف يرى نتائج متعلقة بالهواتف المحمولة لأن هذا هو ما يستخدمه الألمان للإشارة إلى الهاتف الخليوي. ربما كان المستخدم مهتمًا جدًا بأنواع النتائج التي كان Google سيعرضها في الولايات المتحدة، لكنه لم يتمكن من رؤيتها بسبب اختيار غير صحيح للغة.

عندما تستخدم Google نطاق TLD لافتراضات اللغة، فإنها دائمًا ما تكون افتراضية على اللغة الأساسية لبلد ما. في كندا حيث تكون اللغتان الإنجليزية والفرنسية لغتين رسميتين، فإن الاستعلام عن كلمة “الرغيف الفرنسي” سيعرض نتائج باللغة الإنجليزية على الرغم من أنها كلمة فرنسية من الناحية الفنية. ستحدث نفس الإعدادات الافتراضية في سويسرا، حيث على الرغم من أن اللغات الألمانية والفرنسية والإيطالية يتم التحدث بها على نطاق واسع، فإن Google تفترض دائمًا أن الاستعلام يكون باللغة الألمانية عندما يكون هناك أي شك.

تحليل الاستعلام ومطابقته

وأخيرًا، يحاول Google تحليل الكلمة نفسها بحثًا عن أي أدلة تتعلق باللغة. تقوم الخوارزمية بمطابقة الكلمة نفسها مع الكلمات المطابقة في اللغات الأكثر شيوعًا. بمجرد مطابقة لغة ما عبر كلمة رئيسية، فمن المرجح أن تكون جميع النتائج بتلك اللغة المحددة. يكون هذا أمرًا بسيطًا إلى حد ما عندما تتم كتابة الكلمة بشكل صحيح وتتطابق فقط مع لغة شائعة واحدة. يكون الأمر أكثر تعقيدًا بعض الشيء عندما لا يكون متطابقًا تمامًا.

في هذه الحالات، سيبحث Google عن أشياء مثل المطابقات الإحصائية تجاه الأخطاء الإملائية في لغة معينة مقابل أخرى. يمكن كتابة كلمة “كرة القدم” على أنها “futbal” و”futbol” و”futball”، لذا سيحاول Google التخمين باستخدام بقية القرائن لتحديد ما إذا كان المستخدم قد ارتكب خطأً إملائيًا أو ما إذا كانت النتائج في لغة أخرى صحيحة أم لا. طلب. بالنسبة لأي قراء ذوي تفكير تقني، يمكن الحصول على مزيد من التفاصيل حول هذه العملية من موقع Google براءة اختراع حول هذا الموضوع.

TLDR

تركز عمليات تحسين محركات البحث (SEO) عادةً على جوانب خوارزمية Google التي تحدد الموضع الذي يجب أن يتم فيه تصنيف صفحة الويب. في الواقع، تعتبر خوارزمية جوجل أكثر تعقيدًا بكثير من ترتيب المحتوى على أساس النتائج. إنهم في الواقع بحاجة إلى إجراء تحليل في الوقت الفعلي لكل استعلام لتحديد لغة المستخدم قبل أن يتمكنوا حتى من البدء في استرداد المواقع من الفهرس وتحديد تصنيف كل صفحة من هذه الصفحات.

آمل أن تكون هذه النظرة الموجزة حول كيفية تحديد Google للغة الاستعلامات قد أعطتك بعض المواد المثيرة للاهتمام للتفكير في مدى صعوبة عمل Google لإرضاء المستخدم وتوفير مستوى عالٍ من الجودة في نتائجه. لم أجد أي مصدر في Google يشاركني في كيفية تحديد التصنيف، والنتائج المذكورة أعلاه جاءت من بحثي الخاص. إذا كنت قد اكتشفت أو تعرف شيئًا مختلفًا، فأنا أحب أن أسمع المزيد عنه.

صورة مميزة عبر فليكر