الأخبار التكنولوجية والاستعراضات والنصائح!

مقارنة تكنولوجيا محركات البحث جوجل وياهو

ستساعدك المقالة التالية: مقارنة تكنولوجيا محركات البحث جوجل وياهو

مع كثرة الحديث عن مدى الصلة بالموضوع هذه الأيام، فكرت في أن أقدم لك بعضًا من التقنيات التي يعتمد عليها محرك البحث، وما هي الاختلافات المحتملة بينهما. هناك بعض الأمور المثيرة للاهتمام في تكنولوجيا البحث بدءًا من نتائج التصنيف المسبق بسرعة إلى الشبكات العصبية وحتى البحث المجتمعي.

مقارنة “الأربعة الكبار”

في هذه المقالات، سأركز على “الأربعة الكبار”. هذه هي المحركات التي تعتبر مالكة لمساحة البحث. وهم Google، وYahoo!، وMSN، وAsk Jeeves. أولًا سيكون Google وYahoo!

Google – ربما يكون Google هو محرك البحث الأكثر شهرة. عندما تم إطلاقها، كانت تعتبر الأكثر أهمية.

كيف يعمل جوجل

لقد حددوا الملاءمة في المقام الأول على خوارزمية PageRank الخاصة بهم. يشير نظام PageRank بشكل أساسي إلى أن الموقع الذي يحتوي على روابط واردة أكثر من منافسيه من المحتمل أن يكون موقعًا أفضل، وبالتالي يجب أن يحصل على مرتبة أعلى. وسرعان ما أدرك مشرفو المواقع ذلك، وأدركوا أيضًا أن كل ما كان عليهم فعله هو بناء عدد متزايد من الروابط – روابط كافية للتفوق على منافسيهم – من أجل الحصول على مرتبة عالية. كان رد فعل Google بالطبع هو تغيير خوارزمية التصنيف إلى حد ما. توجد الآن عناصر السلطة والملاءمة المطبقة على خوارزمية PageRank.

آلية عمل Google هي أنه بمجرد الزحف إلى الصفحات وفهرستها بواسطة Googlebot (راجع مقالتي السابقة عن عناكب محركات البحث) يتم إرجاعها إلى Google لتصنيفها.

توظف Google آلاف الخوادم لحساب هذه التصنيفات. إنهم ينظرون إلى مئات العوامل – سواء داخل الصفحة أو خارجها (مثل الروابط الواردة). يستخدمون مئات الخوارزميات لإجراء هذه الحسابات. في الأساس يجب أن تكون هناك خوارزمية واحدة لكل عامل. تقوم الخوارزميات بوزن الصفحات وتعيين قيمها. ثم يتم تخزين هذه القيم لاستخدامها لاحقا.

عندما يقوم المستخدم بإجراء استعلام، تقوم مجموعة أخرى من الخوارزميات بمقارنة القيم المحسوبة مسبقًا مع بعضها البعض لتحديد مدى الصلة الإجمالية. ثم يتم إخراج النتائج إلى متصفح المستخدمين.

وكما يمكن للمرء أن يتخيل، فإن هذا النوع من متطلبات طاقة المعالجة يجب أن يكون ضخمًا. بالإضافة إلى ذلك، واستنادًا إلى مدى سرعة Google في إرجاع النتائج، لا يمكن كتابة الكثير من البيانات على محركات الأقراص الثابتة للخوادم الفردية. لذلك، يجب على المرء أن يفترض أن معظم فهرس Google موجود فعليًا في الذاكرة. أو على الأقل الأجزاء التي يتم تقديمها للمستخدمين.

في المرة التالية التي تقوم فيها بإجراء بحث، انظر إلى مدى سرعة إرجاع Google للنتائج. لقد بحثت عن “محرك serach” (لقد أخطأت في كتابته عمدًا) وظهر لي 68900 نتيجة. بالإضافة إلى ذلك، أعاد المحرك بعض النتائج الدعائية على جانب الصفحة، بالإضافة إلى اقتراح إملائي. كل ذلك في 0.36 ثانية.

وبالنسبة للاستعلامات الشائعة، يكون المحرك أسرع. على سبيل المثال، استغرقت عمليات البحث عن إعصار كاترينا أو جوائز MTV (كلا الحدثين الأخيرين) أقل من 0.2 ثانية لكل منهما.

وتشتهر شركة جوجل باللامركزية والتكرار. لكل صفحة مخبأة هناك على الأرجح 2-3 نسخ مخزنة، وربما أكثر. تقوم Google بتقسيم الفهرس إلى أجزاء صغيرة جدًا – يصل حجم كل منها إلى 2 ميجابايت، وكما ذكرت سابقًا، يتم تخزين هذه الأقسام التي يبلغ حجمها 2 ميجابايت في جميع أنحاء البنية التحتية لـ Google. قد يتم تخزين كل قسم بحجم 2 ميجابايت بجوار قسم غير ذي صلة. على سبيل المثال، قد تكون هناك بضع صفحات من موقع للحيوانات الأليفة بجوار صفحات من مدونة، بجوار صفحات من موقع للتجارة الإلكترونية.

بينما يعمل كل مركز بيانات بشكل مستقل عن الآخر، فمن المحتمل أن يكون هناك بعض التداخل في المهام.

تخيل غرفة بها آلاف أجهزة الكمبيوتر التي تعمل في انسجام تام مع بعضها البعض. الآن تخيل أن نفس الغرفة تم نسخها مرارًا وتكرارًا إلى جميع مراكز البيانات الأخرى المنتشرة في جميع أنحاء أمريكا الشمالية.

وبسبب مراكز البيانات المختلفة هذه، التي يعمل كل منها على حدة، ولكن بنفس الهدف النهائي، اعتدنا على تجربة “Google Dance” شهريًا. كانت Google Dance هي تلك الفترة الزمنية التي تقوم فيها Google بتحديث نتائج البحث الخاصة بها عبر مراكز البيانات. علاوة على ذلك، سيتم تحديث كل مركز بيانات من تلقاء نفسه، لذا فإن الصفحات التي ربما احتلت المرتبة الأولى في أحد مراكز البيانات قد لا تظهر ضمن أفضل 30 مركز بيانات في مراكز البيانات الأخرى.

بالطبع تغيرت العوامل التي استخدمها Google لتصنيف الصفحات بمرور الوقت. إنهم يركزون بشكل أقل على نظام ترتيب الصفحات، لكنه لا يزال مهمًا. من المهم ملاحظة أن تحريك العوامل المختلفة داخل الحساب يمكن أن يؤثر بشكل كبير على تصنيفات الموقع. على سبيل المثال، إذا كان الموقع يتمتع بتصنيف صفحات مرتفع، ولكن كثافة الكلمات الرئيسية منخفضة، فقد يحتل المرتبة الأولى إذا أثر نظام ترتيب الصفحات على الحساب لاحقًا، ومع ذلك قد يختفي الموقع من النتائج إذا تم أخذ نظام ترتيب الصفحات في الاعتبار مسبقًا.

وربما هذا هو ما يحدث الآن – فقد نقلت Google بشكل أساسي عامل PageRank إلى مكان آخر في الحساب النهائي. تذكر أنه من المحتمل أن يكون هناك مئات العوامل التي تؤثر على التصنيف. ومن خلال إعادة ترتيب الترتيب الذي يتم تطبيقها به على التصنيفات النهائية، يمكن أن يكون لها تأثير كبير على الموضع العام على صفحة نتائج البحث.

يبدو أيضًا أن Google قد انتقلت من التحديث مرة واحدة شهريًا إلى فهرس يتم تحديثه بشكل دائم. نادرًا ما نلاحظ حدوث التغييرات، ولكنها تحدث على مستوى أكثر تدريجيًا، مع حدوث المزيد من التحديثات الرئيسية بشكل أقل تكرارًا.

أعتقد أنه يمكن للمرء أن ينظر إلى Google على أنه سلسلة من الطبقات – كل طبقة مبنية على العمل الذي قامت به الطبقة السابقة. الطبقة العليا هي الطبقة الوحيدة التي نتعرض لها عبر المتصفح، إلا أن تلك الصفحة التي تراها لم تكن لتوجد لولا العمل الذي تقوم به الطبقات السفلية.

الآن، دعونا ننظر إلى ياهو

ياهو! – في حين لا أحد غير مهندسي ياهو يعرف على وجه اليقين، يمكننا أن نتكهن بأن ياهو! تعمل تقنية البحث بشكل مشابه جدًا لتقنية Google

السبب ياهو! من الصعب جدًا قياسه لأنهم لم يبنوا بالفعل محرك بحث من الألف إلى الياء مثل Google أو MSN. بالطبع ياهو! البحث الذي تراه فريد في حد ذاته، ولكن Yahoo! قامت ببناء بحثها على أساس التقنيات الأخرى التي اشترتها في السنوات السابقة.

كان ذلك في عيد الميلاد عام 2002 تقريبًا عندما قامت شركة Yahoo! خدمة البحث المشتراة Inktomi. حتى ذلك الحين ياهو! قد تلقوا نتائج البحث الخاصة بهم إما من Inktomi أو من Google مؤخرًا. في الواقع، حتى وقت شراء Inktomi كانت هناك تكهنات بأن شركة Yahoo! سوف تشتري جوجل.

لقد مرت بضعة أشهر فقط بعد ذلك قامت شركة Overture (شركة إعلانات الدفع لكل نقرة) بشراء Altavista – أحد أول وأقوى محركات البحث الموجودة هناك. ثم، بعد بضعة أسابيع فقط من قيام المقدمة بشراء Alltheweb.com من FAST.

كان من الواضح أن المقدمة ستنتقل إلى مساحة البحث الخوارزمي.

ولكن بعد وقت قصير من بدء هذه التذمر، قامت شركة Yahoo! قد تكون مهتمًا بشراء بعض أو كل تقنيات المقدمة. وفي يوليو 2003، قامت شركة ياهو! لقد اشترى بالفعل المقدمة.

لم نسمع الكثير عن ياهو! البحث حتى فبراير 2004 – وذلك عندما أطلقت الشركة نسختها الخاصة من البحث الخوارزمي. ولم يكن الأمر كما توقعه الكثيرون. اعتقد البعض أنهم ببساطة سيغيرون العلامة التجارية لـ Inktomi، بينما اعتقد آخرون أنهم سيعيدون تسمية إحدى مشتريات المقدمة ويحولون بحث Altavista أو Alltheweb إلى Yahoo! يبحث.

ولكن هذا ليس ما حدث. ياهو! قاموا ببناء بحثهم الخاص، وجمعوا ميزات من جميع التقنيات التي يمتلكونها.

كان لديهم برامج الزحف Inktomi وAltavista فائقة السرعة، بالإضافة إلى خوارزميات التصنيف Alltheweb وAltavista الجيدة بشكل مدهش. لذلك قاموا بدمج ذلك معًا للحصول على Yahoo! يبحث.

ياهو! البحث لا يختلف كثيرا عن جوجل. هُم يقول موقع الويب الخاص أنهم يقومون بتحليل الصفحات باستخدام العديد من العوامل لتحديد مدى صلتها باستعلام بحث، ونتائج هذا التحليل هي ما يراه المستخدم عند إجراء استعلام.

بالطبع ياهو! مثل جميع المحركات الأخرى، أمضى العام الماضي أو أكثر في العمل على تحسين خوارزميات التصنيف الخاصة به. عندما ظهروا لأول مرة، بدا أنهم ركزوا كثيرًا على الصفحة الرئيسية لموقع معين، مع تركيز أقل على الروابط الواردة، أو حتى صفحات الموقع الأخرى.

ومع ذلك، لاحظنا خلال الأشهر القليلة الماضية تحولًا طفيفًا من تصنيفات الصفحة الرئيسية فقط إلى تصنيف صفحات مواقع متعددة حيث تم تصنيف الصفحة الرئيسية في السابق.

بالإضافة إلى ذلك، فإنهم يميلون إلى تصنيف الروابط الواردة بشكل مختلف عن جوجل. عندما تقوم بإجراء فحص الارتباط على Google ونفس الفحص على Yahoo! تميل نتائج Google دائمًا إلى أن تكون أقل. تقول Google إن السبب في ذلك هو أنها تعرض فقط لقطة من الروابط “ذات الصلة” بينما تعرض Yahoo! يظهر لهم جميعا بغض النظر عن أهميتها.

وهناك اختلافات أخرى أيضًا، ولكن هناك الكثير مما يجب تناوله في هذه المقالة.

ويكفي أن نقول أن جوجل وياهو! استخدم نفس التقنية تقريبًا للحصول على نتائج مماثلة. من المؤكد أنك سترى اختلافات في التصنيف العالمي، ولكن هذا يرجع إلى أشياء كثيرة. على سبيل المثال، ياهو! يبدو أنه يتم تحديثه بشكل أقل تكرارًا من Google. لقد عملت مع مواقع تحتوي على صفحات جديدة مفهرسة وتصنيفها في Google خلال أيام من إنشائها، وفي بعض الأحيان قد يستغرق الأمر شهورًا بالنسبة لـ Yahoo! لفعل نفس الشيء.

ما أقوله بشكل أساسي هو هذا: إذا كان كل ما يهمك هو التصنيف – فإن التحسين لـ Google سيمنحك تصنيفات جيدة في Yahoo! ولكن قد يستغرق الأمر وقتًا أطول حتى تظهر في Yahoo! نتائج البحث. وذلك لأن التكنولوجيا التي تقف وراء كل من Yahoo! وجوجل مشابه جدًا.

ومع ذلك، سأقدم لك غدًا محركين فريدين. واحدة تدعي أنها تستخدم تقنية الشبكة العصبية وواحدة تستخدم المجتمع كأساس لتصنيفاتها.

روب سوليفان وسطاء الارتباط النصي هو متخصص في تحسين محركات البحث ومستشار التسويق عبر الإنترنت.

صورة مميزة: إيداع الصور

في صورة المشاركة: إيداع الصور