الأخبار التكنولوجية والاستعراضات والنصائح!

يقوم بحث MSN بتحديث النتائج بناءً على RankNet

ستساعدك المقالة التالية: يقوم بحث MSN بتحديث النتائج بناءً على RankNet

يقوم بحث MSN بتحديث النتائج بناءً على RankNet

إلى جانب الأخبار التي تم إطلاقها أمس، MSN Local، تسلل الأشخاص في MSN Web Search إلى تحديث لنتائج البحث الخاصة بهم باستخدام خوارزمية تعتمد على ما تسميه MSN RankNet. تبدو نتائج البحث أكثر صلة بالاستعلام وتشعر MSN أن RankNet “قد تحسنت”. [their] أهمية والأهم من ذلك يعطي [them] منصة يمكنهم المضي قدمًا عليها. تعتمد تقنية التصنيف الجديدة على الشبكة العصبية، وهو ما ناقشته شركة مايكروسوفت في ورقة بحثية برئاسة كريس بورجس بعنوان تعلم الترتيب باستخدام النزول المتدرج.

من الواضح، باستخدام RankNet، أن العمل الإضافي لـ MSN قد حكم على المواقع التي تعتبر مواقع عالية الجودة ودفعها ببطء إلى قمة التصنيف. في رسم تخطيطي، تعرض MSN نتائجها من أوائل مايو وأواخر مايو والآن يونيو وكيف تغيرت نتائجها لإظهار المزيد من مواقع الجودة والاعتماد في أهم نتائج MSN. بالإضافة إلى ذلك، في مدونة بحث MSN، يستخدم كين موس، المدير العام لبحث MSN، أمثلة يابانية (باللغة الرومانية) لعرض النتائج الجديدة:

Sagoii desu na dakedo doshite Nihongo no tatueba tsukaimasuka؟

هممم.. لماذا الأمثلة اليابانية كين؟ حسنًا، يبدو أن بعض براءات اختراع تكنولوجيا البحث التي كانت ملفات قدمتها Microsoft مؤخرًا قد تم تقديمها بواسطة باحثين من Microsoft في اليابان. نحن نبحث أكثر في هذا الأمر وفي بحثنا حددنا براءتي اختراع أخريين من Microsoft تتناولان تقنية RankNet وNeural Net.

براءة الاختراع الأولى التي تم تحديدها هي “طريقة لمسح وتحليل ومعالجة أنواع مختلفة من محتوى المعلومات الرقمية” والذي يذكر الشبكة العصبية في الملخص :

يتم وصف الأساليب التي يتم تنفيذها بواسطة الكمبيوتر، أولاً، لتمييز فئة معينة من محتوى المعلومات – المواد الإباحية، على سبيل المثال – ثم تحديد أمثلة تلك الفئة من المحتوى بدقة ضمن تدفق الوسائط في الوقت الفعلي، مثل صفحة الويب أو البريد الإلكتروني أو مجموعة بيانات رقمية أخرى. تتيح تقنية التعرف على المحتوى هذه فئة جديدة من التطبيقات القابلة للتطوير بدرجة كبيرة لإدارة هذا المحتوى، بما في ذلك التصفية والتصنيف وتحديد الأولويات والتتبع وما إلى ذلك. التطبيق التوضيحي للاختراع هو منتج برمجي للاستخدام مع برنامج عميل متصفح الويب لـ فحص الوصول إلى صفحات الويب التي تحتوي على مواد إباحية أو غيرها من المحتويات الضارة أو المسيئة. يتم تشكيل مجموعة السمات المستهدفة للتعبير العادي، مثل كلمات و/أو عبارات اللغة الطبيعية، من خلال التحليل الإحصائي لعدد من عينات مجموعات البيانات التي تتميز بأنها “تحتوي على”، ومجموعة أخرى من العينات التي تتميز بأنها “لا تحتوي على” المحدد فئة محتوى المعلومات. يتم تنقيح قائمة التعبيرات هذه من خلال تطبيق تحليل الارتباط على العينات أو “بيانات التدريب”. يتم بعد ذلك تطبيق تقنيات التغذية الأمامية للشبكة العصبية، مرة أخرى باستخدام مجموعة بيانات تدريب كبيرة، لتعيين أوزان نسبية بشكل تكيفي لكل تعبير من التعبيرات في مجموعة السمات المستهدفة، وبالتالي تشكيل قائمة منتظرة تتنبأ بشكل كبير بفئة محتوى المعلومات محل الاهتمام .

وكان كريس بورجس، المذكور في منشور مدونة بحث MSN والمؤلف الرئيسي لورقة “تعلم التصنيف باستخدام التدرج اللوني”، أحد المؤلفين المشاركين لطلب براءة الاختراع هذا الذي يصف الشبكة العصبية؛ ” نظام وطريقة لتحديد المحتوى وإدارة المعلومات المقابلة للأشياء الموجودة في الإشارة.” الملخص:

يوفر “محلل الإشارة التفاعلي” إطارًا لأخذ عينات من إشارة واحدة أو أكثر، مثل، على سبيل المثال، قناة واحدة أو أكثر عبر طيف راديو FM بأكمله في منطقة جغرافية واحدة أو أكثر، لتحديد الأشياء محل الاهتمام ضمن محتوى الإشارة وربطها السمات مع هذا المحتوى. يستخدم محلل الإشارات التفاعلي خوارزمية استخراج بصمات الأصابع، أي “محرك بصمات الأصابع”، لاشتقاق آثار من أجزاء من إشارة واحدة أو أكثر. ويشار إلى هذه الآثار باسم “بصمات الأصابع” لأنها تستخدم لتحديد مقاطع الإشارة التي اشتقت منها بشكل فريد. يتم بعد ذلك استخدام بصمات الأصابع هذه للمقارنة بقاعدة بيانات لبصمات الأصابع للأشياء المعروفة محل الاهتمام. يتم بعد ذلك توفير المعلومات التي تصف المحتوى المحدد وسمات الكائن المرتبطة به في قاعدة بيانات مستخدم تفاعلية لعرض المعلومات الناتجة عن مقارنة بصمات الأصابع بقاعدة البيانات والتفاعل معها.

شكر خاص ل بيل سلاوسكي للإشارة إلى بعض براءات الاختراع هذه.