الأخبار التكنولوجية والاستعراضات والنصائح!

Digg تطرح تقنية جديدة للكشف عن تكرار المحتوى

ستساعدك المقالة التالية: Digg تطرح تقنية جديدة للكشف عن تكرار المحتوى

أعلن موقع Digg يوم الثلاثاء أنهم بدأوا أخيرًا طرح بعض التحديثات الرئيسية لتقنية الكشف عن التكرارات، ولنكن صادقين – لقد حان الوقت! التكنولوجيا التي كانت لديهم من قبل لم تكن موثوقة.

الطريقة التي كانت تعمل بها هي أنك تقوم بإدخال عنوان URL الخاص بك وجميع تفاصيل القصة التي ترسلها، وبعد القيام بكل ذلك، سيسألك Digg عما إذا كنت متأكدًا من عدم حدوث ذلك. مكررة. بالإضافة إلى ذلك، سيُظهر لك قائمة بالقصص التي يعتقد أنها قد تكون مشابهة لقصتك. لم يكن العديد منها مرتبطًا بأي شيء على الإطلاق، وبعضها تم تقديمه منذ أيام أو أسابيع أو حتى أشهر. ومع ذلك، إذا أكدت لـ Digg أن الرابط الخاص بك لم يكن في الواقع نسخة مكررة (حتى لو كان كذلك)، فيمكنك المتابعة وإرسال الرابط الخاص بك.

وفقًا لـ Digg وBrent Csutoras، فقد قاموا بتحديث الطريقة التي تبحث بها برامجهم عن التكرارات. وقالوا إن الأنواع الأكثر شيوعًا للقصص المكررة التي يتم إرسالها هي نفس القصص من نفس الموقع، ولكن مع عناوين URL مختلفة. لذا، قاموا بحل هذه المشكلة، وابتكروا حلاً من شأنه تحديد هذه التكرارات باستخدام خوارزمية تشابه المستندات. بمعنى آخر، أصبح الآن قادرًا على تحديد محتوى متطابق من نفس المصدر.

هناك مشكلة أخرى وهي نفس القصة أو قصة مشابهة يتم تناولها في مواقع مختلفة. هنا تصبح الأمور أكثر تعقيدًا بعض الشيء. يدعي Digg أنهم عملوا على القيام بعمل أفضل في اكتشاف التكرارات التي تحتوي على معلومات وصفية مماثلة. لن تقوم برامجهم بمطابقة القصص ذات العناوين والأوصاف المماثلة بمستوى أعلى من الدقة. لا يبدو أن هذا هو الحل الأمثل، ولكن أي تحسن سيكون أفضل مما كان عليه من قبل.

كما تم تغيير ترتيب تقديم المعلومات. قبل أن يقوم Digg بالتحقق من التكرارات حتى تقوم بإدخال عنوان URL الخاص بك وجميع المعلومات الوصفية، لذلك إذا كانت هناك نسخ مكررة فلن تكتشفها إلا بعد إضاعة عدة دقائق من وقتك. الآن سيتم التحقق من التكرارات فورًا بعد إدخال عنوان URL الخاص بك، ولكن قبل إدخال معلومات وصفية.

لا تزال هذه التغييرات قيد التطوير، لذا خلال الفترة التجريبية الآن، سيستمر Digg في حظر عمليات الإرسال لعناوين URL نفسها خلال فترة 30 يومًا فقط. وسوف يقومون أيضًا بمراقبة متى يتجاوز مستخدمو Digg التكرارات عالية الثقة.

إذا كان يساعد في محاربة وابل البريد العشوائي الذي لا ينتهي، فإن التقدم يعد أمرًا جيدًا.