blogs5مراجعة Lionbridge: احصل على 12 دولارًا أمريكيًا في الساعة لتقييم نتائج Google عبر الإنترنت4 min read
blogs5تعلن شركة OpenAI عن Evals ، وهو إطار برنامج مفتوح المصدر لتقييم نماذج الذكاء الاصطناعي2 min read
blogs5طريقة جديدة لتقييم أداء النماذج المدربة بالبيانات التركيبية عند تطبيقها على بيانات العالم الحقيقي4 min read
blogs5أصدرت Microsoft AI إصدار NTREX-128: مجموعة بيانات جديدة لتقييم الترجمة الآلية (MT) من الإنجليزية إلى إجمالي 128 لغة هدف3 min read
blogs5قابل XTREME-UP: معيار لتقييم النماذج متعددة اللغات مع تقييم البيانات النادرة ، مع التركيز على اللغات غير الممثلة3 min read
blogs5تلبية LLMScore: خط أنابيب جديد لمطابقة التعليمات والمتابعة المستندة إلى LLM لتقييم المحاذاة بين موجهات النص والصور المركبة في تركيب نص إلى صورة5 min read
Blogs4سيتم استخدام الذكاء الاصطناعي لتقييم آثار الحجر الصحي في مكافحة الفيروس التاجي الجديد3 min read