الأخبار التكنولوجية والاستعراضات والنصائح!

قائمة نماذج الذكاء الاصطناعي الرائدة والمفتوحة المصدر للمحادثة في مجال اللغة

ستساعدك المقالة التالية: قائمة نماذج الذكاء الاصطناعي الرائدة والمفتوحة المصدر للمحادثة في مجال اللغة

يشير الذكاء الاصطناعي للمحادثة إلى تقنية مثل وكيل افتراضي أو روبوت محادثة يستخدم كميات كبيرة من البيانات ومعالجة اللغة الطبيعية لتقليد التفاعلات البشرية والتعرف على الكلام والنص. في السنوات الأخيرة ، تطور مشهد الذكاء الاصطناعي للمحادثة بشكل كبير ، لا سيما مع إطلاق ChatGPT. فيما يلي بعض نماذج اللغات الكبيرة الأخرى مفتوحة المصدر (LLMs) التي تحدث ثورة في الذكاء الاصطناعي للمحادثات.

  • تاريخ الافراج عنه: 24 فبراير 2023

LLaMa هو ماجستير تأسيسي تم تطويره بواسطة Meta AI. تم تصميمه ليكون أكثر تنوعًا ومسؤولية من الطرز الأخرى. يهدف إصدار LLaMA إلى إضفاء الطابع الديمقراطي على الوصول إلى مجتمع البحث وتعزيز ممارسات الذكاء الاصطناعي المسؤولة.

يتوفر LLaMa في عدة أحجام ، حيث يتراوح عدد المعلمات من 7B إلى 65B. سيتم منح إذن الوصول إلى النموذج على أساس كل حالة على حدة لمختبرات أبحاث الصناعة والباحثين الأكاديميين ، إلخ.

  • تاريخ الافراج عنه: 8 مارس 2023

Open Assistant هو مشروع تم تطويره بواسطة LAION-AI لتزويد الجميع بنموذج لغة كبير قائم على الدردشة. من خلال التدريب المكثف على كميات هائلة من النصوص والتعليمات البرمجية ، اكتسب القدرة على أداء مهام مختلفة ، بما في ذلك الرد على الاستفسارات ، وإنشاء نص ، وترجمة اللغات ، وإنتاج محتوى إبداعي.

على الرغم من أن OpenAssistant لا يزال في مرحلة التطوير ، فقد اكتسب بالفعل العديد من المهارات ، مثل التفاعل مع أنظمة خارجية مثل بحث Google لجمع المعلومات. بالإضافة إلى ذلك ، فهي مبادرة مفتوحة المصدر ، مما يعني أنه يمكن لأي شخص المساهمة في تقدمها.

  • تاريخ الافراج عنه: 8 مارس 2023

Dolly هو LLM يتبع التعليمات تم تطويره بواسطة Databricks. يتم تدريبه على منصة التعلم الآلي Databricks المرخصة للاستخدام التجاري. يتم تشغيل Dolly بواسطة نموذج Pythia 12B وتم تدريبه على مجموعة واسعة من سجلات التعليمات / الاستجابة التي يبلغ مجموعها 15 ألفًا تقريبًا. على الرغم من أن أداء Dolly في الإرشادات التالية ليس متطورًا ، إلا أنه عالي الجودة بشكل مثير للإعجاب.

  • تاريخ الافراج عنه: 13 مارس 2023

الألبكة هو نموذج صغير لمتابعة التعليمات تم تطويره بواسطة. يعتمد على نموذج Meta LLaMa (معلمات 7B). إنه مصمم لأداء جيد في العديد من مهام متابعة التعليمات مع سهولة ورخيصة التكاثر في نفس الوقت.

على الرغم من أنه يشبه نموذج OpenAI text-davinci-003 ، إلا أنه أرخص بكثير (أقل من 600 دولار) لإنتاجه. النموذج مفتوح المصدر وقد تم تدريبه على مجموعة بيانات من 52000 عرض تعليمي لاتباع التعليمات.

تم تطوير Vicuna بواسطة فريق من UC Berkeley و CMU و Stanford و UC San Diego. إنه روبوت محادثة تم تدريبه من خلال ضبط نموذج LLaMa على المحادثات التي يشاركها المستخدمون والتي تم جمعها من ShareGPT.

استنادًا إلى بنية المحولات ، يعد Vicuna نموذجًا للغة الانحدار التلقائي ويوفر إمكانات محادثة طبيعية وجذابة. باستخدام معامِلات 13B ، تُنتج إجابات أكثر تفصيلاً وجيدة التنظيم من Alpaca ، كما أن جودتها تضاهي جودة ChatGPT.

  • تاريخ الافراج عنه: 3 أبريل 2023

قام مختبر بيركلي لأبحاث الذكاء الاصطناعي (BAIR) بتطوير Koala ، وهو نموذج حوار يعتمد على. من المفترض أن تكون أكثر أمانًا وقابلية للتفسير بسهولة أكثر من LLMs الأخرى. تم ضبط كوالا بدقة على بيانات التفاعل المتاحة مجانًا ، مع التركيز على البيانات التي تتضمن التفاعل مع نماذج عالية القدرة مغلقة المصدر.

الكوالا مفيد لدراسة سلامة النموذج اللغوي والتحيز وفهم الأعمال الداخلية لنماذج لغة الحوار. بالإضافة إلى ذلك ، يعد Koala بديلاً مفتوح المصدر لـ ChatGPT يتضمن EasyLM ، وهو إطار عمل للتدريب وضبط LLMs.

أنشأ Eleuther AI مجموعة من نماذج اللغة الانحدارية تسمى Pythia ، والتي تم تصميمها لدعم البحث العلمي. تتكون Pythia من 16 نموذجًا مختلفًا تتراوح من 70M إلى 12B معلمات. يتم تدريب جميع النماذج باستخدام نفس البيانات والبنية ، مما يسمح بإجراء مقارنات واستكشاف كيفية تطورها مع القياس.

  • تاريخ الافراج عنه: 5 أبريل 2023

قام معًا بتطوير OpenChatKit ، وهو إطار تطوير روبوت محادثة مفتوح المصدر يهدف إلى تبسيط وتبسيط عملية إنشاء تطبيقات الذكاء الاصطناعي للمحادثة. تم تصميم chatbot للمحادثة والتعليمات ويتفوق في التلخيص وإنشاء الجداول والتصنيف والحوار.

باستخدام OpenChatKit ، يمكن للمطورين الوصول إلى أساس قوي ومفتوح المصدر لإنشاء روبوتات محادثة متخصصة وعامة الأغراض لتطبيقات مختلفة. تم بناء إطار العمل على بنية GPT-4 وهو متاح بثلاثة أحجام نماذج مختلفة – 3B و 6 B و 12 B – لاستيعاب الموارد الحسابية المتنوعة ومتطلبات التطبيق.

  • تاريخ الافراج عنه: 13 أبريل 2023

RedPajama هو مشروع أنشأه فريق من Together و Ontocord.ai و ETH DS3Lab و Stanford CRFM و Hazy Research و MILA Québec AI Institute. هدفهم هو تطوير نماذج مفتوحة المصدر من الدرجة الأولى ، بدءًا من إعادة إنتاج مجموعة بيانات التدريب LLaMA التي تحتوي على أكثر من 1.2 تريليون رمز.

يهدف هذا المشروع إلى إنشاء نموذج لغوي مفتوح تمامًا وقابل للتكرار ومتطور مع ثلاثة عناصر أساسية: بيانات ما قبل التدريب ، والنماذج الأساسية ، وبيانات ونماذج ضبط التعليمات. يمكن الوصول إلى مجموعة البيانات حاليًا من خلال Hugging Face ، ولدى المستخدمين خيار نسخ النتائج باستخدام البرامج النصية Apache 2.0 ، المتوفرة على GitHub.

  • تاريخ الافراج عنه: 19 أبريل 2023

StableLM هو نموذج لغة مفتوح المصدر تم تطويره بواسطة Stability AI. يتم تدريب النموذج على مجموعة بيانات تجريبية أكبر بثلاث مرات من مجموعة بيانات The Pile وهو فعال في مهام المحادثة والترميز على الرغم من صغر حجمه. يأتي النموذج بمعلمات 3B و 7B ، مع نماذج أكبر لم يأت بعد.

يمكن لـ StableLM إنشاء كل من النص والتعليمات البرمجية ، مما يجعلها مناسبة للعديد من تطبيقات المصب. يوفر الذكاء الاصطناعي الاستقرار أيضًا سلسلة من نماذج البحث المحسّنة من خلال التعليمات ، باستخدام مزيج من خمس مجموعات بيانات محدّثة ومفتوحة المصدر مصممة خصيصًا لوكلاء المحادثة. هذه النماذج الدقيقة مخصصة للبحث حصريًا ومتاحة بموجب ترخيص CC BY-NC-SA 4.0 غير تجاري.