الأخبار التكنولوجية والاستعراضات والنصائح!

يُطلق OpenAI برنامج Chatbot قوي الدردشة ChatGPT AI

ستساعدك المقالة التالية: يُطلق OpenAI برنامج Chatbot قوي الدردشة ChatGPT AI

ChatGPT ، على عكس GPT-3 ، هو نموذج تم تعليمه بعناية لإجراء محادثة تفاعلية والحفاظ على تدفق الخطاب. النموذج المستخدم لتدريب ChatGPT ، والذي تم تدريبه في أوائل عام 2022 ، هو من سلسلة GPT-3.5.

يمكّن تنسيق الحوار ChatGPT من الرد على استفسارات إضافية ، والاعتراف بأخطائه ، ودحض الافتراضات الخاطئة ، ورفض الطلبات غير ذات الصلة. روبوت الدردشة ذكي للغاية وقد يُنشئ رسائل ويخرج بنكات مضحكة ويرد على الاستفسارات.

تمامًا مثل InstructGPT ، استخدمت OpenAI التعلم المعزز من التعليقات البشرية (RLHF) لتدريب هذا النموذج ، مع بعض الاختلافات الطفيفة في ترتيب جمع البيانات. يستخدم OpenAI الضبط الدقيق الخاضع للإشراف لتدريب نموذج أولي من خلال جعل مدربي الذكاء الاصطناعي البشري يعملون كمستخدم ومساعد AI في الدردشات. لقد وفرت للمدربين إمكانية الوصول إلى نماذج من توصيات الكتابة لمساعدتهم في تكوين ردودهم.

عالق الكثير من الأشخاص في حلقة ChatGPT لعنة جنونية 🔁

– إيلون ماسك (elonmusk) 1 ديسمبر 2022

يتم عرض بعض عينات الحوار في الصور.

كان من الضروري جمع بيانات المقارنة ، والتي تتكون من إجابتين نموذجيتين أو أكثر مصنفة حسب الجودة ، من أجل تطوير نموذج مكافأة للتعلم المعزز. سجل المطورون المناقشات التي أجراها مدربو الذكاء الاصطناعي مع روبوت المحادثة من أجل جمع هذه المعلومات. اختار المبدعون بيانًا مكتوبًا نموذجيًا بشكل عشوائي ، وأخذوا عينات من عدد من الاستنتاجات المحتملة ، وطلبوا من مدربي الذكاء الاصطناعي ترتيبها. يمكنه ضبط النموذج باستخدام Proximal Policy Optimization باستخدام نماذج المكافآت هذه.

تحدث إلى برنامج الدردشة هذا هنا. ومع ذلك ، فإن الخوادم ممتلئة حاليًا.

اقرأ المزيد عن GPT-3: