الأخبار التكنولوجية والاستعراضات والنصائح!

يقدم الباحثون ChemCrow لزيادة نماذج اللغات الكبيرة باستخدام أدوات الكيمياء

ستساعدك المقالة التالية: يقدم الباحثون ChemCrow لزيادة نماذج اللغات الكبيرة باستخدام أدوات الكيمياء

كان لأتمتة معالجة اللغة الطبيعية التي قدمتها نماذج اللغة (LLMs) خلال السنوات القليلة الماضية تأثيرات بعيدة المدى في العديد من الصناعات. تم تطبيقه الآن على تطبيقات معالجة اللغات الطبيعية المختلفة مع نتائج مبهرة قليلة اللقطات وصفرية. في الآونة الأخيرة ، تم إحراز تقدم بناءً على بنية المحولات ، التي تم تطويرها في الأصل للترجمة الآلية العصبية.

ومع ذلك ، من المهم أن نتذكر أن للغة الإنجليزية حدودها وتواجه صعوبة في تعلم أشياء مثل الحساب الأولي والحسابات الكيميائية. إن البنية الأساسية للنماذج ، والتي تتمحور حول التنبؤ بالكلمات القادمة ، هي المسؤولة عن هذه العيوب. تتمثل إحدى طرق التغلب على هذه القيود في استكمال نماذج اللغة المكثفة ببرنامج إضافي تابع لجهة خارجية.

لقد أثرت أنظمة الذكاء الاصطناعي (AI) المصممة من قبل الخبراء والتي تعالج مشكلات محددة في مجال الكيمياء ، وتحديداً في التنبؤ بالتفاعل ، وتخطيط التركيب الرجعي ، وتنبؤ الخصائص الجزيئية ، وتصميم المواد ، ومؤخراً ، تحسين Bayesian Optimization. لقد تم إثبات أن LLMs المولدة للشفرات لديها بعض الفهم للكيمياء بسبب طبيعة تدريبهم. الطبيعة التجريبية العالية وأحيانًا الحرفية للكيمياء والنطاق المقيد وإمكانية تطبيق الأدوات الحسابية ، حتى داخل مناطقها المحددة. أدوات مثل RXN للكيمياء و AIZynthFinder هي أمثلة للإعدادات المغلقة حيث يكون التكامل شائعًا ، والذي أصبح ممكنًا من خلال تفويضات الشركات التي تعطي الأولوية للتكامل والاستخدام الداخلي.

يقدم الباحثون في مختبر الذكاء الكيميائي الاصطناعي (LIAC) والمركز الوطني للكفاءة في البحث (NCCR) التحفيز وجامعة روتشستر ChemCrow ، وهو محرك كيميائي يعمل بنظام LLM يستمد الإلهام من تطبيقات ناجحة مماثلة في مجالات أخرى. إنه يهدف إلى تبسيط عملية التفكير للعديد من الوظائف الكيميائية النموذجية في مجالات مثل تصميم الأدوية والمواد والتوليف. من خلال توفير LLM (GPT-4 في تجاربنا) مع مطالبات خاصة بالمهام والشكل ، يمكن لـ ChemCrow الاستفادة من قوة مجموعة واسعة من الأدوات المصممة من قبل الخبراء الخاصة بالكيمياء. يتم إعطاء LLM قائمة بالأدوات ، وشرح موجز للغرض منها ، ومعلومات تتعلق بإدخال البيانات والمخرجات.

تم توجيه النموذج لاستخدام نمط الفكر ، والعمل ، ومدخلات العمل ، والملاحظة. هذا يجعل من الضروري التفكير في الحالة الحالية للمهمة وكيفية ارتباطها بالهدف النهائي ثم التخطيط لكيفية المضي قدمًا. بالتزامن مع هذا الإصدار التمهيدي ، 46 تفاصيل استراتيجية مماثلة لتزويد LLM بقدرات خاصة بالكيمياء قد تكون خارج نطاق اختصاصها لولا ذلك. يطلب LLM بعد ذلك إجراءً وإدخال هذا الإجراء (مع الكلمة الرئيسية “الإجراء استنادًا إلى المنطق الذي أكمله للتو في خطوة الفكر. بعد فاصل قصير ، يستأنف مُنشئ النص بحثه عن وظيفة مناسبة لتطبيقها على البيانات التي تم تقديمها. يتم إرسال النتيجة مرة أخرى إلى LLM مع إضافة عبارة “الملاحظة” مسبقًا ، وتكرر LLM الخطوة السابقة ، “الفكر”.

وبالتالي ، يتطور LLM من مصدر معلومات واثق من نفسه ، وإن كان خاطئًا في بعض الأحيان ، إلى محرك تفكير يراقب ملاحظاته ويفكر فيها ويتخذ الإجراء المناسب بناءً على ما يتعلمه. نشر الباحثون ثلاثة عشر أداة مختلفة للمساعدة في البحث والاكتشاف. يقر الفريق بأن مجموعة الأدوات المحددة ليست شاملة. يمكن توسيعه بسهولة للاستخدامات الجديدة من خلال توفير الأداة ووصف الغرض المقصود منها بلغة طبيعية. تساعد ChemCrow الكيميائيين المحترفين وأولئك الذين ليس لديهم تدريب متخصص في هذا المجال من خلال توفير واجهة سهلة الاستخدام للمعلومات الكيميائية الموثوقة.

تقيّم هذه الورقة ميزات ChemCrow عبر 12 سيناريو استخدامًا مختلفًا ، مثل توليف جزيء مستهدف ، وضوابط السلامة ، وإيجاد مركبات ذات أنماط عمل مماثلة. وجد التقييم المستند إلى LLM أن GPT-4 و ChemCrow لهما نفس القدر من الفعالية تقريبًا في اكتمال وجودة الفكر. في المقابل ، وجدت التقييمات البشرية أن ChemCrow تفوقت بشكل كبير على GPT-4 بنحو 4.4 / 10 نقاط و 2.75 / 10 في إكمال المهمة بنجاح.