الأخبار التكنولوجية والاستعراضات والنصائح!

يقترح باحثو معهد ماساتشوستس للتكنولوجيا AbMAP: نموذج لغة بروتين (PLM) مخصص للأجسام المضادة

ستساعدك المقالة التالية: يقترح باحثو معهد ماساتشوستس للتكنولوجيا AbMAP: نموذج لغة بروتين (PLM) مخصص للأجسام المضادة

بعض الأدوية المرشحة الواعدة في العلاجات الحالية هي الأجسام المضادة. إن التنوع الهيكلي المذهل للأجسام المضادة ، والتي تمكنها من التعرف على مجموعة واسعة بشكل لا يصدق من الأهداف المحتملة ، هو الشكر على هذا النجاح العلاجي. أقسامها شديدة التغير ، والتي تعتبر ضرورية للخصوصية الوظيفية للأجسام المضادة ، حيث يظهر هذا التنوع. في الماضي ، تم استخدام طرق مثل التحصين أو طرق التطور الموجهة مثل اختيار عرض الملتهمة لتطوير جسم مضاد ضد هدف محل اهتمام تجريبيًا. ومع ذلك ، فإن إجراء الإنشاء والفرز يستغرق وقتًا طويلاً ومالاً. يجب استكشاف مساحة الهيكل المحتملة بدقة ، والتي يمكن أن تزود المرشحين بخصائص ربط غير مواتية.

نظرًا لأن الأقسام شديدة التغير في هياكل الأجسام المضادة تُظهر أنماطًا تطورية مميزة من الناحية الهيكلية ، فقد تواجه طرق التنبؤ ببنية البروتين العامة صعوبة في التنبؤ بها. علاوة على ذلك ، من الصعب أخذ قضايا المصب في الحسبان بسهولة. لذلك ، هناك حاجة لتقنيات حسابية تقوم إما بتحسين عدد صغير من المرشحين المحددين تجريبياً بشكل أكثر فعالية أو تطوير جسم مضاد جديد تمامًا من نقطة الصفر لهدف محدد. كانت نمذجة البنية ثلاثية الأبعاد للجسم المضاد الكامل أو CDRs الخاصة به خطوة واحدة في هذا النهج ، ولكن دقة هذه النماذج يمكن أن تكون أفضل. لا يمكنها إجراء استكشاف حسابي واسع النطاق أو تحليل ذخيرة الجسم المضاد للفرد ، والتي قد تشتمل على ملايين المتواليات لأنها بطيئة وتستغرق عدة دقائق لكل بنية جسم مضاد.

في الآونة الأخيرة ، تم إنشاء تمثيلات البروتين عالية الأبعاد باستخدام أساليب التعلم الآلي المستخدمة في معالجة اللغة الطبيعية. تسمح نماذج لغة البروتين بالتنبؤ بخصائص البروتين مع التقاط الخصائص الهيكلية ضمنيًا. يتمثل أحد الأساليب في الاستعانة بـ PLMs المدربة على جسم جميع البروتينات عند مناقشة الأجسام المضادة. نشير إليها على أنها PLMs “التأسيسية” ، وهي عبارة عن تعلم الآلة يتحدث عن نماذج كبيرة لجميع الأغراض. ومع ذلك ، فإن تنوع التسلسل في CDRs ليس محدودًا تطوريًا ، مما يعني أن CDRs للأجسام المضادة تنتهك بشكل مباشر فرضية التوزيع الكامنة وراء PLMs الأساسية. أحد الأسباب الرئيسية لأداء AlphaFold 2 بشكل أقل فعالية على الأجسام المضادة مقارنة بالبروتينات العادية هو الحاجة إلى المزيد من محاذاة التسلسل المتعدد عالي الجودة.

لهذا السبب ، اقترح باحثون من معهد ماساتشوستس للتكنولوجيا و Sanofi R&D Cambridge مجموعة مختلفة من الأساليب المعروفة باسم IgLM. تقوم هذه الطرق بتدريب PLM فقط على ذخيرة تسلسل مستقبلات الخلايا البائية والأجسام المضادة. هذه الأساليب أكثر فعالية في معالجة فرط التغير في CDR. ومع ذلك ، فهم بحاجة إلى مجموعة متنوعة من جميع تسلسلات البروتين لتأسيس تدريبهم ، مما يمنعهم من الوصول إلى الفهم العميق الذي توفره PLMs الأساسية. بالإضافة إلى ذلك ، تستهلك الطرق الحالية مثل AntiBERTa قدرة تفسيرية كبيرة في نمذجة الأجسام المضادة غير CDRs ، والتي تكون أقل تنوعًا وأقل أهمية بالنسبة لخصوصية ربط الجسم المضاد.

تتمثل مساهمتهم المفاهيمية الرئيسية في استخدام تقنيات التعلم الخاضعة للإشراف المدربة على بنية الجسم المضاد وملامح الخصوصية الملزمة لحل النقص في PLMs الأساسية في مناطق الجسم المضاد شديدة التغير. يقدمون على وجه التحديد ثلاثة تطورات مهمة:

  1. نحن نعمل على تعظيم استخدام البيانات المتاحة عن طريق قصر مهمة التعلم على مناطق الأجسام المضادة شديدة التغير.
  2. إنهم يقومون بتحسين عمليات دمج المنطقة الأساسية شديدة التغير لـ PLM لالتقاط بنية ووظيفة الجسم المضاد بشكل أفضل.
  3. إنها تقوم بتطوير صياغة تعليمية متعددة المهام تحت الإشراف تأخذ بعين الاعتبار خصوصية الارتباط وهيكل بروتين الجسم المضاد للإشراف على التمثيل.

لذلك ، يمكن أن يساعد هذا النهج في تقييم متواليات الأجسام المضادة المحتملة لقابلية الدواء قبل الدراسات المختبرية وما قبل السريرية المكلفة.