الأخبار التكنولوجية والاستعراضات والنصائح!

مترجم الشفرة في ChatGPT قد يجعل علماء البيانات مهملين

ستساعدك المقالة التالية: مترجم الشفرة في ChatGPT قد يجعل علماء البيانات مهملين

في مارس من هذا العام ، أعلنت شركة OpenAI أنها ستضيف مكونات إضافية إلى ChatGPT ، مع إثارة إثارة إطلاق مترجم الشفرة والمكوِّن الإضافي لمتصفح الويب. في الأسبوع الماضي ، بدأت الشركة في طرح المكون الإضافي لمترجم الشفرات ، والذي تسبب بالفعل في قلق علماء البيانات بنظرة خاطفة.

يحل المكون الإضافي محل العديد من مهام سير العمل الشائعة لعالم البيانات ، بما في ذلك التصور وتحليل الاتجاهات وحتى تحويل البيانات. عند النظر إلى مترجم الشفرة جنبًا إلى جنب مع التطورات الأخرى في مجال علم البيانات ، يبقى السؤال – هل سيصبح علماء البيانات متقادمون؟

عالم البيانات على المنشطات؟

ببساطة ، مترجم الشفرة هو مكون إضافي لـ ChatGPT يوفر بيئة تنفيذ محمية بجدار ناري لرمز Python. لأسباب أمنية ، لا يعمل المترجم الفوري إلا لمدة جلسة المحادثة ، ويتم استضافته أيضًا على مساحة القرص المؤقتة ، مما يعني مسح البيانات بعد إغلاق المحادثة.

يدعم المترجم أيضًا تحميل ملفات معينة إلى المكون الإضافي ، مع توفر مخرجات من الروبوت للتنزيل. في منشور المدونة للإعلان عن إطلاقه ، قارن OpenAI مترجم الشفرة بـ “مبرمج مبتدئ شديد الشغف يعمل بسرعة بصمات أصابعك” ، موضحًا أنه جيد في حل المشكلات الرياضية ، وتحويل الملفات بين التنسيقات المختلفة ، وإجراء تحليل البيانات والتصور. يتمتع المترجم أيضًا بإمكانية الوصول إلى مجموعة متنوعة من مكتبات Python ، بما في ذلك مكتبة OCR و MatPlotLib.

وضع الأشخاص عبر الإنترنت ChatGPT في المهمة ، وطلبوا منها تحليل مجموعة متنوعة من مجموعات البيانات من عروض Netflix إلى بيانات الجريمة في سان فرانسيسكو. في هذه التطبيقات ، كان المكون الإضافي قادرًا على تحديد الاتجاهات وتنظيف البيانات وحتى إنشاء رؤى.

بالإضافة إلى ذلك ، كان روبوت المحادثة قادرًا أيضًا على إنشاء تصورات للرؤى المشتقة ، وتقديم المعلومات بتنسيق سهل الفهم. على سبيل المثال ، يوجد هنا تصور لكل منارة في الولايات المتحدة ، تم إنشاؤه من ملف CSV بسيط لمواقع المنارات.

كان هذا نوعًا ما ممتعًا: لقد قمت بتحميل ملف CSV لكل موقع من مواقع المنارات في الولايات المتحدة.

“مترجم كود ChatGPT: قم بإنشاء صورة gif لخريطة مواقع المنارات ، حيث تكون الخريطة مظلمة للغاية ولكن كل منارة تومض.” بعد ثانيتين … pic.twitter.com/f14JLWQCyB

– إيثان مولليك (emollick) 2 مايو 2023

بدلاً من المصارعة مع جداول البيانات وبرامج التصور المعقدة ، يمكن لأي شخص ببساطة مطالبة مترجم الشفرة لمنحهم النتيجة التي يريدونها.

تصف هذه المجموعة من الأدوار والمسؤوليات عن كثب الوصف الوظيفي لعالم البيانات المتوسط ​​، باستثناء أن ChatGPT يقوم بذلك بطريقة أسرع. إذن ، ما هو عرض القيمة لعالم البيانات؟ بالنسبة للكثيرين ، قد يتعلق الأمر فقط بالثقة في البيانات.

ليس بشرا بعد كل شيء

تتجاوز مسؤوليات علماء البيانات مناقشة البيانات وتصورها. يقر عالم البيانات الخبير بأهمية سرد القصص من خلال البيانات وقيمة العثور على شذرات خفية من الرؤى من خلال اللمسة البشرية. في حين أن مترجم الشفرة في ChatGPT غير قادر على القيام بذلك ، نظرًا لافتقاره إلى التفكير المنطقي ، يأتي المكون الإضافي مع مجموعة أخرى من المشاكل: الهلوسة.

في حين أن الروبوت قد يكون قادرًا على أداء بعض أدوار عالم البيانات ، فإنه لا يزال يعتمد على LLM ، وهو عرضة للهلوسة. كان على مستخدمي Hacker News أن يقولوا هذا عن بعض المرئيات التي أنشأها chatbot.

“تتمتع أنظمة روبوت الدردشة الحالية بإمكانيات مذهلة ولكنها أيضًا عرضة لخطأ في فهم التفاصيل المهمة. هناك أيضًا الكثير من الثغرات “الواضحة” في محاكاة الرسومات ، لكن هذه ما يقلقني بدرجة أقل – على وجه التحديد لأنها واضحة “.

يبدو أن الهلوسة تتبع ChatGPT أينما حل ، ولا يختلف مترجم الشفرة عن ذلك. ومع ذلك ، يبدو أن هذه الهلوسة تقتصر إلى حد كبير على التصورات التي أنشأها مترجم الشفرة. بالإضافة إلى ذلك ، هناك أيضًا مشكلة تلوث البيانات في مجموعة بيانات ChatGPT.

التصورات الشائعة ، مثل رسم رسم بياني من ملف CSV ، يسهل نسبيًا على LLM تنفيذها. هذا على الأرجح لأن هذه الأنواع من المشاريع موثقة جيدًا في جميع أنحاء الإنترنت ، مما يزيد من احتمالية معرفة ChatGPT بها. ومع ذلك ، من المحتمل أن يواجه عالم البيانات الفعلي في مؤسسة كبيرة مشاكل التصور التي تتجاوز الرسوم البيانية البسيطة أو مخططات الخرائط ، والتي لا يستطيع مترجم الشفرة التعامل معها بشكل موثوق.

هوراس Twitter أظهر مثالاً على هذا التلوث. بالتقاط مثال لمشاكل Codeforces ، وجد أن GPT-4 كان قادرًا على حل 10/10 من المشكلات المنشورة قبل 2021 ، لكنه فشل تمامًا في حل أي من المشكلات المنشورة بعد هذا التاريخ.

في حين أن هذه الأمثلة لا تظهر الصورة كاملة ، فمن الواضح أن مترجم الشفرة الخاص بـ ChatGPT لن يحل محل عالم البيانات في أي وقت قريب. ومع ذلك ، فهو قريب جدًا من كونه “محلل بيانات شخصي” من نوع ما لأولئك الذين ليسوا على دراية بعلم البيانات كمجال. يمكن أيضًا أن ينمو ليصبح زوجًا موثوقًا به من علماء البيانات للعمل جنبًا إلى جنب مع الإنسان.

Table of Contents