الأخبار التكنولوجية والاستعراضات والنصائح!

فشل GPT-4 في امتحان الاقتصاد لستيف لاندسبيرغ

ستساعدك المقالة التالية: فشل GPT-4 في امتحان الاقتصاد لستيف لاندسبيرغ

فشلت ChatGPT 4 في امتحان Steve Landsburg للاقتصاد. يحتوي هذا الاختبار على أسئلة تم طرحها في الاختبارات النهائية الأخيرة في دورة السنة الثانية لستيف لاندسبيرغ في جامعة روتشستر. تم أخذ كل هذه الاستفسارات من مثل هذه الاختبارات.

في البداية ، خضع Steve Landsburg لامتحان الاقتصاد مع نموذج لغة GPT 3.5 وفشل في الاختبار. قال الكثير من المعلقين أنك كنت تستخدم إصدارًا قديمًا من ChatGPT.

لإعطائهم الإجابات الصحيحة ، قرر Steve Landsburg الترقية إلى GPT-4 الحديث ومحاولة إعطاء اختبار الاقتصاد مع نموذج GPT 4.

ستصاب بالصدمة لرؤية النتائج حول كيفية مقارنة نماذج اللغات الأقدم GPT 3 وأحدث طرازات GPT 4 ببعضها البعض في اختبار الاقتصاد هذا.

يحتوي الاختبار على 9 أسئلة في 10 نقاط لكل منها ، مما يجعل العدد الإجمالي في الاختبارات يساوي 90.

حقق GPT-4 درجة أربعة ، مقارنة بنموذج ChatGPT الأقدم GPT 3 الذي سجل صفرًا في اختبار من أصل 90. وكان هذا بمثابة تحسن لنموذج الذكاء الاصطناعي.

يمكن للطلاب الآن أن يتنفسوا الصعداء ، مع العلم أن تعليمهم وخبراتهم لن يتم تجاوزها بسرعة من خلال برنامج الذكاء الاصطناعي. يرحب بالراحة بشكل خاص نظرًا للتقدم السريع في تكنولوجيا الأتمتة.

حدد الاختبار الحقيقي منحنيات العرض والطلب من خلال رسم صور لها للطلاب لفهمها وحلها. ولكن في حالة GPT 4 ، استاذ مترجم منهم في معادلات لصالح الذكاء الاصطناعي.

كان الذكاء الاصطناعي قادرًا على قراءة المعادلات ، لكنه ارتكب أخطاءً لأنه يفتقر إلى الفهم الأساسي للمفاهيم الأساسية.

مع أسئلة الاختبار ، إجابات GPT-4 (بخط الآلة الكاتبة) والتسجيل (باللون الأحمر):

أولاً ، شاركنا سؤالين أجاب GPT 4 بشكل صحيح ، والباقي مشترك أدناه.

السؤال الخامس: أنت المالك الاحتكاري لمدينة ملاهي غير مسورة حيث يمكن لأي شخص الدخول وشراء تذاكر الركوب. الطلب على تذاكر الركوب هو Q = 100-5P والتكلفة الحدية لتوفير المشاوير هي P = 4Q. أنت تفكر في بناء سياج بحيث يمكنك تحصيل رسوم دخول إلى الحديقة. ما هو أقصى مبلغ ستدفعه مقابل هذا السياج؟

أولاً ، لنجد السعر والكمية الأمثل لمدينة الملاهي بدون سور. كاحتكار ، ستقوم بتعيين التكلفة الحدية (MC) مساوية للإيرادات الحدية (MR) لزيادة أرباحك إلى الحد الأقصى.
منحنى الطلب: Q = 100-5P
منحنى الطلب العكسي: P = (100 – Q) / 5

إجمالي الإيرادات (TR): TR = P * Q = Q * (100 – Q) / 5

الإيرادات الهامشية (MR): MR = d (TR) / dQ = (100 – 2Q) / 5

التكلفة الهامشية (MC): MC = 4Q

الآن ، قم بتعيين MR = MC:

(100 – 2Q) / 5 = 4Q
100 – 2 س = 20 س
100 = 22Q
س = 100/22 ≈ 4.55

P = (100 – 4.55) / 5 19.09

إجمالي الربح بدون سياج:

الربح = TR – TC = (P * Q) – (MC * Q)
الربح = (19.09 * 4.55) – (4 * 4.55 ^ 2) ين ياباني 43.44 دولارًا

الآن ، دعنا نحلل الوضع بسياج. نظرًا لأنه يمكنك تحصيل رسوم القبول ، يمكنك استخراج كل فائض المستهلك كأرباح إضافية. فائض المستهلك هو المنطقة الواقعة بين منحنى الطلب وخط السعر حتى الكمية المطلوبة.

فائض المستهلك بسياج:

CS = 0.5 * (100 – 4.55) * 4.55 = 216.61

إجمالي الربح بسياج:

الربح = الربح بدون سياج + CS
الربح = 43.44 + 216.61 = 260.05 دولار

الحد الأقصى للمبلغ الذي ستدفعه مقابل السور هو الفرق في الربح سواء بالسياج أو بدونه:

260.05 دولارًا أمريكيًا – 43.44 دولارًا أمريكيًا = 216.61 دولارًا أمريكيًا

الحد الأقصى للمبلغ الذي ترغب في دفعه مقابل السياج هو 216.61 دولارًا. هذا لأنه باستخدام السياج ، يمكنك تحصيل رسوم الدخول واستخراج فائض المستهلك ، مما يزيد من إجمالي أرباحك.

نتيجة: اثنان من كل عشرة. أولاً ، mea culpa – كنت أنوي تسهيل التعامل مع الأرقام ، لكن لحسن الحظ ، يبدو أن ChatGPT ليس لديه مشكلة مع الكسور العشرية. إن حساب الربح بدون سياج جيد ، لكنه مادة أولية من النوع الذي من المفترض أن يعرفه الطلاب قبل دخولهم هذه الدورة التدريبية ، لذا فهي لا تكسب أي ائتمان. تدرك ChatGPT أنه من خلال السياج يمكنك استخراج فائض المستهلك بالكامل ، والذي يحصل من أجله على نقطتين من أصل عشرة. لكن لا يبدو أنه قد تحرك إلى النقطة الرئيسية ، وهي أنه عندما يمكنك استخراج فائض المستهلك ، يكون لديك حافز لزيادة فائض المستهلك عن طريق خفض سعر تذاكر الركوب.

السؤال 6: يقع متجر بيع بالتجزئة مملوك للاحتكار بجوار موقف سيارات مملوك للاحتكار. (يملكها محتكرون مختلفون لا يتواطؤون). افترض:

ط) هناك عدد ثابت من العملاء ، وكلهم لديهم منحنيات طلب متطابقة منحدرة إلى أسفل للمنتجات في متجر البيع بالتجزئة.

ب) للتسوّق في المتجر ، يجب أن تركن سيارتك في ساحة الانتظار. لا يوجد سبب آخر لركن سيارتك في ساحة الانتظار.

3) يحتوي المتجر على منحنى تكلفة هامشية مائل إلى الأعلى.

4) يتم توفير أماكن وقوف السيارات بدون تكلفة هامشية.

أ) لنفترض أن المتجر أعلن عن سعر ، ثم أعلن الموقف عن السعر. صف كيف يتم تحديد هذه الأسعار.

ب) افترض بدلاً من ذلك أن الموقف يعلن عن سعر ثم يعلن المتجر عن السعر. صف كيف يتم تحديد هذه الأسعار.

ج) افترض بدلاً من ذلك أنه يتم الإعلان عن الأسعار في وقت واحد. صف كيف يتم تحديدها.

أ) يعلن المتجر عن السعر أولاً ثم الموقف:

سيحدد المتجر ، كونه احتكارًا ، سعره من خلال مساواة إيراداته الحدية (MR) بتكلفته الحدية (MC) بناءً على منحنى الطلب. سيؤدي هذا إلى تعظيم ربحها.

بمجرد تحديد سعر المتجر ، يعرف صاحب الموقف الطلب على أماكن وقوف السيارات نظرًا لأن وقوف السيارات مطلوب للتسوق في المتجر. بالنظر إلى أن أماكن وقوف السيارات لا تحتوي على تكلفة هامشية ، فإن المحتكر في موقف السيارات سيحدد سعرًا يلتقط كل فائض المستهلك المتبقي بعد قرار تسعير المتجر. سيؤدي هذا إلى زيادة ربح ساحة الانتظار.

ب) يعلن الموقف عن السعر أولاً ثم المحل:

يعرف مالك موقف السيارات أن هناك عددًا ثابتًا من العملاء ، وبما أن أماكن وقوف السيارات لا تحتوي على تكلفة هامشية ، فإن محتكر موقف السيارات سيحدد سعرًا يستخرج الحد الأقصى من فائض المستهلك لمواقف السيارات.

سيأخذ صاحب المتجر ، بمعرفة سعر وقوف السيارات ، ذلك في الاعتبار عند تحديد السعر الخاص به. سيقوم المتجر بتعديل منحنى الطلب الخاص به مع الأخذ في الاعتبار سعر وقوف السيارات (لأنه يمثل تكلفة إضافية للعملاء) ويحدد سعره من خلال مساواة MR مع MC بناءً على منحنى الطلب المعدل. سيؤدي ذلك إلى زيادة ربح المتجر.

ج) يتم الإعلان عن الأسعار في وقت واحد:

في هذه الحالة ، سيحتاج كل من المحللين والمحتكرين في ساحة الانتظار إلى أخذ قرارات التسعير الخاصة ببعضهم البعض في الاعتبار. سيحاولون تحديد الأسعار التي تزيد من أرباحهم الفردية.

سيحتاج صاحب المتجر إلى النظر في التأثير المحتمل لسعر وقوف السيارات عند الطلب وتحديد سعره من خلال مساواة MR مع MC بناءً على منحنى الطلب المتوقع.

سيحتاج مالك ساحة الانتظار إلى النظر في التأثير المحتمل لسعر المتجر على طلب وقوف السيارات وتحديد سعره لالتقاط فائض المستهلك المتوقع المتبقي بعد قرار تسعير المتجر.

في حالة التوازن ، سيحدد كل من المتجر وموقف السيارات أسعارهما بناءً على توقعاتهما لقرارات التسعير الخاصة ببعضهما البعض والتأثير المشترك على طلب المستهلك. ستعتمد الأسعار النهائية على وظائف الطلب والتكلفة المحددة في المتجر وموقف السيارات ، بالإضافة إلى توقعاتهم حول استراتيجيات بعضهم البعض.

نتيجة: اثنان من كل عشرة. الإجابة على أ) صحيحة تمامًا. الإجابة على ب) خاطئة من نواحٍ متعددة. أولاً ، العملاء الذين دفعوا مقابل وقوف السيارات لديهم نفس منحنيات الطلب على سلع المتجر تمامًا مثل العملاء الذين لم يدفعوا مقابل وقوف السيارات ، لذلك لا يقوم المتجر “بتعديل منحنى الطلب الخاص به”. ثانيًا ، لن يقوم المتجر “بزيادة أرباحه إلى الحد الأقصى” ، لأن القيام بذلك (نظرًا لسعر وقوف السيارات) سيؤدي إلى إبعاد جميع زبائنه. بدلاً من ذلك ، تستخرج ساحة الانتظار أقصى فائض استهلاكي ممكن ، والذي يحدث عندما يكون فائض منتج المتجر صفراً. سيتعين على المتجر بعد ذلك تحديد الأسعار بحيث يكون فائض المنتج مساويًا للصفر من أجل الحصول على أي عملاء على الإطلاق. تبدو الإجابة على ج) مثل الكثير من الثرثرة حول ما “سيأخذ في الاعتبار” الجميع دون تعداد نتائج التوازن الممكنة. إذن ائتمان كامل لـ a) ، لا ائتمان لـ b) أو c). أ) كان الجزء السهل ، لذا فإن اثنين من كل عشرة.

أعرب الخبراء في مجالات الذكاء الاصطناعي والتعليم عن مخاوفهم بشأن التأثير السلبي المحتمل الذي قد تحدثه روبوتات ChatGPT على الأنظمة التعليمية في المستقبل. ومع ذلك ، عند إجراء مزيد من التحقيق ، بعض المعلمين والخبراء يقترح أن هذه المخاوف ليست مبررة بعد.

رفض ممثل من شركة OpenAI ، شركة التكنولوجيا المسؤولة عن إنشاء روبوت الذكاء الاصطناعي ، التعليق عند سؤاله عن ذلك. الشركة الناشئة متخصصة في أبحاث الذكاء الاصطناعي.

في التجربة الأولية ، تم استخدام إصدار أقدم من GPT-3. الدردشةأثار أحدث طراز في سلسلة GPT الكثير من الجدل بين الخبراء في مجال الذكاء الاصطناعي والتعليم. وفقًا لموقع OpenAI على الويب ، تم “ضبط هذا النموذج بدقة من نموذج في سلسلة GPT-3.5”.