الأخبار التكنولوجية والاستعراضات والنصائح!

إطلاق NVIDIA Ampere: أطلق NVIDIA بنية GPU جديدة ووحدة معالجة رسومات A100 ومسرع

في حين أن جهود عرض NVIDIA المعتادة لهذا العام قد حطمت بسبب تفشي الفيروس التاجي الحالي ، استمرت مسيرة الشركة نحو تطوير وإصدار منتجات جديدة بلا هوادة. تحقيقا لهذه الغاية ، في الكلمة الرئيسية اليوم لمؤتمر تكنولوجيا GPU الرقمي اليوم ، تنتقل الشركة والرئيس التنفيذي لشركة Jensen Huang إلى المرحلة الافتراضية للإعلان عن الجيل القادم من بنية NVIDIA GPU ، Ampere ، والمنتجات الأولى التي ستستخدمها.

مثل الكشف عن Volta قبل 3 سنوات – وهو الآن تقليدي بالنسبة للكشف عن NVIDIA GTC – ينصب تركيز اليوم على النهاية العالية جدًا للسوق. في عام 2017 ، أطلقت NVIDIA وحدة معالجة الرسومات GV100 المستندة إلى Volta ، ومعها مسرع V100. حقق V100 نجاحًا هائلاً للشركة ، حيث وسع نطاق أعمال مركز البيانات بشكل كبير على الجزء الخلفي من نوى موتر رواية الهندسة المعمارية وقوة الغاشمة الهائلة التي لا يمكن توفيرها إلا من خلال وحدة معالجة الرسومات 800 مم 2 +. والآن في عام 2020 ، تتطلع الشركة إلى مواصلة هذا النمو مع خليفة Volta ، هندسة Ampere.

أصبحت شركة NVIDIA الآن أكثر سرية مما كانت عليه من قبل ، وهي تحتفظ بخريطة طريق GPU المستقبلية بالقرب من صدرها. في حين أن اسم Ampere الرمزي (من بين آخرين) كان يطفو منذ بعض الوقت الآن ، إلا أننا وصلنا هذا الصباح أخيرًا إلى تأكيد أن Ampere موجود ، بالإضافة إلى تفاصيلنا الأولى حول الهندسة المعمارية. نظرًا لطبيعة العرض التقديمي الرقمي من NVIDIA – بالإضافة إلى المعلومات المحدودة المقدمة في الإحاطات الصحفية المسبقة الصحفية من NVIDIA – ليس لدينا كل التفاصيل حول Ampere حتى الآن. ومع ذلك ، في هذا الصباح على الأقل ، تتطرق NVIDIA إلى النقاط البارزة في الهندسة المعمارية لحوسبة مراكز البيانات وعملاء الذكاء الاصطناعي ، وما هي الابتكارات الرئيسية التي تقدمها Ampere للمساعدة في أعباء عملهم.

إن إطلاق الأشياء لعائلة Ampere هو A100. رسمياً ، هذا هو اسم كل من GPU والمسرع المدمج به ؛ وفي الوقت الحالي على الأقل كلاهما واحد في نفس الوقت ، حيث لا يوجد سوى مسرّع واحد يستخدم GPU.

مقارنة مواصفات NVIDIA Accelerator
أ 100V100P100
FP32 كودا النوى691251203584
تعزيز الساعة~ 1.41 جيجاهرتز1530 ميجا هرتز1480 ميجا هرتز
ساعة الذاكرة2.4 جيجابت في الثانية HBM21.75 جيجابت في الثانية HBM21.4 جيجابت في الثانية HBM2
عرض ناقل الذاكرة5120 بت4096 بت4096 بت
عرض نطاق الذاكرة1.6 تيرابايت / ثانية900 جيجابايت / ثانية720 جيجابايت / ثانية
VRAM40 جيجابايت16 جيجابايت / 32 جيجابايت16 غيغا بايت
الدقة واحد19.5 TFLOPs15.7 TFLOPs10.6 TFLOPs
دقة مزدوجة9.7 TFLOPs
(معدل 1/2 FP32)
7.8 TFLOPs
(معدل 1/2 FP32)
5.3 TFLOPs
(معدل 1/2 FP32)
INT8 Tensor624 قمملا يوجدلا يوجد
FP16 Tensor312 TFLOPs125 TFLOPsلا يوجد
TF32 Tensor156 TFLOPsلا يوجدلا يوجد
ربطNVLink 3
12 وصلة (600 جيجابايت / ثانية)
NVLink 2
6 روابط (300 جيجابايت / ثانية)
NVLink 1
4 روابط (160 جيجابايت / ثانية)
GPUأ 100
(826 مم 2)
GV100
(815 مم 2)
GP100
(610 مم 2)
عدد الترانزستور54.2 ب21.1 ب15.3 ب
TDP400 واط300 واط / 350 واط300 واط
عملية التصنيعتسمك 7NTSMC 12nm FFNTSMC 16nm FinFET
واجهه المستخدمSXM4SXM2 / SXM3SXM
هندسة معماريةامبيرفولتاباسكال

تم تصميم A100 ليكون خلفًا لمسرع V100 ، ويهدف إلى تحقيق مستوى مرتفع تمامًا ، كما نتوقع من مسرع NVIDIA الرائد الجديد للحوسبة. جزء Ampere الرائد مبني على عملية TSMC 7 نانومتر ويتضمن 54 مليار ترانزستور ضخم ، 2.5x مثل V100 قبله. وضعت NVIDIA تحسينات الكثافة الكاملة التي تقدمها عملية 7 نانومتر ، ثم بعضها ، حيث أن حجم GPU الناتج يبلغ 826 مم 2 ، أكبر من GV100. لقد حققت NVIDIA نجاحًا كبيرًا في الجيل الأخير ، ومن أجل أن تصبح أكبر من هذا الجيل فقد أصبحت أكبر.

سنتطرق أكثر إلى المواصفات الفردية بعد ذلك بقليل ، ولكن على مستوى عالٍ من الواضح أن NVIDIA استثمرت في بعض المجالات أكثر من غيرها. يتم تحسين أداء FP32 على الورق بشكل طفيف فقط من V100. وفي الوقت نفسه ، تم تحسين أداء الموتر بشكل كبير – 2.5x تقريبًا لموترات FP16 – ووسعت NVIDIA بشكل كبير التنسيقات التي يمكن استخدامها مع دعم INT8 / 4 ، بالإضافة إلى تنسيق FP32-ish جديد يسمى TF32. كما أن عرض النطاق الترددي للذاكرة متوقع بشكل كبير ، حيث توفر حزم متعددة من ذاكرة HBM2 إجمالي 1.6 تيرابايت / الثانية من عرض النطاق الترددي لتغذية الوحش الذي هو أمبير.

ستقوم NVIDIA بتقديم النسخة الأولية من هذا المسرّع في عامل الشكل SXM الشائع الآن ، وهو عبارة عن بطاقة نصية مناسبة تمامًا للتثبيت في الخوادم. على أساس جيل بعد جيل ، ارتفع استهلاك الطاقة مرة أخرى ، وهو مناسب على الأرجح لجيل يسمى Ampere. تم تصنيف A100 تمامًا لـ 400 واط ، على عكس 300 واط و 350 واط للإصدارات المختلفة من V100. وهذا يجعل عامل الشكل SXM أكثر أهمية لجهود NVIDIA ، لأن بطاقات PCIe لن تكون مناسبة لهذا النوع من استهلاك الطاقة.

أما بالنسبة لهندسة Ampere نفسها ، فإن NVIDIA تنشر تفاصيل محدودة عنها اليوم. نتوقع أن نسمع المزيد خلال الأسابيع القادمة ، ولكن في الوقت الحالي تؤكد NVIDIA أنها تحافظ على خطوط إنتاجها المختلفة متوافقة هندسيًا ، وإن كان ذلك في تكوينات مختلفة إلى حد كبير. في حين أن الشركة لا تتحدث عن Ampere (أو المشتقات) لبطاقات الفيديو اليوم ، فإنها توضح أن ما كانوا يعملون عليه ليس بنية حاسوبية خالصة ، وأن تقنيات Ampere ستأتي إلى أجزاء الرسومات أيضًا ، مع بعض الميزات الجديدة بالنسبة لهم أيضًا. في نهاية المطاف ، يعد هذا جزءًا من استراتيجية NVIDIA المستمرة لضمان أن يكون لديهم نظام بيئي واحد ، حيث ، على حد تعبير Jensen ، "كل عبء عمل واحد يعمل على كل وحدة معالجة رسومات واحدة".

هذا خبر عاجل