▷إطلاق NVIDIA Ampere: أطلق NVIDIA بنية GPU جديدة ووحدة معالجة رسومات A100 ومسرع ✅

في حين أن جهود عرض NVIDIA المعتادة لهذا العام قد حطمت بسبب تفشي الفيروس التاجي الحالي ، استمرت مسيرة الشركة نحو تطوير وإصدار منتجات جديدة بلا هوادة. تحقيقا لهذه الغاية ، في الكلمة الرئيسية اليوم لمؤتمر تكنولوجيا GPU الرقمي اليوم ، تنتقل الشركة والرئيس التنفيذي لشركة Jensen Huang إلى المرحلة الافتراضية للإعلان عن الجيل القادم من بنية NVIDIA GPU ، Ampere ، والمنتجات الأولى التي ستستخدمها.

مثل الكشف عن Volta قبل 3 سنوات – وهو الآن تقليدي بالنسبة للكشف عن NVIDIA GTC – ينصب تركيز اليوم على النهاية العالية جدًا للسوق. في عام 2017 ، أطلقت NVIDIA وحدة معالجة الرسومات GV100 المستندة إلى Volta ، ومعها مسرع V100. حقق V100 نجاحًا هائلاً للشركة ، حيث وسع نطاق أعمال مركز البيانات بشكل كبير على الجزء الخلفي من نوى موتر رواية الهندسة المعمارية وقوة الغاشمة الهائلة التي لا يمكن توفيرها إلا من خلال وحدة معالجة الرسومات 800 مم 2 +. والآن في عام 2020 ، تتطلع الشركة إلى مواصلة هذا النمو مع خليفة Volta ، هندسة Ampere.

أصبحت شركة NVIDIA الآن أكثر سرية مما كانت عليه من قبل ، وهي تحتفظ بخريطة طريق GPU المستقبلية بالقرب من صدرها. في حين أن اسم Ampere الرمزي (من بين آخرين) كان يطفو منذ بعض الوقت الآن ، إلا أننا وصلنا هذا الصباح أخيرًا إلى تأكيد أن Ampere موجود ، بالإضافة إلى تفاصيلنا الأولى حول الهندسة المعمارية. نظرًا لطبيعة العرض التقديمي الرقمي من NVIDIA – بالإضافة إلى المعلومات المحدودة المقدمة في الإحاطات الصحفية المسبقة الصحفية من NVIDIA – ليس لدينا كل التفاصيل حول Ampere حتى الآن. ومع ذلك ، في هذا الصباح على الأقل ، تتطرق NVIDIA إلى النقاط البارزة في الهندسة المعمارية لحوسبة مراكز البيانات وعملاء الذكاء الاصطناعي ، وما هي الابتكارات الرئيسية التي تقدمها Ampere للمساعدة في أعباء عملهم.

إن إطلاق الأشياء لعائلة Ampere هو A100. رسمياً ، هذا هو اسم كل من GPU والمسرع المدمج به ؛ وفي الوقت الحالي على الأقل كلاهما واحد في نفس الوقت ، حيث لا يوجد سوى مسرّع واحد يستخدم GPU.

مقارنة مواصفات NVIDIA Accelerator
	أ 100	V100	P100
FP32 كودا النوى	6912	5120	3584
تعزيز الساعة	~ 1.41 جيجاهرتز	1530 ميجا هرتز	1480 ميجا هرتز
ساعة الذاكرة	2.4 جيجابت في الثانية HBM2	1.75 جيجابت في الثانية HBM2	1.4 جيجابت في الثانية HBM2
عرض ناقل الذاكرة	5120 بت	4096 بت	4096 بت
عرض نطاق الذاكرة	1.6 تيرابايت / ثانية	900 جيجابايت / ثانية	720 جيجابايت / ثانية
VRAM	40 جيجابايت	16 جيجابايت / 32 جيجابايت	16 غيغا بايت
الدقة واحد	19.5 TFLOPs	15.7 TFLOPs	10.6 TFLOPs
دقة مزدوجة	9.7 TFLOPs (معدل 1/2 FP32)	7.8 TFLOPs (معدل 1/2 FP32)	5.3 TFLOPs (معدل 1/2 FP32)
INT8 Tensor	624 قمم	لا يوجد	لا يوجد
FP16 Tensor	312 TFLOPs	125 TFLOPs	لا يوجد
TF32 Tensor	156 TFLOPs	لا يوجد	لا يوجد
ربط	NVLink 3 12 وصلة (600 جيجابايت / ثانية)	NVLink 2 6 روابط (300 جيجابايت / ثانية)	NVLink 1 4 روابط (160 جيجابايت / ثانية)
GPU	أ 100 (826 مم 2)	GV100 (815 مم 2)	GP100 (610 مم 2)
عدد الترانزستور	54.2 ب	21.1 ب	15.3 ب
TDP	400 واط	300 واط / 350 واط	300 واط
عملية التصنيع	تسمك 7N	TSMC 12nm FFN	TSMC 16nm FinFET
واجهه المستخدم	SXM4	SXM2 / SXM3	SXM
هندسة معمارية	امبير	فولتا	باسكال

تم تصميم A100 ليكون خلفًا لمسرع V100 ، ويهدف إلى تحقيق مستوى مرتفع تمامًا ، كما نتوقع من مسرع NVIDIA الرائد الجديد للحوسبة. جزء Ampere الرائد مبني على عملية TSMC 7 نانومتر ويتضمن 54 مليار ترانزستور ضخم ، 2.5x مثل V100 قبله. وضعت NVIDIA تحسينات الكثافة الكاملة التي تقدمها عملية 7 نانومتر ، ثم بعضها ، حيث أن حجم GPU الناتج يبلغ 826 مم 2 ، أكبر من GV100. لقد حققت NVIDIA نجاحًا كبيرًا في الجيل الأخير ، ومن أجل أن تصبح أكبر من هذا الجيل فقد أصبحت أكبر.

سنتطرق أكثر إلى المواصفات الفردية بعد ذلك بقليل ، ولكن على مستوى عالٍ من الواضح أن NVIDIA استثمرت في بعض المجالات أكثر من غيرها. يتم تحسين أداء FP32 على الورق بشكل طفيف فقط من V100. وفي الوقت نفسه ، تم تحسين أداء الموتر بشكل كبير – 2.5x تقريبًا لموترات FP16 – ووسعت NVIDIA بشكل كبير التنسيقات التي يمكن استخدامها مع دعم INT8 / 4 ، بالإضافة إلى تنسيق FP32-ish جديد يسمى TF32. كما أن عرض النطاق الترددي للذاكرة متوقع بشكل كبير ، حيث توفر حزم متعددة من ذاكرة HBM2 إجمالي 1.6 تيرابايت / الثانية من عرض النطاق الترددي لتغذية الوحش الذي هو أمبير.

ستقوم NVIDIA بتقديم النسخة الأولية من هذا المسرّع في عامل الشكل SXM الشائع الآن ، وهو عبارة عن بطاقة نصية مناسبة تمامًا للتثبيت في الخوادم. على أساس جيل بعد جيل ، ارتفع استهلاك الطاقة مرة أخرى ، وهو مناسب على الأرجح لجيل يسمى Ampere. تم تصنيف A100 تمامًا لـ 400 واط ، على عكس 300 واط و 350 واط للإصدارات المختلفة من V100. وهذا يجعل عامل الشكل SXM أكثر أهمية لجهود NVIDIA ، لأن بطاقات PCIe لن تكون مناسبة لهذا النوع من استهلاك الطاقة.

أما بالنسبة لهندسة Ampere نفسها ، فإن NVIDIA تنشر تفاصيل محدودة عنها اليوم. نتوقع أن نسمع المزيد خلال الأسابيع القادمة ، ولكن في الوقت الحالي تؤكد NVIDIA أنها تحافظ على خطوط إنتاجها المختلفة متوافقة هندسيًا ، وإن كان ذلك في تكوينات مختلفة إلى حد كبير. في حين أن الشركة لا تتحدث عن Ampere (أو المشتقات) لبطاقات الفيديو اليوم ، فإنها توضح أن ما كانوا يعملون عليه ليس بنية حاسوبية خالصة ، وأن تقنيات Ampere ستأتي إلى أجزاء الرسومات أيضًا ، مع بعض الميزات الجديدة بالنسبة لهم أيضًا. في نهاية المطاف ، يعد هذا جزءًا من استراتيجية NVIDIA المستمرة لضمان أن يكون لديهم نظام بيئي واحد ، حيث ، على حد تعبير Jensen ، "كل عبء عمل واحد يعمل على كل وحدة معالجة رسومات واحدة".

هذا خبر عاجل

إطلاق NVIDIA Ampere: أطلق NVIDIA بنية GPU جديدة ووحدة معالجة رسومات A100 ومسرع

نحن نوصيك: