الأخبار التكنولوجية والاستعراضات والنصائح!

رقاقة رسومات بسعة رقاقة مع 400000 نوى واستهلاك 15 كيلو واط

دعا شركة ناشئة نظام الدماغ وقد أظهر هذا شريحة رسومات نموذجية أولية تتجاوز صانع GPU الشهير الذي يقدم تحسينات في الأداء مكونة من رقمين ، كرقاقة رسومات جديدة آلة رقاقة فليك الدماغ (WSE Brain) ، يجمع ما لا يقل عن 5600٪ ترانزستورات أكثر حول أفضل رقاقة رسومات في السوق ، نفيديا V100لكونها قادرة على العرض 21) مليار ترانزستور حول 2100 مليون الذي يجمع بين رقائق نفيديا.

لتحقيق ذلك ، نجحت الشركة الناشئة في حل التحديات التقنية الرئيسية التي لا يستطيع الآخرون حلها بعد ومع ذلك أول معالج لقياس مقياس الرقاقة في جميع أنحاء العالم

آلة رقاقة رقاقة

WSE Cerebras هو أول معالج على مستوى رقاقة. الشيء المنطقي الذي يجب فعله هو أن تسأل لماذا لا يقوم شخص آخر بشيء واضح للغاية ، والسبب هو أن التحديات التقنية الرئيسية للتواصل المتبادل لم يتم التغلب عليها من قبل الآخرين.

تم تصميم المعدات الليثوغرافية حاليًا لنقش العديد من المعالجات الصغيرة على طول الرقاقة؛ لا يمكنهم عمل معالج كامل من خلال الرقاقة. وهذا يعني أن القصة ستكون بشكل أو بآخر وأن كل كتلة يجب أن تكون قادرة على التواصل من خلال هذه الخطوط بطرق مختلفة ، وهذا ما قرره Cerebras للمطالبة بالعرش. المعالج الأول في العالم الذي يحتوي على مليار ترانزستور.

تشغل Cerebra WSE مساحة 46،225 ملم² وتستوعب 1.2 مليار ترانزستور. تم تحسين جميع النوى. لأعباء العمل المتعلقة بالذكاء الاصطناعي وتستهلك البطاطس المقلية 15 كيلو واط من الطاقة. لأن كل هذه الطاقة يجب أن يتم تبريدها أيضًا ، يجب أن يكون نظام التبريد هذا ثوريًا مثل نظام الطاقة.

تبرديمكن للشركات استخدام صباغة نظام التبريد مع المبردات الفريون في دوائر سريعة الحركة أو طرق أكثر ثورية. يجب أن يكون نظام الطاقة قويًا جدًا. وفقًا لـ Cerebras ، هذه الشريحة أسرع بحوالي 1000 مرة من الأنظمة التقليدية لمجرد أن الاتصال يمكن أن يتم عبر مسار الكتابة بدلاً من القفز فوق الدائرة (الربط ، DIMM ، إلخ).

رقاقة رسومات بسكويت الويفر مع 400000 نوى واستهلاك 15 كيلو وات 1

يحتوي WSE 400،000 الجبر الخطي المتناثر (جيش تحرير السودان). كل قلب مرن ، ويمكن برمجته وتحسينه للحسابات التي تدعم معظم الشبكات العصبية. مهارات البرمجة تضمن ذلك يستطيع المركز تنفيذ جميع الخوارزميات في مجال التعلم الآلي يتغير باستمرار

يتم توصيل 400000 مركز في WSE من خلال روابط اتصال Swarm في شبكة ثنائية الأبعاد بعرض نطاق يبلغ 100 Pb / s. Swarm عبارة عن شبكة اتصالات ضخمة توفر نطاقًا تردديًا مبتكرًا وزمن وصول منخفض في جزء صغير من استهلاك الطاقة من التقنيات التقليدية المستخدمة لتجميع وحدات معالجة الرسومات. هذا شكلي تماما. يقوم البرنامج بتكوين جميع نوى WSE لدعم الاتصال الدقيق اللازم لتدريب النماذج المعرفة من قبل المستخدم. لكل شبكة عصبية ، يوفر Swarm قناة اتصال فريدة ومحسنة.

وقد WSE ذاكرة مضمنة 18 جيجابايت في الشريحةيمكن الوصول إليها جميعًا في دورة ساعة واحدة وتوفر عرض نطاق ذاكرة PB / s 9. هذه هي سعة النطاق الترددي 3000 مرة وعرض النطاق الترددي 10000 مرة أكثر من المنافسين الرائدين. تتيح الذاكرة المركزية والمحلية الأكثر قدرة على إجراء حسابات سريعة ومرنة ، بوقت استجابة أقل وقوة أقل.

سيسمح هذا بتسريع كبير في تطبيقات الذكاء الاصطناعي. ويقلل وقت التدريب من شهور إلى بضع ساعات. هذا أمر ثوري حقًا ، ولا شك في ذلك ، على افتراض أنه يمكنهم الوفاء بوعودهم والبدء في تقديم هذا للعملاء على الفور. دماغ WSE أنتجت على رقائق TSMC 300 مم استخدام العملية الخاصة بك 16 نانومتروهو ما يعني أنها تكنولوجيا و مجرد عملية تصنيع وراء عمالقة مثل نفيديا. بالطبع ، مع 84 كتلة مترابطة تحتوي على أكثر من 400000 نواة ، فإن عملية التصنيع ليست مشكلة.

الدماغ WSE "width =" 740 "height =" 333

سيكون أداء وتكرار (تردد) الدماغ WSE مثيرًا للاهتمام للغاية. من ناحية ، إذا استخدمت الرقاقة بأكملها كقالب واحد ، فستحصل على نتائج 100٪ إذا كان التصميم يمكنه امتصاص العيوب أو 0٪ إذا لم تستطع. من الواضح ، لأنه تم عمل النموذج الأولي ، التصميم قادر على امتصاص العيوب.. في الواقع ، ذكر الرئيس التنفيذي أن التصميم ينتظر 1 ٪ إلى 1.5 ٪ من العيوب في منطقة السطح الوظيفية، لكن هذه ليست مشكلة ، لأن العمارة المصغرة بسيطة إعادة تكوين النوى المتاحة. أيضا يتم وضع النوى المفرطة في جميع أنحاء الشريحة لتقليل فقدان الأداء. لا توجد معلومات عن binning في الوقت الحالي ، ولكن من نافلة القول أن هذا هو التصميم الأكثر قابلية للتنقل في العالم.

قالوا لنا ذلك أيضا يجب على الشركة تصميم علم التصنيع والتغليف الخاص بها بينما لا توجد حاليًا أدوات مصممة للتعامل مع معالجات مقياس الرقاقة. ليس هذا فقط ، يجب إعادة كتابة البرنامج للتعامل مع أكثر من مليار ترانزستور في معالج واحد.

عبر: Wccftech