الأخبار التكنولوجية والاستعراضات والنصائح!

Hot Chips 31 Live Blogs: Habana's Approach to AI Scaling

Hot Chips 31 Live Blogs: Habana's Approach to AI Scaling 1

09:21 PM بتوقيت شرق الولايات المتحدة – الحديث الأخير اليوم في Hot Chips هو من Habana ، الذي يناقش مقاربته لكيفية توسيع نطاق حساب الذكاء الاصطناعي.

09:21 PM بتوقيت شرق الولايات المتحدة – جويا وغاودي

09:22 PM بتوقيت شرق الولايات المتحدة – تلخيص متطلبات التدريب مقابل الاستدلال

Hot Chips 31 Live Blogs: Habana's Approach to AI Scaling 2

09:24 PM بتوقيت شرق الولايات المتحدة – معالج غويا architecure

Hot Chips 31 Live Blogs: Habana's Approach to AI Scaling 3

09:24 PM بتوقيت شرق الولايات المتحدة – 3 محركات ، RPC ، GEMM ، و DMA. العمل بشكل متزامن مع مشاركة SRAM

09:24 PM بتوقيت شرق الولايات المتحدة – TPC هو VLIW SIMD الأساسية ، C- برمجة

09:24 PM بتوقيت شرق الولايات المتحدة – PCIe Gen 4.0 x16

09:24 PM بتوقيت شرق الولايات المتحدة – قناتين DDR4-2666 ، مبنية على TSMC 16

09:25 PM بتوقيت شرق الولايات المتحدة – يدعم UINT8 إلى FP32

09:25 PM بتوقيت شرق الولايات المتحدة – مخصص HW و TPC ISA لتكثيف وظيفة خاصة

09:25 PM بتوقيت شرق الولايات المتحدة – يجب ضبط القياس الكمي لخلط الدقة مقابل القوة

Hot Chips 31 Live Blogs: Habana's Approach to AI Scaling 4

09:26 PM بتوقيت شرق الولايات المتحدة – بطاقة PCIe – تكدس البرامج أكثر أهمية.

09:26 PM بتوقيت شرق الولايات المتحدة – Habana هي شركة برمجيات تصنع الأجهزة

09:27 PM بتوقيت شرق الولايات المتحدة – مترجم الرسم البياني مع محرك الكمي المدمج

Hot Chips 31 Live Blogs: Habana's Approach to AI Scaling 5

09:27 PM بتوقيت شرق الولايات المتحدة – يمكن تحميل وصفات متعددة للأجهزة

09:28 PM بتوقيت شرق الولايات المتحدة – يدعم Goya الطرز المدربة على أي معالج: CPU ، GPU ، TPU ، Gaudi ، إلخ

09:28 PM بتوقيت شرق الولايات المتحدة – يمكن للمستخدمين إنشاء طبقات مخصصة والنواة

Hot Chips 31 Live Blogs: Habana's Approach to AI Scaling 6

09:29 PM بتوقيت شرق الولايات المتحدة – لا يزال رائدًا في السوق منذ المعايير التي تم إجراؤها قبل 11 شهرًا مقابل وحدة المعالجة المركزية / وحدة معالجة الرسومات الشائعة

Hot Chips 31 Live Blogs: Habana's Approach to AI Scaling 7

09:29 PM بتوقيت شرق الولايات المتحدة – جديد لهذا اليوم ، نتائج اختبار اللغة الطبيعية

09:30 مساءً بتوقيت شرق الولايات المتحدة – دعم العمارة بيرت على غويا

09:30 مساءً بتوقيت شرق الولايات المتحدة – يتم استخدام GEMMs و TPCs بشكل كامل

09:30 مساءً بتوقيت شرق الولايات المتحدة – تم تصميم رقاقة قبل وقت طويل من استثمار بيرت

09:30 مساءً بتوقيت شرق الولايات المتحدة – اخترع

09:30 مساءً بتوقيت شرق الولايات المتحدة – درجة عالية من الدقة عند الكمي

09:30 مساءً بتوقيت شرق الولايات المتحدة – البرمجيات المدارة SRAM

Hot Chips 31 Live Blogs: Habana's Approach to AI Scaling 8

09:31 PM بتوقيت شرق الولايات المتحدة – الآن Gaudi ، معالج التدريب

Hot Chips 31 Live Blogs: Habana's Approach to AI Scaling 9

09:31 PM بتوقيت شرق الولايات المتحدة – الأداء في النطاق ، والإنتاجية العالية في حجم دفعة منخفضة ، وكفاءة الطاقة العالية

09:32 PM بتوقيت شرق الولايات المتحدة – تمكين مقياس إيثرنت أصلي – على رقاقة RDMA عبر شبكة إيثرنت متقاربة

09:32 PM بتوقيت شرق الولايات المتحدة – فتح وحدة حساب مسرع المشروع: OAM = (OCP) AM

09:32 PM بتوقيت شرق الولايات المتحدة – الإطار ومترجم دعم ML ، مكتبة TPC Kernet الغنية

09:32 PM بتوقيت شرق الولايات المتحدة – العمارة يشبه غويا

Hot Chips 31 Live Blogs: Habana's Approach to AI Scaling 10

09:33 PM بتوقيت شرق الولايات المتحدة – لقد تغيرت الشبكات ، تغيرت الذاكرة

09:33 PM بتوقيت شرق الولايات المتحدة – PCIe 4.0 x16 ، 4x8GB HBM

09:33 PM بتوقيت شرق الولايات المتحدة – 10 × 100 جيجابت أو 20 × 50 جيجابت

09:33 PM بتوقيت شرق الولايات المتحدة – يدعم UINT8 إلى FP32 و BF16

09:34 PM بتوقيت شرق الولايات المتحدة – SW يدعم أدوات التنميط

09:34 PM بتوقيت شرق الولايات المتحدة – رقاقة تدريب AI فقط مع RoCE v2

09:35 PM بتوقيت شرق الولايات المتحدة – كانت NVIDIA أول من عرض RoCE v2 لـ AI ، لكنها لم تنفذها بعد

09:36 PM بتوقيت شرق الولايات المتحدة – يعد NVIDIA GPU أكثر تعقيدًا مع دعم RoCE v2 عبر Mellanox

09:36 PM بتوقيت شرق الولايات المتحدة – Gaudi يدمج كلا

09:36 PM بتوقيت شرق الولايات المتحدة – يدعم الأقمشة ضياع وضياع

09:36 PM بتوقيت شرق الولايات المتحدة – ضوابط الازدحام المتقدمة

Hot Chips 31 Live Blogs: Habana's Approach to AI Scaling 11

Hot Chips 31 Live Blogs: Habana's Approach to AI Scaling 12

Hot Chips 31 Live Blogs: Habana's Approach to AI Scaling 13

Hot Chips 31 Live Blogs: Habana's Approach to AI Scaling 14

09:37 PM بتوقيت شرق الولايات المتحدة – يمكن للعملاء شراء بطاقات OAM أو خادم بطاقة 8

09:38 PM بتوقيت شرق الولايات المتحدة – صندوق الخادم لا يحتوي على وحدة المعالجة المركزية ، حتى العملاء لتكوين اللازمة. يستخدم mini-SAS HD

09:38 PM بتوقيت شرق الولايات المتحدة – اتصال Ethernet للارتباطات من نقطة إلى نقطة مع شبكة كاملة غير قابلة للحجب

09:38 PM بتوقيت شرق الولايات المتحدة – 3 منافذ لكل بطاقة لزيادة الحجم

Hot Chips 31 Live Blogs: Habana's Approach to AI Scaling 15

09:39 PM بتوقيت شرق الولايات المتحدة – يمكن اختيار نسبة وحدات المعالجة المركزية لبطاقات غاودي

Hot Chips 31 Live Blogs: Habana's Approach to AI Scaling 16

09:39 PM بتوقيت شرق الولايات المتحدة – غاودي ضد DGX

Hot Chips 31 Live Blogs: Habana's Approach to AI Scaling 17

09:40 PM بتوقيت شرق الولايات المتحدة – على عكس DGX ، لا تجبر المستخدم على فصل PCIe بين الإدارة والقياس. يقدم Gaudi منافذ PCIe منفصلة

09:41 PM بتوقيت شرق الولايات المتحدة – بطاقة PCIe فتحة مزدوجة متاحة أيضا

Hot Chips 31 Live Blogs: Habana's Approach to AI Scaling 18

09:41 PM بتوقيت شرق الولايات المتحدة – HL-200

Hot Chips 31 Live Blogs: Habana's Approach to AI Scaling 19

09:41 PM بتوقيت شرق الولايات المتحدة – مواز البيانات ممكن ، نموذج موازية ممكن

09:44 PM بتوقيت شرق الولايات المتحدة – يمكنه قفز الأداء عبر DGX-2 بسبب تحسين الاتصال. يمكن توصيل 64 رقاقة gaudi مع الإنتاجية غير حظر

09:45 PM بتوقيت شرق الولايات المتحدة – سؤال وجواب الوقت

09:46 PM بتوقيت شرق الولايات المتحدة – س: ما هو نوع الكمي يتطلب معالج؟ لا يوجد المعالج الكمي. يوجد محرك برمجي يأخذ طراز FP32 ويمكن قياسه على أنواع البيانات الأكثر كفاءة ويعطي ردود الفعل على دقة

09:47 PM بتوقيت شرق الولايات المتحدة – س: هل يمكنك التعليق على التوصيل البيني لـ GEMM؟ ج: إنها وحدة وظيفية واحدة.

09:48 PM بتوقيت شرق الولايات المتحدة – س: ما هو الحد الأدنى القابل للتطبيق لبوابة إنترنت الأشياء؟ ج: يمكنك استخدام بطاقة واحدة. يمكنك وضع gaudi في فتحة PCIe واحدة.

09:48 PM بتوقيت شرق الولايات المتحدة – هذا التفاف لهذا اليوم. المزيد من المحادثات غدا!