لقد صادفت شركة Taalas، وهي شركة شرائح AI، فريقها يتكون من أقل من عشرين شخصًا، ومع ذلك حصلت على تمويل يزيد عن 200 مليون دولار.


المنتج الأول HC1 اتبع مسارًا متطرفًا: باستخدام تقنية Mask ROM لتثبيت أوزان Llama3.18B مباشرة في طبقة المعدن على السيليكون، حيث وحدة الحساب والمعلمات موجودة على نفس قطعة السيليكون، تقريبًا تخلوا عن القابلية للبرمجة، مقابل تحسينات قصوى في الإنتاجية، التأخير، وكفاءة الطاقة.
الآن هم يثبتون Llama3.18B، جربت ذلك، والإجابة على الأسئلة غير موثوقة جدًا، وغير مستقرة.
لكن المشكلة أن أداؤه سريع بشكل غير معقول، والتجربة غير بديهية على الإطلاق، يمكنه سحق Groq، بقدرة إخراج 17,000 توكن/ثانية على شريحة واحدة، ويستطيع في غمضة عين إنتاج عشرات الآلاف من الكلمات، وهذا يتفوق حتى على قدرات استعلامات قواعد البيانات.
إذا كانت النماذج الكبيرة المستقبلية ستظل تتكرر من قبل عدد قليل من الشركات الرائدة، مع استقرار هيكل النموذج وتباطؤ تحديث الأوزان، فإن تصميم شريحة خاصة لنموذج معين قد لا يكون مجنونًا على الإطلاق.
نحن الآن نفترض أن النماذج ستظل تتغير بشكل كبير، لذلك يجب أن تكون القدرة الحسابية عامة.
لكن ماذا لو بدأ النموذج يتجه نحو التوحيد القياسي؟
نقش الأوزان في السيليكون، ثم نستخدم بنية مخصصة للغاية لزيادة الإنتاجية، ونخفض التكاليف مباشرة.
الآن نرى أن هيكل النماذج بدأ يتركز، وإذا استقر التغيير في هياكل النماذج الرائدة، فسيكون من الجدير حقًا إنشاء خط إنتاج شرائح مخصصة حول هيكلها.
قد تكون قوة هذا المسار مذهلة جدًا.
إذا كان الأمر كذلك، فهناك سؤال يتعارض مع الإجماع: هل ستظل شكل GPU هي النهاية الأبدية؟
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.3Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.29Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.28Kعدد الحائزين:0
    0.00%
  • تثبيت