З натисканням одного компанії Taalas, компанії з виробництва Al-чипів, команда якої налічує всього понад двадцять осіб, вже залучено понад 200 мільйонів доларів фінансування.
Перший продукт HC1 пройшов шлях екстремальних рішень: використовуючи технологію Mask ROM, безпосередньо закріплює ваги Llama3.18B у металевому шарі чипа, обчислювальні блоки та параметри моделі знаходяться на одному кристалі, майже відмовляючись від програмованості, щоб досягти максимальної продуктивності, мінімальної затримки та оптимізації енергоефективності. Зараз вони закріпили ваги Llama3.18B, і, спробувавши його, виявили, що відповіді дає ненадійно і нестабільно. Але проблема в тому, що він надзвичайно швидкий, що здається нелогічним, і може знищити Groq: здатність видавати 17 000 токенів за секунду на один чип — за мить створює десятки тисяч слів, що навіть перевищує можливості баз даних. Якщо у майбутньому великі моделі дійсно залишаться лише кілька провідних гравців, структура моделей стане стабільною, а частота оновлення ваг знизиться, то створення окремого чипа для конкретної моделі цілком може бути не таким вже й безумством. Зараз ми припускаємо, що моделі будуть постійно змінюватися, тому обчислювальні ресурси мають бути універсальними. Але що, якщо моделі почнуть наближатися до стандарту? Закріплювати ваги у кристалі, а потім використовувати максимально спеціалізовану архітектуру для підвищення пропускної здатності, зменшуючи витрати. Зараз структура моделей починає централізуватися, і якщо структура провідних моделей стабілізується, то цілком логічно створити спеціалізовані чипи, орієнтовані на цю структуру. Можливий вибуховий потенціал цієї стратегії може бути дуже великим. Якщо так, виникає контрінтуїтивне питання: чи справді форма GPU залишиться вічним кінцем еволюції?
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
З натисканням одного компанії Taalas, компанії з виробництва Al-чипів, команда якої налічує всього понад двадцять осіб, вже залучено понад 200 мільйонів доларів фінансування.
Перший продукт HC1 пройшов шлях екстремальних рішень: використовуючи технологію Mask ROM, безпосередньо закріплює ваги Llama3.18B у металевому шарі чипа, обчислювальні блоки та параметри моделі знаходяться на одному кристалі, майже відмовляючись від програмованості, щоб досягти максимальної продуктивності, мінімальної затримки та оптимізації енергоефективності.
Зараз вони закріпили ваги Llama3.18B, і, спробувавши його, виявили, що відповіді дає ненадійно і нестабільно.
Але проблема в тому, що він надзвичайно швидкий, що здається нелогічним, і може знищити Groq: здатність видавати 17 000 токенів за секунду на один чип — за мить створює десятки тисяч слів, що навіть перевищує можливості баз даних.
Якщо у майбутньому великі моделі дійсно залишаться лише кілька провідних гравців, структура моделей стане стабільною, а частота оновлення ваг знизиться, то створення окремого чипа для конкретної моделі цілком може бути не таким вже й безумством.
Зараз ми припускаємо, що моделі будуть постійно змінюватися, тому обчислювальні ресурси мають бути універсальними.
Але що, якщо моделі почнуть наближатися до стандарту?
Закріплювати ваги у кристалі, а потім використовувати максимально спеціалізовану архітектуру для підвищення пропускної здатності, зменшуючи витрати.
Зараз структура моделей починає централізуватися, і якщо структура провідних моделей стабілізується, то цілком логічно створити спеціалізовані чипи, орієнтовані на цю структуру.
Можливий вибуховий потенціал цієї стратегії може бути дуже великим.
Якщо так, виникає контрінтуїтивне питання: чи справді форма GPU залишиться вічним кінцем еволюції?