Лише думка: можливо, "бітстрім" краще передає суть, ніж "токен", коли ми говоримо про архітектуру ШІ. І ось у чому справа - чому ми досі одержимі кількістю параметрів? Справжні вузькі місця знаходяться прямо перед нами: обсяг пам'яті, обмеження пропускної здатності та обчислювальні операції. Розмір файлу говорить вам набагато більше про те, що насправді можливо. Ми повинні оцінювати моделі ШІ за тим, що фізично їх обмежує, а не за якимись абстрактними числами, які виглядають вражаюче на папері.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
12 лайків
Нагородити
12
5
Репост
Поділіться
Прокоментувати
0/400
BanklessAtHeart
· 10год тому
Думки стрибають так швидко, що я заплутався.
Переглянути оригіналвідповісти на0
DataPickledFish
· 17год тому
Тверді бики справжні бики!
Переглянути оригіналвідповісти на0
AirdropLicker
· 17год тому
Розмір файлу — це справжня цінність~
Переглянути оригіналвідповісти на0
HallucinationGrower
· 18год тому
Це всього лише модельний параметр плюс купа води.
Переглянути оригіналвідповісти на0
ZKProofster
· 18год тому
технічно кажучи, розмір != можливість... це просто базова інформаційна теорія смх
Лише думка: можливо, "бітстрім" краще передає суть, ніж "токен", коли ми говоримо про архітектуру ШІ. І ось у чому справа - чому ми досі одержимі кількістю параметрів? Справжні вузькі місця знаходяться прямо перед нами: обсяг пам'яті, обмеження пропускної здатності та обчислювальні операції. Розмір файлу говорить вам набагато більше про те, що насправді можливо. Ми повинні оцінювати моделі ШІ за тим, що фізично їх обмежує, а не за якимись абстрактними числами, які виглядають вражаюче на папері.