Поставка данных становится瓶颈ом развития ИИ, в блокчейне данные ведут к новому времени DataFi.

Новая瓶颈 в развитии искусственного интеллекта: данные становятся основной проблемой

С быстрым ростом масштабов и вычислительных возможностей моделей искусственного интеллекта на поверхность выходит долгосрочно игнорируемая ключевая проблема — обеспечение данными. В настоящее время индустрия ИИ сталкивается со структурным противоречием: модели и вычислительные мощности уже сформировали зрелую рыночную систему, но производство, очистка, верификация и торговля данными все еще находятся на начальном этапе. В ближайшие десять лет акцент в развитии ИИ сместится с моделей и вычислительных мощностей на создание инфраструктуры данных.

Данные проблемы в AI-индустрии

С момента революции глубокого обучения количество параметров AI-моделей увеличилось с миллионов до триллионов, а требования к вычислительной мощности выросли в геометрической прогрессии. Однако рост качественных "органических данных", созданных человеком, близок к потолку. Например, в случае текстовых данных общее количество доступных качественных текстов в Интернете составляет примерно 10^12 слов, в то время как для обучения модели с триллионом параметров требуется около 10^13 слов данных. Это означает, что существующий пул данных может поддерживать обучение лишь небольшого количества моделей одинакового масштаба.

Более того, повторяющиеся и низкокачественные материалы составляют более 60%, что дополнительно сжимает объем доступных данных. Когда модели начинают активно использовать контент, созданный ИИ, "загрязнение данных" стало источником беспокойства для индустрии, так как это приводит к ухудшению производительности моделей. Корень этой противоречия в том, что индустрия ИИ долгое время рассматривала данные как "бесплатный ресурс", а не как "стратегические активы", которые требуют тщательного ухода.

Данные на блокчейне: идеальный материал для обучения ИИ

На этом фоне онлайновые данные блокчейн-сети демонстрируют уникальную ценность. По сравнению с традиционными интернет-данными, онлайновые данные обладают естественной подлинностью и надежностью:

  1. Реальные сигналы намерений: Данные на блокчейне фиксируют решения пользователей, сделанные за счет реальных денег, что напрямую отражает оценку ценности проекта и стратегии распределения средств.

  2. Прослеживаемая цепочка действий: прозрачность блокчейна позволяет полностью отслеживать действия пользователей, формируя последовательную "цепочку действий", что помогает ИИ создавать точные профили пользователей.

  3. Открытый доступ: Данные на блокчейне открыты для всех разработчиков, их можно получить без разрешения, что предоставляет низкосложный источник данных для обучения AI моделей.

Однако данные в блокчейне также сталкиваются с вызовами: они существуют в неструктурированном виде "журналов событий", и их необходимо сложным образом обрабатывать, чтобы их могли использовать модели ИИ. В настоящее время "уровень структуризации" данных в блокчейне составляет менее 5%, и огромное количество ценных сигналов теряется в массиве фрагментированной информации.

Построение "умной операционной системы" для данных на блокчейне

Чтобы решить проблему фрагментации данных в блокчейне, отрасль исследует создание "блокчейн-умной операционной системы", специально разработанной для ИИ. Основная цель таких систем заключается в преобразовании разрозненных сигналов блокчейна в структурированные, проверяемые и готовые к комбинации в реальном времени данные для ИИ. Включает в себя несколько ключевых компонентов:

  1. Открытые стандарты данных: унифицировать форматы данных различных блокчейнов и протоколов, чтобы ИИ мог напрямую "понимать" мир на блокчейне.

  2. Децентрализованный механизм верификации: использование механизмов консенсуса блокчейна для обеспечения подлинности и целостности данных.

  3. Высокопроизводительный уровень доступности данных: реализация обработки данных в реальном времени и низкой задержки передачи через оптимизацию алгоритмов и архитектуры.

  4. Протокол оценки данных: разработка модели ИИ для автоматической оценки качества наборов данных, предоставляющая ценовые ориентиры для рынка данных.

Переход к эпохе DataFi

Конечной целью этих усилий является переход индустрии ИИ в эпоху DataFi — данные станут "капиталом", который можно оценивать, торговать и увеличивать. В эту новую эпоху данные будут обладать четырьмя основными свойствами:

  1. Структурирование: исходные сигналы на блокчейне преобразуются в структурированные данные, которые могут быть напрямую использованы ИИ.

  2. Комбинируемость: данные из различных источников могут свободно комбинироваться, как строительные блоки LEGO, расширяя границы применения.

  3. Проверяемый: Подлинность данных может быть отслежена и проверена по записям в блокчейне.

  4. Ликвидность: Поставщики данных могут напрямую преобразовывать качественные данные в доход.

Заключение: Революция данных ведет к новой эпохе ИИ

Эволюция ИИ по своей сути является эволюцией инфраструктуры данных. От ограниченности данных, генерируемых человеком, до открытия ценности данных на блокчейне, от фрагментированных сигналов до структурированных активов, новое поколение инфраструктуры данных переосмысляет базовую логику отрасли ИИ. В грядущую эпоху DataFi данные станут мостом, соединяющим ИИ и реальный мир, способствуя появлению различных инновационных приложений.

Когда данные наконец-то получат заслуженную ценность, ИИ сможет по-настоящему раскрыть силу, изменяющую мир. Приложения следующего поколения ИИ требуют не только мощных моделей, но и высококачественных, надежных данных в качестве поддержки. Создание такой экосистемы данных станет ключевой задачей отрасли ИИ в следующие десять лет.

READY-0.33%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 7
  • Репост
  • Поделиться
комментарий
0/400
SigmaBrainvip
· 08-09 05:28
Дрифт на похоронной машине основан на данных.
Посмотреть ОригиналОтветить0
BoredWatchervip
· 08-08 00:30
Данные намного лучше, чем пакеты с продуктами.
Посмотреть ОригиналОтветить0
ChainComedianvip
· 08-06 13:10
Данных недостаточно, даже GPT придется голодать.
Посмотреть ОригиналОтветить0
airdrop_whisperervip
· 08-06 11:21
Рано или поздно данные станут самым дорогим активом.
Посмотреть ОригиналОтветить0
MeltdownSurvivalistvip
· 08-06 11:18
Старое как мир: данные – это ключ к успеху.
Посмотреть ОригиналОтветить0
LiquidityHuntervip
· 08-06 11:17
В конечном итоге, это все еще зависит от данных и новых узких мест.
Посмотреть ОригиналОтветить0
FarmHoppervip
· 08-06 11:11
Чёрт, данные и ресурсы уже почти дошли до драки в реальной жизни.
Посмотреть ОригиналОтветить0
  • Закрепить