Фьючерсы
Доступ к сотням фьючерсов
TradFi
Золото
Одна платформа мировых активов
Опционы
Hot
Торги опционами Vanilla в европейском стиле
Единый счет
Увеличьте эффективность вашего капитала
Демо-торговля
Введение в торговлю фьючерсами
Подготовьтесь к торговле фьючерсами
Фьючерсные события
Получайте награды в событиях
Демо-торговля
Используйте виртуальные средства для торговли без риска
Запуск
CandyDrop
Собирайте конфеты, чтобы заработать аирдропы
Launchpool
Быстрый стейкинг, заработайте потенциальные новые токены
HODLer Airdrop
Удерживайте GT и получайте огромные аирдропы бесплатно
Launchpad
Будьте готовы к следующему крупному токен-проекту
Alpha Points
Торгуйте и получайте аирдропы
Фьючерсные баллы
Зарабатывайте баллы и получайте награды аирдропа
Инвестиции
Simple Earn
Зарабатывайте проценты с помощью неиспользуемых токенов
Автоинвест.
Автоинвестиции на регулярной основе.
Бивалютные инвестиции
Доход от волатильности рынка
Мягкий стейкинг
Получайте вознаграждения с помощью гибкого стейкинга
Криптозаймы
0 Fees
Заложите одну криптовалюту, чтобы занять другую
Центр кредитования
Единый центр кредитования
Тысячи людей по всему миру продают свои личные данные для обучения ИИ, но какая цена?
Автор: The Guardian
Перевод: Deep潮 TechFlow
Deep潮 Введение: Эта расследовательская статья раскрывает быстро растущую серую индустрию: тысячи людей по всему миру зарабатывают на продаже своих голосов, лиц, звонков и повседневных видео для обучения ИИ.
Это не просто поверхностное обсуждение вопросов конфиденциальности, а расследование с реальными людьми, реальными суммами и реальными последствиями — актёр, продавший своё лицо, позже увидел в Instagram, что “его” рекламируют неизвестные медицинские продукты, а в комментариях оценивают его “внешность”.
Когда жажда данных со стороны ИИ-компаний сочетается с глобальным экономическим разрывом, возникает неравноправная сделка.
Полностью текст ниже:
Однажды утром в прошлом году, живущий в Кейптауне, Юбаку Лоу вышел на прогулку, как обычно, кормил чаек. Но на этот раз он записал несколько видео — свои шаги по тротуару и обзор. За это он получил 14 долларов, что примерно в 10 раз превышает минимальную зарплату в стране и равно половине его недельных расходов на еду, будучи 27-летним молодым человеком.
Это была задача “городской навигации” на платформе Kled AI. Kled AI — приложение, платящее пользователям за загрузку фотографий, видео и других данных для обучения ИИ. За несколько недель Лоу заработал 50 долларов, загружая повседневные фото и видео.
За тысячи миль, в Индии, в Ланчхи, 22-летний студент Сахил Тигга регулярно зарабатывает на Silencio — приложении, собирающем аудиоданные для обучения ИИ, которое использует микрофон его телефона для записи шумов внутри ресторанов или на оживлённых перекрёстках. Он также загружает свои голосовые записи. Сахил специально посещает уникальные места, например, не зафиксированные на карте Silencio отели. За счёт этого он зарабатывает более 100 долларов в месяц, что полностью покрывает его расходы на питание.
В Чикаго 18-летний сварщик-ученик Рамелио Хилл продаёт личные переписки с друзьями и семьёй Neon Mobile — платформе для обучения диалоговых ИИ, платящей 0,50 долларов за минуту — и зарабатывает несколько сотен долларов. Для Хилла это просто: он считает, что технологические компании уже владеют его личными данными, и решил извлечь из этого выгоду.
Эти “подработки для обучения ИИ” — загрузка сцен, своих фотографий, видео и аудио — стоят на передовой глобальной новой золотой лихорадки данных. По мере того как Кремниевая долина испытывает острую потребность в качественных данных о людях, превышающую возможности открытого интернета, появляется быстроразвивающаяся индустрия рынка данных, заполняющая этот пробел. От Кейптауна до Чикаго тысячи людей делятся своими биометрическими данными и личной информацией, предоставляя их в микроскопические разрешения для следующего поколения ИИ.
Но эта новая экономика подработки сопровождается ценой. За несколько долларов эти обучающие люди питают индустрию, которая в конечном итоге может сделать их навыки устаревшими, а также подвергнуть рискам глубокие подделки, кражу личных данных и цифровое рабство — и они только начинают это осознавать.
Движение ИИ
Модели языкового ИИ, такие как ChatGPT и Gemini, требуют огромных объёмов данных для постоянного улучшения, но сталкиваются с нехваткой данных. Самые популярные источники обучения — C4, RefinedWeb и Dolma — составляют четверть лучших наборов данных в интернете, и сейчас ограничивают возможности генеративных ИИ-компаний по их использованию. Исследователи оценивают, что к 2026 году компании ИИ могут исчерпать запасы свежих высококачественных текстов. Хотя некоторые лаборатории уже используют синтетические данные, созданные ИИ, для обратного обучения, этот рекурсивный процесс может привести к накоплению ошибок и сбоям.
Здесь на сцену выходят такие платформы, как Kled AI и Silencio. В этих рынках данных миллионы людей продают свои личные данные для обучения ИИ. Помимо Kled AI, Silencio и Neon Mobile, есть и другие варианты: например, Luel AI, поддерживаемый известным инкубатором Y-Combinator, собирает мультиязычные диалоговые материалы по цене около 0,15 долларов за минуту; ElevenLabs позволяет цифрово клонировать ваш голос и использовать его за 0,02 доллара за минуту.
Профессор экономики Лондонского королевского колледжа Боуке Клайн Тиселинк говорит, что подработка для обучения ИИ — это новая категория работы, которая быстро растёт.
По словам Тиселинка, компании ИИ понимают, что оплата за использование данных помогает избежать возможных юридических споров, связанных с авторскими правами, при полном отсутствии возможности собирать данные через веб-скрапинг. Исследователь Вениамин Веселовский отмечает, что для систем необходимы высококачественные данные для моделирования новых и улучшенных поведений. “На данный момент человеческие данные — это золотой стандарт для выборки вне модели,” — добавляет он.
Люди, движущие эти машины, особенно из развивающихся стран, зачастую нуждаются в этих деньгах и почти не имеют другого выбора. Для многих подработка для обучения ИИ — это прагматичный ответ на экономический разрыв. В странах с высоким уровнем безработицы и обесцениванием национальной валюты зарабатывание долларов зачастую стабильнее и выгоднее, чем местная работа. Некоторые не могут найти начальную работу и вынуждены заниматься обучением ИИ ради выживания. Даже в более богатых странах рост стоимости жизни делает продажу своих данных логичным финансовым решением.
Житель Кейптауна Лоу ясно понимает цену конфиденциальности. Хотя его доходы нестабильны и не покрывают все расходы, он готов идти на это ради заработка. Много лет он страдает от нервных заболеваний и не может найти работу, но заработанных на рынке данных (включая Kled AI) 500 долларов хватило, чтобы записаться на курс массажа и стать массажистом.
“Для южноафриканца получение долларов — это ценность больше, чем для других,” — говорит Лоу.
Профессор интернет-географии Оксфордского университета Марк Грэм, автор книги “Кормление машин”, признаёт, что для людей из развивающихся стран эти деньги могут иметь краткосрочное значение, но предупреждает: “Структурно эта работа нестабильна, без перспектив роста и фактически — тупик.”
Грэм добавляет, что рынок данных для ИИ зависит от “гонки цен на зарплаты” и “временного спроса на человеческие данные”. Когда этот спрос исчезнет, “работники останутся без гарантий, без переносимых навыков и без социальной защиты.”
Он считает, что единственными победителями являются “платформы Северной полушария, которые захватывают всю долгосрочную ценность.”
Полномочия на использование данных
Житель Чикаго Хилл, продававший личные звонки Neon Mobile, чувствует смешанные чувства. За около 11 часов разговоров он получил 200 долларов, но говорит, что приложение часто отключается и задерживает выплаты. “Neon казался мне подозрительным, но я всё равно продолжал пользоваться, чтобы подзаработать на оплату счетов,” — рассказывает Хилл.
Теперь он начинает сомневаться, что эти деньги так уж легко зарабатываются. В сентябре прошлого года Neon Mobile отключился через несколько недель после запуска, после того как TechCrunch обнаружил уязвимость, позволяющую любому получить доступ к номерам телефонов, записям звонков и перепискам пользователей. Хилл говорит, что платформа никогда его об этом не уведомляла, и теперь он опасается, что его голос может быть использован в сети злоумышленниками.
Исследователь по вопросам конфиденциальности данных в Институте человекоцентричного ИИ Стэнфордского университета Дженнифер Кинг обеспокоена тем, что рынок данных для ИИ неясен относительно того, как и где будут использоваться пользовательские данные. Она добавляет, что без знания своих прав и возможности вести переговоры “потребители рискуют, что их данные будут использованы в нежелательных, непонятных или непредвиденных целях, и практически без возможности защиты.”
Когда обучающие ИИ делятся данными на платформах вроде Neon Mobile и Kled AI, они предоставляют полные права (глобальные, эксклюзивные, безотзывные, передаваемые и без роялти), позволяющие платформам продавать, использовать, публично демонстрировать и хранить их изображения, а также создавать производные работы.
Основатель Kled AI Ави Патель говорит, что их договоры используют ограничение только для целей обучения и исследований ИИ. “Вся бизнес-модель основана на доверии пользователей. Если участники считают, что их данные могут быть использованы неправомерно, платформа не сможет функционировать.” Он добавляет, что компания проверяет покупателей перед продажей данных, чтобы избегать сотрудничества с “подозрительными” организациями, например, с порнографической индустрией, или с “правительственными структурами”, которые могут использовать данные в нарушении доверия.
Neon Mobile не ответил на запросы о комментариях.
Лондонский профессор права Университета города Сан-Георгий Эрико Бонадио отмечает, что эти договоры позволяют платформам и их клиентам “делать практически всё с этим материалом навечно, без дополнительных платежей, а участники не имеют реальной возможности отозвать согласие или пересмотреть условия.”
Более тревожные риски включают использование данных для создания глубоких подделок и кражи личных данных. Несмотря на то, что рынок данных заявляет, что перед продажей удаляет идентифицирующую информацию (имена, местоположение), биометрические особенности по своей природе трудно анонимизировать, добавляет Бонадио.
Жалобы продавцов
Даже если обучающие ИИ смогут договориться о более детальных условиях использования данных, они могут пожалеть об этом. В 2024 году актёр из Нью-Йорка Адам Кой продал своё изображение за 1000 долларов платформе Captions — ныне Mirage. В его договоре было указано, что его лицо не будет использоваться в политических целях, для рекламы алкоголя, табака или порнографии, а срок действия лицензии — один год.
Captions не ответил на запрос о комментариях.
Вскоре после этого друзья Адама начали распространять видео, в которых его лицо и голос использовались для роликов с миллионами просмотров. В одном из видео в Instagram его AI-двойник называл себя “гинекологом” и рекламировал непроверенные медицинские добавки для беременных и рожениц.
“Мне было неловко объяснять это другим,” — говорит Кой.
“В комментариях люди оценивают мою внешность, хотя это вовсе не я,” — добавляет он. “Когда я принимал решение продать лицо, я думал, что большинство моделей всё равно собирают данные в интернете, так что лучше за это заплатить.”
Кой говорит, что больше не занимается подработками для обучения ИИ. Он готов рассмотреть такие предложения только при существенном вознаграждении.