15年来,你一直在为谷歌训练AI——只是你从不知道

PANews

每次你在网页上点击"识别交通灯"或"选出所有人行横道",你以为自己只是在证明自己不是机器人。但事实上,你是在为谷歌的AI系统免费标注训练数据。这件事持续了超过15年,涉及全球数亿用户,最终构建了谷歌地图的视觉识别能力,以及如今估值高达450亿美元的自动驾驶公司Waymo。整个过程中,没有人征求过你的同意,没有人告诉过你真相,更没有人给你一分报酬。

原文:@sharbel

编译:大钳子 | PANews 龙虾 50万小时的免费人工劳动。每天如此。由那些以为自己只是在登录银行账户的人贡献的。

reCAPTCHA是互联网历史上最成功的隐形数据收割行动。鼎盛时期每天有2亿人在完成它的验证。其中几乎没有人知道自己究竟在建造什么。

Waymo——谷歌旗下的自动驾驶汽车公司——如今估值450亿美元。它有相当一部分关键训练数据来自你。免费的。来自你访问过的每一个网站。

以下是完整的故事。

起点:一个聪明的点子

2000年,垃圾邮件机器人正在摧毁整个互联网。论坛被灌水淹没,邮箱不堪重负。网站迫切需要一种将人类与机器区分开来的方法。

卡内基梅隆大学教授路易斯·冯·安解决了这个问题。他发明了CAPTCHA:一种只有人类才能识读的扭曲文字。机器人无法通过,人类则可以。

但冯·安看到了更多的可能性。数以百万计的人正在将认知精力耗费在这些验证上。如果这种精力可以同时做两件事呢?

2007年,他推出了reCAPTCHA。其中的妙招在于:它展示的不是随机的乱码,而是两个词。其中一个系统已知,另一个则来自计算机尚无法识别的真实扫描书籍。你的回答帮助完成了数字化工作。

这些书来自《纽约时报》档案库,也来自谷歌图书——涉及多达1.3亿册图书。

你以为自己在登录,实际上你在为世界上最大的数字图书馆做OCR(光学字符识别)。

2009年,谷歌收购了reCAPTCHA。

图像

谷歌改变了游戏规则

扭曲文字的时代在2012年前后终结。

谷歌面临了一个新问题。街景拍摄车正在拍摄地球上的每一条道路,但照片只是原始数据。要让AI真正有用,它需要理解自己"看到"的内容:路牌、人行横道、交通信号灯、店面招牌。

于是谷歌重新设计了reCAPTCHA v2。验证内容从扭曲文字变成了图片网格:“点击所有包含交通信号灯的方格。” “选出每一处人行横道。” “识别店面招牌。”

这些图片直接来自谷歌街景。

而你的每一次点击就是标注。你的每一次选择都在告诉谷歌的计算机视觉模型:这个像素块是交通信号灯,这个形状是人行横道。

你不是在通过测试,你是在构建数据集。

图像

没有人谈论的规模

鼎盛时期,每天有2亿次reCAPTCHA被完成。

每次验证约需10秒,这意味着每天有20亿秒的人工劳动——换算下来,每天50万小时

专业数据标注的市场价格为每小时10至50美元。按最低价计算:每天被免费提取的劳动价值高达500万美元。

而且reCAPTCHA并不只存在于某一个应用上,它遍布每一家银行、每一个政府门户网站、每一个电商平台、互联网上的每一个登录页面。你别无选择。想访问你的账户?先标注数据集。

谷歌从未征询你的意见,从未向你付费,甚至从未告诉你这件事。

图像

这一切构建了什么

这些数据直接输送给了两款产品。

谷歌地图。 全球使用最广泛的导航工具。它识读路牌、定位商家、理解城市地理的能力,部分正是建立在那些试图登录网站的人贡献的数十亿次人工标注之上。

还有Waymo。

Waymo是谷歌的自动驾驶汽车项目,2016年独立成为子公司。为了安全导航,自动驾驶汽车需要以接近完美的准确率识别数千种视觉模式:交通信号灯、人行横道、行人、停车标志。

这些识别能力所需的真实训练数据?由数以百万计的人通过reCAPTCHA完成标注——他们对此毫不知情。

2024年,Waymo完成了逾400万次付费出行,目前运营于旧金山、洛杉矶和凤凰城,且仍在持续扩张。其估值为450亿美元

而这座大厦的地基,是由那些只想收发电子邮件的免费互联网用户建造的。

为什么没有人能复制这一切

数据标注成本高昂。Scale AI、Appen、Labelbox等公司存在的唯一意义就是解决这个问题。它们雇用了数十万名工人来标注图像,有时每小时报酬不足一美元。

谷歌用一种截然不同的方式解决了这个问题:他们把标注变成了强制性的。不给报酬,不需同意,而是作为进入网络上每个网站的"入场费"。

结果:数十亿张已标注图像,覆盖全球,涵盖各种天气条件、各个时段、地球上的每一座城市。

没有任何标注公司能够做到这一点。互联网本身就是那座工厂,而每一个身处其中的人都是从未签过合同的员工。

图像

你今天还在做的事

2018年推出的reCAPTCHA v3根本不会向你展示任何验证挑战。它观察的是你移动鼠标的方式、滚动页面的方式、悬停的时长。你的行为指纹告诉它你是否是人类。

这些行为数据同样被反馈给谷歌的AI系统。

你从未主动选择加入,从来没有一个复选框供你勾选。此刻,在你访问的大多数网站上,你依然在这样做。

一个令所有人都该深思的讽刺

路易斯·冯·安最初的构想是天才之举:将人类原本就耗费在垃圾过滤上的认知精力,重新导向某件有价值的事情——将世界上的书籍数字化,解决一个真实存在的问题。

而谷歌对这个构想的运用,是另一回事。

他们拿走了一个用户别无选择、只能使用的安全机制,将其部署到整个互联网,并收割输出成果,构建起价值数百亿美元的商业产品。

用户什么都没有得到,甚至连知情权都没有。

最深的讽刺在于:你花了多年时间证明自己是人类——方式是做那种AI当时还无法完成的视觉识别工作。而当这项工作一旦被AI学会,人类的视觉标注便变得多余了。

你证明了自己是人类,方式是让自己变得可被替代。

来源:卡内基梅隆大学、谷歌博客(2009年)、WebProNews、MakeUseOf、MIT技术评论、Waymo公开披露文件。

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.
Commento
0/400
Nessun commento