Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
TradFi
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Pre-IPOs
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Khuyến mãi
AI
Gate AI
Trợ lý AI đa năng đồng hành cùng bạn
Gate AI Bot
Sử dụng Gate AI trực tiếp trong ứng dụng xã hội của bạn
GateClaw
Gate Tôm hùm xanh, mở hộp là dùng ngay
Gate for AI Agent
Hạ tầng AI, Gate MCP, Skills và CLI
Gate Skills Hub
Hơn 10.000 kỹ năng
Từ văn phòng đến giao dịch, thư viện kỹ năng một cửa giúp AI tiện lợi hơn
GateRouter
Lựa chọn thông minh từ hơn 40 mô hình AI, với 0% phí bổ sung
Trong 15 năm qua, bạn đã luôn đào tạo AI cho Google — chỉ là bạn chưa từng biết điều đó
原文:@sharbel
编译:大钳子 | PANews 龙虾 50万 giờ lao động thủ công miễn phí. Mỗi ngày như vậy. Đóng góp của những người nghĩ rằng họ chỉ đang đăng nhập vào tài khoản ngân hàng.
reCAPTCHA là chiến dịch thu thập dữ liệu ẩn danh thành công nhất trong lịch sử internet. Thời kỳ đỉnh cao, mỗi ngày có 200 triệu người hoàn thành xác thực này. Hầu như không ai biết mình đang xây dựng cái gì.
Waymo — công ty xe tự lái thuộc Google — hiện trị giá 45 tỷ USD. Một phần lớn dữ liệu huấn luyện quan trọng của họ đến từ chính bạn. Miễn phí. Từ mỗi trang web bạn đã truy cập.
Dưới đây là câu chuyện đầy đủ.
Khởi nguồn: Một ý tưởng thông minh
Năm 2000, các phần mềm gửi thư rác đang phá hủy toàn bộ internet. Các diễn đàn bị tràn ngập spam, hộp thư quá tải. Các trang web cần một phương pháp phân biệt người và máy móc cấp bách.
Giáo sư tại Đại học Carnegie Mellon, Louis von Ahn, đã giải quyết vấn đề này. Ông phát minh ra CAPTCHA: một dạng ký tự bị biến dạng chỉ con người mới có thể đọc được. Robot thì không thể vượt qua, còn con người thì có thể.
Nhưng von Ahn nhìn thấy nhiều khả năng hơn. Hàng triệu người đang tiêu tốn năng lượng nhận thức vào các xác thực này. Nếu năng lượng đó có thể làm hai việc cùng lúc thì sao?
Năm 2007, ông ra mắt reCAPTCHA. Điểm đặc biệt của nó là: không hiển thị ký tự ngẫu nhiên, mà là hai từ. Một trong số đó đã được hệ thống biết rõ, từ còn lại là từ quét trong các cuốn sách chưa được số hóa mà máy tính vẫn chưa thể nhận diện. Phản hồi của bạn giúp hoàn thành công việc số hóa.
Những cuốn sách này đến từ kho lưu trữ của The New York Times và Google Books — liên quan đến hơn 130 triệu cuốn sách.
Bạn nghĩ mình chỉ đăng nhập, thực ra bạn đang giúp thư viện số lớn nhất thế giới nhận dạng ký tự quang học (OCR).
Năm 2009, Google mua lại reCAPTCHA.
Google thay đổi luật chơi
Thời kỳ ký tự bị biến dạng kết thúc vào khoảng năm 2012.
Google đối mặt với một vấn đề mới. Xe chụp ảnh Street View đang ghi lại mọi con đường trên trái đất, nhưng những bức ảnh chỉ là dữ liệu thô. Để AI hữu ích thực sự, nó cần hiểu rõ nội dung mình “nhìn thấy”: biển báo giao thông, vạch đi bộ, đèn tín hiệu, biển hiệu cửa hàng.
Vì vậy, Google đã thiết kế lại reCAPTCHA v2. Nội dung xác thực chuyển từ ký tự bị biến dạng sang lưới hình ảnh: “Chọn tất cả các ô chứa đèn tín hiệu.” “Chọn tất cả các vạch đi bộ.” “Nhận diện biển hiệu cửa hàng.”
Những hình ảnh này lấy trực tiếp từ Google Street View.
Mỗi lần bạn nhấp là một nhãn dữ liệu. Mỗi lựa chọn của bạn đều gửi tín hiệu cho mô hình thị giác máy tính của Google: ô vuông này là đèn tín hiệu, hình dạng kia là vạch đi bộ.
Bạn không chỉ đang làm bài kiểm tra, bạn đang xây dựng bộ dữ liệu.
Quy mô không ai nói tới
Thời kỳ đỉnh cao, mỗi ngày có 200 triệu reCAPTCHA được hoàn thành.
Mỗi lần xác thực mất khoảng 10 giây, nghĩa là mỗi ngày có 2 tỷ giây lao động thủ công — quy ra là hơn 500.000 giờ mỗi ngày.
Giá thị trường cho dữ liệu nhãn thủ công chuyên nghiệp là từ 10 đến 50 USD mỗi giờ. Với mức giá thấp nhất, ta có thể tính: mỗi ngày, giá trị lao động miễn phí này lên tới 5 triệu USD.
Hơn nữa, reCAPTCHA không chỉ xuất hiện trên một ứng dụng nào đó, mà khắp mọi ngân hàng, cổng chính phủ, nền tảng thương mại điện tử, mọi trang đăng nhập trên internet. Bạn không còn lựa chọn nào khác. Muốn truy cập tài khoản? Phải nhấn nhãn dữ liệu.
Google chưa từng hỏi ý kiến bạn, chưa từng trả tiền cho bạn, thậm chí chưa từng nói cho bạn biết chuyện này.
Những gì tất cả đã xây dựng
Những dữ liệu này trực tiếp cung cấp cho hai sản phẩm.
Google Maps. Công cụ dẫn đường phổ biến nhất toàn cầu. Khả năng đọc biển báo, định vị doanh nghiệp, hiểu về địa lý thành phố của nó phần lớn dựa vào hàng tỷ lần nhãn thủ công mà những người truy cập web đã đóng góp mà họ không hề hay biết.
Và cả Waymo.
Waymo là dự án xe tự lái của Google, trở thành công ty con độc lập từ năm 2016. Để lái xe an toàn, xe tự lái cần nhận diện gần như hoàn hảo hàng nghìn kiểu mẫu hình ảnh: đèn tín hiệu, vạch đi bộ, người đi bộ, biển báo dừng xe.
Dữ liệu huấn luyện thực tế cho khả năng nhận diện này? Được tạo ra bởi hàng triệu người qua việc hoàn thành reCAPTCHA — mà họ không hề hay biết.
Năm 2024, Waymo đã hoàn thành hơn 4 triệu chuyến đi trả phí, hoạt động tại San Francisco, Los Angeles và Phoenix, và vẫn đang mở rộng. Giá trị của nó hiện là 45 tỷ USD.
Và nền móng của nó chính là những người dùng internet miễn phí, chỉ muốn gửi email và duyệt web.
Tại sao không ai có thể sao chép tất cả điều này
Chi phí nhãn dữ liệu rất cao. Các công ty như Scale AI, Appen, Labelbox tồn tại để giải quyết vấn đề này. Họ thuê hàng trăm nghìn công nhân để nhãn hình ảnh, thù lao có khi chưa tới 1 USD/giờ.
Google đã giải quyết vấn đề theo một cách hoàn toàn khác: họ biến việc nhãn dữ liệu thành bắt buộc. Không trả tiền, không cần sự đồng ý, mà như một “phí vào cửa” để truy cập mọi trang web.
Kết quả: hàng tỷ hình ảnh đã được nhãn, phủ khắp toàn cầu, trong mọi điều kiện thời tiết, mọi thời điểm, mọi thành phố trên trái đất.
Không công ty nhãn dữ liệu nào có thể làm được điều này. Internet chính là nhà máy đó, và mỗi người dùng trong đó đều là nhân viên chưa từng ký hợp đồng.
Những việc bạn vẫn làm ngày hôm nay
Năm 2018, reCAPTCHA v3 ra đời, không còn hiển thị thử thách xác thực nào nữa. Thay vào đó, nó theo dõi cách bạn di chuột, cuộn trang, thời gian dừng chuột. Dấu vân tay hành vi của bạn cho biết bạn có phải là con người hay không.
Dữ liệu hành vi này cũng được phản hồi về hệ thống AI của Google.
Bạn chưa từng chủ động chọn tham gia, không có ô tích nào để bạn tick. Hiện tại, trên hầu hết các trang web bạn truy cập, bạn vẫn đang làm như vậy.
Một sự mỉa mai khiến tất cả phải suy nghĩ
Ý tưởng ban đầu của Louis von Ahn là một sáng kiến thiên tài: chuyển năng lượng nhận thức vốn đã tiêu hao vào việc lọc rác, sang một việc có giá trị hơn — số hóa sách trên toàn thế giới, giải quyết một vấn đề thực tế.
Nhưng cách Google vận dụng ý tưởng này lại là chuyện khác.
Họ lấy đi một cơ chế bảo vệ người dùng không còn lựa chọn nào khác, rồi triển khai nó trên toàn internet, thu hoạch thành quả, xây dựng các sản phẩm trị giá hàng tỷ USD.
Người dùng chẳng nhận được gì, thậm chí không có quyền biết.
Sự mỉa mai sâu sắc nhất là: bạn đã dành nhiều năm để chứng minh mình là con người — bằng cách thực hiện những công việc nhận diện hình ảnh mà AI thời đó còn chưa thể làm nổi. Nhưng khi AI học được việc này, công việc nhãn dữ liệu của con người trở nên thừa thãi.
Bạn đã chứng minh mình là con người, bằng cách trở thành người có thể bị thay thế.
Nguồn: Đại học Carnegie Mellon, blog Google (2009), WebProNews, MakeUseOf, MIT Technology Review, tài liệu công khai của Waymo.