อุตสาหกรรมสีเทาใหม่ทั้งหมด: มีคนทั่วโลกหลายพันคนกำลังขายตัวเองเพื่อฝึก AI แต่ราคาที่ต้องจ่ายคืออะไร?

CryptoCity

ผู้คนทั่วโลกหลายพันคนขายเสียง รูปภาพ และบันทึกการโทรเพื่อเลี้ยง AI แลกกับรายได้ แต่ต้องเผชิญความเสี่ยงจากการปลอมแปลงที่ลึกซึ้งและการอนุญาตที่ไม่สามารถเพิกถอน

บทนำจาก Deep Tide: รายงานการสอบสวนของ The Guardian ในอังกฤษได้เปิดเผยถึงอุตสาหกรรมสีเทาที่เติบโตอย่างรวดเร็ว: ผู้คนหลายพันคนทั่วโลกทำเงินจากการขายเสียง รูปหน้า บันทึกการโทร และคลิปวิดีโอในชีวิตประจำวันเพื่อฝึกฝน AI นี่ไม่ใช่การอภิปรายทั่วไปเกี่ยวกับความเป็นส่วนตัว แต่เป็นการสอบสวนที่มีตัวตนจริง จำนวนเงินที่แท้จริง และผลกระทบที่แท้จริง — นักแสดงคนหนึ่งที่ขายใบหน้าของตนเองในภายหลังได้เห็น “ตัวเอง” โฆษณาผลิตภัณฑ์ทางการแพทย์ที่ไม่ระบุใน Instagram โดยมีคนในคอมเมนต์ที่กำลังวิจารณ์ “รูปลักษณ์” ของเขา ขณะที่ความกระหายข้อมูลของบริษัท AI และความไม่เท่าเทียมทางเศรษฐกิจทั่วโลกได้รวมกันเพื่อสร้างการทำธุรกรรมที่ไม่เท่าเทียม

เนื้อหาทั้งหมดมีดังนี้:

เมื่อเช้าวันหนึ่งเมื่อปีที่แล้ว Jacobus Louw ที่อาศัยอยู่ในเคปทาวน์ แอฟริกาใต้ได้ออกไปเดินเล่นตามปกติ และให้อาหารนกนางนวล แต่ครั้งนี้เขาได้บันทึกวิดีโอไว้หลายคลิป — บันทึกฝีเท้าของเขาและภาพที่มองเห็นจากทางเท้า วิดีโอนี้ทำให้เขาได้เงิน 14 ดอลลาร์ ซึ่งประมาณ 10 เท่าของเงินเดือนขั้นต่ำในประเทศนั้น และเท่ากับค่าใช้จ่ายอาหารของหนุ่มวัย 27 ปีคนนี้ประมาณครึ่งสัปดาห์

นี่คือภารกิจ “การนำทางในเมือง” ที่ Louw ทำบน Kled AI Kled AI เป็นแอปที่จ่ายเงินให้ผู้ใช้เพื่ออัพโหลดรูปภาพ วิดีโอ และข้อมูลต่าง ๆ เพื่อใช้ในการฝึกฝนโมเดล AI ในเวลาเพียงไม่กี่สัปดาห์ Louw ได้สร้างรายได้จากการอัพโหลดภาพและวิดีโอในชีวิตประจำวันถึง 50 ดอลลาร์

ห่างออกไปหลายพันไมล์ที่เมือง Ranchi ประเทศอินเดีย นักเรียนวัย 22 ปี Sahil Tigga ทำเงินจาก Silencio เป็นประจำ — แอปนี้ใช้การจ้างงานจากมวลชนเพื่อรวบรวมข้อมูลเสียงสำหรับการฝึก AI โดยเข้าถึงไมโครโฟนในโทรศัพท์ของเขาเพื่อเก็บเสียงรอบ ๆ เช่น เสียงในร้านอาหารหรือที่สี่แยกที่ยุ่งเหยิง เขายังอัพโหลดเสียงของตัวเองด้วย Sahil จะเดินทางไปยังสถานที่ที่ไม่เหมือนใคร เช่น ล็อบบี้ของโรงแรมที่ยังไม่ถูกบันทึกในแผนที่ Silencio เขาทำเงินได้มากกว่า 100 ดอลลาร์ต่อเดือน ซึ่งเพียงพอที่จะครอบคลุมค่าอาหารทั้งหมดของเขา

ในชิคาโก Ramelio Hill ชายวัย 18 ปีที่เป็นช่างเชื่อมได้ขายบันทึกการสนทนาส่วนตัวในโทรศัพท์ของเขากับเพื่อนและครอบครัวให้กับ Neon Mobile — แพลตฟอร์มฝึก AI ที่จ่ายเงิน 0.50 ดอลลาร์ต่อทุก ๆ นาที — ทำให้เขาได้เงินหลายร้อยดอลลาร์ สำหรับ Hill เรื่องนี้เรียบง่าย: เขาคิดว่าบริษัทเทคโนโลยีได้มีข้อมูลส่วนตัวของเขาอยู่แล้ว ทำไมเขาจะไม่แบ่งปันและทำเงินจากสิ่งนั้นล่ะ

“AI training gig” เหล่านี้ — การอัพโหลดสภาพแวดล้อม รูปภาพของตัวเอง วิดีโอ และเสียง — กำลังอยู่ในแนวหน้าของการค้นหาข้อมูลใหม่ทั่วโลก ขณะที่ความต้องการข้อมูลคุณภาพสูงจากซิลิคอนวัลเลย์นั้นเกินกว่าที่จะเก็บได้จากการดึงข้อมูลบนเครือข่ายเปิด ตลาดข้อมูลที่เฟื่องฟูได้เกิดขึ้นเพื่อตอบสนองความขาดแคลนนี้ จากเคปทาวน์ถึงชิคาโก ผู้คนหลายพันคนกำลังมอบข้อมูลชีวมาตรฐานและข้อมูลส่วนตัวของพวกเขาให้กับ AI รุ่นต่อไป

แต่เศรษฐกิจงานใหม่นี้มาพร้อมกับค่าใช้จ่าย ด้วยเงินไม่กี่ดอลลาร์ที่แลกมา ผู้ฝึกอบรมเหล่านี้กำลังให้เชื้อเพลิงแก่ภาคอุตสาหกรรมที่อาจทำให้ทักษะของพวกเขาล้าสมัยในที่สุด ในขณะเดียวกันก็ทำให้ตัวเองตกอยู่ในความเสี่ยงในอนาคตจากการปลอมแปลงที่ลึกซึ้ง การขโมยข้อมูลประจำตัว และการเอาเปรียบทางดิจิทัล — ขณะที่พวกเขายังเพิ่งเริ่มเข้าใจเรื่องนี้

ทำให้ AI ทำงานต่อไป

โมเดลภาษา AI เช่น ChatGPT และ Gemini ต้องการวัสดุการเรียนรู้จำนวนมากเพื่อปรับปรุงอย่างต่อเนื่อง แต่กำลังเผชิญกับความขาดแคลนข้อมูล แหล่งข้อมูลการฝึกฝนที่ใช้บ่อยที่สุด — C4, RefinedWeb และ Dolma — ครอบครองหนึ่งในสี่ของข้อมูลชุดที่มีคุณภาพสูงสุดบนเน็ต ขณะนี้กำลังจำกัดการใช้งานของบริษัท AI ในการฝึกโมเดล นักวิจัยประเมินว่าบริษัท AI จะใช้ข้อมูลคุณภาพสูงใหม่หมดภายในปี 2026 แม้ว่าห้องทดลองบางแห่งเริ่มใช้ข้อมูลสังเคราะห์ที่สร้างโดย AI เองในการฝึก แต่กระบวนการวนรอบนี้จะทำให้โมเดลผลิตข้อมูลผิดพลาดที่เต็มไปด้วย “ขยะ” จนกระทั่งเกิดการล่มสลาย

แหล่งที่มาของภาพ: The Guardian

แอปพลิเคชันอย่าง Kled AI และ Silencio กำลังเข้ามาในที่นี้ ในตลาดข้อมูลเหล่านี้ ผู้คนหลายล้านคนกำลังขายข้อมูลประจำตัวของตนเพื่อเลี้ยงและฝึก AI นอกจาก Kled AI, Silencio และ Neon Mobile แล้ว ผู้ฝึกอบรม AI ยังมีตัวเลือกอื่น ๆ อีกมากมาย: Luel AI ที่ได้รับการสนับสนุนจาก Y-Combinator ที่จัดหาข้อมูลการสนทนาหลายภาษาที่ประมาณ 0.15 ดอลลาร์ต่อทุก ๆ นาที; ElevenLabs ที่อนุญาตให้คุณทำการโคลนนิ่งเสียงของตัวเองและให้คนอื่นใช้งานในอัตราขั้นพื้นฐานที่ 0.02 ดอลลาร์ต่อทุก ๆ นาที

Bouke Klein Teeselink ศาสตราจารย์เศรษฐศาสตร์จาก King’s College London กล่าวว่า AI training gig เป็นประเภทงานใหม่ที่กำลังเติบโตอย่างต่อเนื่อง

บริษัท AI รู้ว่าการจ่ายเงินให้ผู้คนเพื่ออนุญาตใช้ข้อมูลจะช่วยหลีกเลี่ยงข้อพิพาทด้านลิขสิทธิ์ที่อาจเกิดขึ้นจากการพึ่งพาการเก็บข้อมูลจากเน็ตอย่างสมบูรณ์ Teeselink กล่าว นักวิจัย AI Veniamin Veselovsky กล่าวว่า บริษัทเหล่านี้ยังต้องการข้อมูลคุณภาพสูงเพื่อจำลองพฤติกรรมใหม่ ๆ และปรับปรุงระบบ “ในขณะนี้ ข้อมูลของมนุษย์คือมาตรฐานทองคำในการสุ่มตัวอย่างจากการกระจายของโมเดล” Veselovsky กล่าวเสริม

มนุษย์ที่ทำให้เครื่องจักรเหล่านี้ทำงาน — โดยเฉพาะผู้คนจากประเทศกำลังพัฒนา — มักต้องการเงินเหล่านี้ และแทบไม่มีทางเลือกอื่น สำหรับหลาย ๆ คนที่ทำงาน AI training gig การทำงานนี้เป็นการตอบสนองอย่างมีเหตุผลต่อช่องว่างทางเศรษฐกิจ ในประเทศที่มีอัตราการว่างงานสูงและค่าเงินในประเทศอ่อนค่าลง การทำเงินในสกุลเงินดอลลาร์มักจะมั่นคงและคุ้มค่ากว่าการทำงานในท้องถิ่น บางคนพบว่าการหางานระดับเริ่มต้นยากลำบาก และต้องทำงาน AI training เพื่อความอยู่รอด แม้แต่ในประเทศที่ร่ำรวยกว่า ค่าใช้จ่ายในการดำรงชีวิตที่สูงขึ้นก็ทำให้การขายตัวเองกลายเป็นทางเลือกทางการเงินที่สมเหตุสมผล

ผู้ฝึกอบรม AI ในเคปทาวน์ Louw รู้ถึงค่าใช้จ่ายด้านความเป็นส่วนตัวอย่างชัดเจน แม้ว่ารายได้จะไม่เสถียรและไม่เพียงพอที่จะครอบคลุมค่าใช้จ่ายทั้งหมดในแต่ละเดือน แต่เขาก็ยินดีที่จะยอมรับเงื่อนไขเหล่านี้เพื่อทำเงิน เขาต้องทนทุกข์มาหลายปีจากโรคทางระบบประสาทและไม่สามารถหางานได้ แต่เงินที่ earned จากตลาดข้อมูล AI (รวมถึง Kled AI) ทำให้เขาเก็บเงินได้ถึง 500 ดอลลาร์เพื่อสมัครเรียนหลักสูตรการฝึกอบรมสปาและกลายเป็นนักนวด

“ในฐานะคนแอฟริกาใต้ การได้รับเงินดอลลาร์มีค่ามากกว่าที่คนอื่นคิด” Louw กล่าว

Mark Graham ศาสตราจารย์ด้านภูมิศาสตร์ทางอินเทอร์เน็ตที่มหาวิทยาลัยออกซ์ฟอร์ด และผู้เขียนหนังสือ Feeding the Machine ยอมรับว่า สำหรับบุคคลในประเทศกำลังพัฒนา เงินเหล่านี้อาจมีความหมายในระยะสั้น แต่เขาเตือนว่า “ในเชิงโครงสร้าง งานนี้ไม่เสถียร ไม่มีโอกาสในการเลื่อนตำแหน่ง และโดยแท้จริงเป็นทางตัน”

Graham เสริมว่า ตลาดข้อมูล AI ขึ้นอยู่กับ “การแข่งขันในการลดค่าจ้าง” และ “ความต้องการชั่วคราวของข้อมูลมนุษย์” เมื่อความต้องการนี้ย้ายไป “คนงานจะไม่มีการรับประกัน ไม่มีทักษะที่สามารถถ่ายโอนได้ และไม่มีเครือข่ายความปลอดภัย”

Graham กล่าวว่า ผู้ชนะเพียงคนเดียวคือ “แพลตฟอร์มในซีกโลกเหนือ ซึ่งได้รับมูลค่าที่ยั่งยืนทั้งหมด”

แหล่งที่มาของภาพ: The Guardian

อนุญาตเต็มรูปแบบ

ผู้ฝึกอบรม AI จากชิคาโก Hill รู้สึกซับซ้อนเกี่ยวกับการขายการโทรในโทรศัพท์ส่วนตัวให้กับ Neon Mobile การโทรประมาณ 11 ชั่วโมงทำให้เขาได้เงิน 200 ดอลลาร์ แต่เขาบอกว่าแอปนี้มักจะออฟไลน์และช้าจ่ายเงิน “Neon ดูน่าสงสัยในสายตาของฉัน แต่ฉันก็ยังใช้มันอยู่เพื่อที่จะได้เงินเพิ่มเพื่อจ่ายบิล” Hill กล่าว

ตอนนี้เขาเริ่มพิจารณาอีกครั้งว่าการได้เงินนี้มันง่ายจริงหรือไม่ ในเดือนกันยายนปีที่แล้ว Neon Mobile ได้ปิดตัวลงเพียงไม่กี่สัปดาห์หลังจากเปิดตัว ก่อนหน้านี้ TechCrunch ค้นพบช่องโหว่ด้านความปลอดภัยที่ใครก็สามารถเข้าถึงหมายเลขโทรศัพท์ บันทึกการโทร และข้อความของผู้ใช้ได้ Hill กล่าวว่าบริษัท Neon Mobile ไม่เคยแจ้งให้เขาทราบเกี่ยวกับเรื่องนี้ และตอนนี้เขากังวลว่าเสียงของเขาจะถูกนำไปใช้ในทางที่ผิดบนอินเทอร์เน็ต

Jennifer King นักวิจัยด้านความเป็นส่วนตัวข้อมูลที่ Stanford University’s Human-Centered AI Institute รู้สึกกังวลว่า ตลาดข้อมูล AI ไม่ได้ชัดเจนเกี่ยวกับวิธีการและที่ไหนที่ข้อมูลของผู้ใช้จะถูกใช้ เธอเสริมว่า ในขณะที่ไม่เข้าใจในสิทธิของตนและไม่สามารถเจรจาเกี่ยวกับเรื่องนี้ “ผู้บริโภคเผชิญกับความเสี่ยงที่ข้อมูลจะถูกนำไปใช้ในลักษณะที่พวกเขาไม่ชอบ ไม่เข้าใจ หรือไม่เคยคาดคิด โดยแทบไม่มีทางแก้ไขใด ๆ”

เมื่อผู้ฝึกอบรม AI แชร์ข้อมูลใน Neon Mobile และ Kled AI พวกเขาได้มอบอนุญาตเต็มรูปแบบ (ทั่วโลก ผูกขาด ไม่สามารถเพิกถอน สามารถโอนและไม่มีค่าลิขสิทธิ์) ซึ่งอนุญาตให้แพลตฟอร์มขาย ใช้งาน เปิดเผยต่อสาธารณะ และเก็บรักษาภาพของพวกเขา รวมถึงสร้างผลงานที่เกิดขึ้นจากข้อมูลเหล่านั้น

Avi Patel ผู้ก่อตั้ง Kled AI กล่าวว่า ข้อตกลงข้อมูลของบริษัทเขาจะจำกัดการใช้งานในการฝึก AI และการวิจัย “โมเดลธุรกิจทั้งหมดขึ้นอยู่กับความไว้วางใจของผู้ใช้ หากผู้มีส่วนร่วมคิดว่าข้อมูลของพวกเขาอาจถูกนำไปใช้ในทางที่ผิด แพลตฟอร์มก็จะไม่สามารถทำงานได้” เขากล่าวว่าบริษัทจะตรวจสอบผู้ซื้อก่อนขายชุดข้อมูล เพื่อลดการทำงานร่วมกับ “องค์กรที่มีเจตนาสงสัย” เช่น อุตสาหกรรมสื่อลามก และ “หน่วยงานของรัฐบาล” ที่พวกเขาคิดว่าอาจใช้ข้อมูลในทางที่ละเมิดความไว้วางใจ

Neon Mobile ไม่ได้ตอบสนองต่อคำขอให้แสดงความคิดเห็น

Enrico Bonadio ศาสตราจารย์กฎหมายที่ St George’s University of London ชี้ให้เห็นว่าข้อกำหนดในสัญญาเหล่านี้อนุญาตให้แพลตฟอร์มและลูกค้าของพวกเขา “ทำอะไรก็ได้กับวัสดุเหล่านั้นแทบจะไม่มีข้อจำกัด ถาวร โดยไม่ต้องจ่ายเงินเพิ่มเติม และผู้มีส่วนร่วมไม่มีวิธีการที่แท้จริงในการเพิกถอนความยินยอม หรือเจรจาใหม่”

ความเสี่ยงที่น่ากังวลยิ่งขึ้นได้แก่: ข้อมูลของผู้ฝึกอบรมถูกใช้ในการสร้างการปลอมแปลงที่ลึกซึ้งและการปลอมตัว ขณะที่ตลาดข้อมูลกล่าวว่าพวกเขาจะลบข้อมูลที่ระบุตัวตน (เช่น ชื่อและที่ตั้ง) ออกก่อนที่จะขาย แต่กฎชีวภาพนั้นโดยธรรมชาติยากที่จะทำให้เป็นการไม่ระบุตัวตนที่มีความหมายจริง Bonadio เสริม

ความเสียใจของผู้ขาย

แม้ว่า AI ฝึกอบรมจะสามารถเจรจาเงื่อนไขการคุ้มครองที่ละเอียดมากขึ้นเกี่ยวกับวิธีการใช้ข้อมูลได้ พวกเขายังคงอาจจะรู้สึกเสียใจ ในปี 2024 นักแสดงจากนิวยอร์ก Adam Coy ขายภาพของเขาให้กับ Captions — แอปตัดต่อวิดีโอ AI ที่ตอนนี้ได้เปลี่ยนชื่อเป็น Mirage ในราคา 1000 ดอลลาร์ ข้อตกลงของเขากำหนดว่า ตัวตนของเขาจะไม่ถูกใช้เพื่อวัตถุประสงค์ทางการเมือง ไม่ใช้ในการโฆษณาแอลกอฮอล์ ยาสูบ หรือเนื้อหาลามก และมีระยะเวลาอนุญาตเป็นเวลา 1 ปี

Captions ไม่ได้ตอบสนองต่อคำขอให้แสดงความคิดเห็น

ไม่นานหลังจากนั้น เพื่อน ๆ ของ Adam เริ่มแชร์วิดีโอที่พวกเขาค้นพบออนไลน์ ซึ่งมีใบหน้าและเสียงของเขา ซึ่งมีผู้เข้าชมหลายล้านครั้ง ในหนึ่งในวิดีโอ Instagram Adam ที่เป็น AI ของเขาได้เรียกตัวเองว่า “แพทย์ทางนรีเวช” และส่งเสริมอาหารเสริมทางการแพทย์ที่ยังไม่ได้รับการพิสูจน์สำหรับผู้หญิงในระหว่างตั้งครรภ์และหลังคลอด

“การอธิบายเรื่องนี้ให้คนอื่นฟังทำให้ฉันรู้สึกอับอาย” Coy กล่าว

“คอมเมนต์ในวิดีโอนั้นแปลกมาก เพราะพวกเขากำลังวิจารณ์รูปลักษณ์ของฉัน แต่ที่จริงมันไม่ใช่ฉัน” Coy เสริม “เมื่อฉันทำการตัดสินใจ (ขายภาพ) นั้น ความคิดของฉันคือ โมเดลส่วนใหญ่จะเก็บข้อมูลและภาพจากออนไลน์อยู่แล้ว จึงไม่ควรจะได้เงิน”

Coy กล่าวว่าหลังจากนั้นเขาไม่ได้ทำงาน AI Data gig อีกเลย เขากล่าวว่า เขาจะพิจารณาทำอีกครั้งหากบริษัทใดบริษัทหนึ่งเสนอค่าตอบแทนที่สำคัญ

  • บทความนี้ได้รับอนุญาตให้นำมาจาก: Deep Tide TechFlow
  • ชื่อบทความต้นฉบับ: “Thousands of people are selling their identities to train AI – but at what cost?”
  • ผู้เขียนต้นฉบับ: Shubham Agarwal, The Guardian
  • แปลโดย: Deep Tide TechFlow
news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น