في الآونة الأخيرة، ومع تطور تقنيات الذكاء الاصطناعي، زادت بشكل ملحوظ حاجة مختلف الجهات إلى بيانات تدريب عالية الجودة. Babel Audio التابعة لـ David AI Labs هي منصة مشروع تركز على جمع بيانات الصوت، وتوفر للمطورين مجموعات بيانات متعددة الوسائط. تَقوم هذه المنصة بتجنيد عاملين عن بُعد من جميع أنحاء العالم للمشاركة في تسجيل الصوت، بما يدفع إلى تحسين نماذج توليد الصوت والتعرّف عليه. يجلب هذا النوع الناشئ من نمط «العمل الحر في مجال الذكاء الاصطناعي» فرص دخل مرنة لسوق العمل؛ إذ إن الأجر بالساعة الذي يبدأ من 17 دولارًا يبدو مُغريًا للغاية، غير أن هذا النوع من نماذج الأعمال ينطوي أيضًا على مخاطر محتملة تشمل التنازل عن خصوصية البيانات ونقص الضمانات العمالية.
تركز David AI Labs، التي أُنشئت منذ سنتين فقط، على تقديم مجموعات بيانات متعددة الوسائط لمطوري النماذج. ويعتمد مشروع Babel Audio التابع لها بشكل أساسي على الاستعانة بمصادر جماهيرية خارجية لجمع بيانات صوت طبيعية؛ إذ يقوم بربط أشخاص مجهولين غرباء لإجراء حوارات تسجيل صوتية، ثم يجمع هذه التسجيلات في حزم لتصبح بيانات تدريب تُستخدم من قبل شركات الذكاء الاصطناعي. لا يحتاج المشاركون إلى خلفية تقنية عميقة؛ فكل ما يلزم هو الاتصال عن بُعد، والقيام بتسجيلات الحوار أو تقييم النظام وفقًا للتعليمات. ووفقًا لتقرير من بلومبرغ، بعد أن يقدّم المستخدم مقطعًا صوتيًا قصيرًا، يمكنه البدء في التسجيل بالمشروع عبر فرز أولي، ويبدأ السعر من 17 دولارًا للساعة. تُقيّم جودة التسجيل بناءً على جودة الصوت وعوامل أخرى سلسلة من العوامل؛ فكلما ارتفعت الدرجة، زادت المكافأة التي يحصل عليها المستخدم، كما يمكنه التقديم لمشروعات ذات رواتب أعلى. يتمثل هدفها الأساسي في سد الفجوة التقنية التي يواجهها الذكاء الاصطناعي في فهم النبرة والسياق من خلال تفاعلات بشرية حقيقية.
تدريب الآلة عبر محادثة مع البشر هو نوع آخر من العمل الخاص الذي أوجدته حقبة الذكاء الاصطناعي، كما أن الطلب عليه مرتفع جدًا. ومن منظور الاقتصاد الكلي، يعكس صعود Babel Audio التوسع البنيوي لسوق بيانات الوسم (Data Annotation). تعتمد حاليًا نماذج اللغات الكبيرة وتقنيات توليد الصوت بدرجة عالية على «التعلّم المعزز من خلال ملاحظات البشر (RLHF)» لضمان أن تكون المخرجات متوافقة مع منطق البشر ومعاييرهم. وللتحكم في تكاليف التطوير والبحث المرتفعة، تقوم الشركات التقنية بتوزيع أعمال الوسم على نطاق عالمي ضمن منظومات اقتصاد العمل الحر. وبهذه الطريقة، تستطيع الشركات الحصول على كمّ هائل من البيانات بتكلفة أقل، مع ضمان أن تكون البيانات متنوعة ومتعددة عبر المناطق الجغرافية.
يوفر العمل الحر في تدريب صوت الذكاء الاصطناعي خيارًا عالي المرونة للعمل بدوام جزئي للجمهور، وهو مناسب للفئات التي تسعى إلى العمل عن بُعد. غير أن علاقة العمل من هذا النوع تُعد علاقة مقاولات/تناول، ولا يستطيع المشاركون الاستفادة من مزايا مثل التأمين الصحي أو تعويضات الفصل التي توفرها القواعد العمالية التقليدية. علاوة على ذلك، تعتمد المنصة بدرجة كبيرة على خوارزميات غير شفافة لتقييم جودة العمل وتوزيع المهام. يواجه المشاركون خطر فقدان أهلية تلقي الطلبات دون سابق إنذار بسبب تغيّر أحكام النظام، وهو ما يُبرز العيوب الجوهرية في اقتصاد العمل الحر من ناحية استقرار الدخل.
يواجه مُدرّبو الصوت في مجال الذكاء الاصطناعي أيضًا غالبًا بعض مشكلات البقاء المرتبطة بخصوصية الأفراد: هل يتخلّون، من أجل تدريب تقنية قد تحل محل كثير من سبل العيش الأخرى، عن جزء كبير جدًا من أنفسهم—أصواتهم وقصص حياتهم؟
وعند المشاركة في مشاريع بيانات الصوت مثل Babel Audio، تُعد التنازلات عن الحقوق المتعلقة بالخصوصية قضية محورية. ووفقًا للاتفاقيات المعتادة لدى مثل هذه المنصات، يُطلب من العاملين عادةً الموافقة على منح المنصة حق استخدام دائم وعالمي لبيانات السمات الحيوية لديهم، مثل بيانات بصمة الصوت (Voiceprint). وهذا يعني أن الشركة يمكنها استخدام البيانات للتدريب التجاري أو لبناء نماذج صوتية، دون الحاجة إلى دفع حقوق ملكية لاحقة. ومع اتجاه تشديد قوانين حماية البيانات بشكل متزايد، يحتاج المشاركون عند الحصول على تعويضات قصيرة الأجل إلى تقييم مخاطر محتملة مرتبطة باستخدام السمات الحيوية الشخصية على نطاق واسع بعناية.
ما هذه Babel Audio التي تلتقط موجة الذكاء الاصطناعي للعمل الحر، ويمكنك كسب أجر بالساعة 17 دولارًا بالدردشة؟ ظهرت لأول مرة في سلسلة الأخبار ABMedia.