モデレーションやアノテーションといったデータ作業に不可欠な労働は、その成果から利益を得る人々から組織的に隠蔽されています。新たなプロジェクトは、世界中のデータワーカーの実体験にスポットライトを当て、海外での技術系業務のコストと機会を実体験に基づいて示しています。
退屈で報われず、精神的にダメージを与える多くの仕事が貧しい国にアウトソーシングされ、そこでは労働者がアメリカやヨーロッパの賃金のほんの一部で喜んで仕事を引き受けています。こうした労働市場は、電子機器の「リサイクル」や船舶解体といった「退屈で汚くて危険な」仕事に加わります。モデレーションや注釈作業の労働条件は、腕を切断したりがんになったりする可能性は低いですが、だからといって安全とは言えず、ましてや快適でやりがいのある仕事とは言えません。
AI倫理研究グループDAIRとベルリン工科大学の共同研究であるデータ労働者調査は、名目上は19世紀後半のマルクスの著作をモデルにしており、「集団で作成され、政治的に実行可能な」報告書で労働条件を特定している。
すべてのレポートは無料で入手可能で、プロジェクト運営者が議論したオンラインイベントで本日発表されました。
AIの応用範囲は拡大の一途を辿り、必然的に人間の専門知識の上に成り立っています。そして、その専門知識は今日に至るまで、企業が広報上の問題を引き起こすことなく提供できる最低の金額で購入されています。投稿を報告する際に、「素晴らしい。シリアにいる人に送り、3セントで対応してもらいましょう」とは言われません。しかし、報告件数(そして報告に値するコンテンツ)が膨大であるため、安価な労働力市場への大規模なアウトソーシング以外の解決策は、関係企業にとって現実的ではありません。
報告書をよく読んでみると、その多くは故意に逸話的な内容となっている。これらの報告書は、定量的な分析というよりも、体系的な人類学的観察のレベルに近い。
こうした経験を定量化しても、真のコストを捉えきれないことがよくあります。最終的に得られる統計は、企業が誇示したがる(そして調査で強く求める)類のものです。つまり、地域内の他社よりも高い賃金、雇用創出、顧客へのコスト還元といったものです。モデレーション作業員が悪夢で眠れなくなることや、薬物依存が蔓延することといったことは、ほとんど言及されることはなく、ましてや測定・提示されることもありません。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
ケニアのデータワーカーがメンタルヘルスと薬物問題に苦しんでいる様子を描いたファシカ・ベルハネ・ゲブレキダン氏の報告書をご覧ください。(PDF全文はこちら)
彼女と彼女の同僚は、より倫理的なデータ作業パイプラインを謳うSamaで働いていたが、実際の人々が語る仕事の現実は、容赦ない悲惨さと現地オフィスからのサポートの欠如だった。

現地の言語や方言でチケット(つまり、フラグが付けられたコンテンツ)を処理するために採用された彼らは、暴力、残虐行為、性的虐待、ヘイトスピーチなどのコンテンツが際限なく流れてくるのにさらされており、パフォーマンスが期待レベルを下回らないように、迅速に確認して「対応」しなければならない。そうしないと、給与が減額される可能性があると報告書は述べている。中には1分間に1件以上確認する人もいるため、1日に最低でも約500件のコンテンツを閲覧していることになる。(ここでAIがどこにいるのか疑問に思うかもしれないが、おそらくAIがトレーニングデータを提供しているのだろう。)
「本当に心が砕かれる思いです。想像し得る最悪の事態を目の当たりにしました。この仕事をしたことで、一生傷が残るのではないかと不安です」と、インタビューを受けた請負業者の一人、ラヘル・ゲブレキルコス氏は語った。
サポートスタッフは「装備が不十分で、専門性に欠け、資格不足」であり、モデレーターは対処するために頻繁に薬物に頼り、侵入思考、うつ病、その他の問題を訴えていた。
こういったことは以前にも耳にしたことがありますが、今もなお続いているというのは、改めて認識すべき点です。この種の報告はいくつかありますが、中にはより個人的な話や、異なる形式のものもあります。
例えば、ヤセル・ユセフ・アルライエスはシリアでデータアノテーターとして働き、高等教育の費用を稼ぐために働いています。彼とルームメイトは、画像化されたテキストの解析といった視覚的なアノテーション作業に取り組んでいますが、彼自身も指摘するように、これらの作業は往々にして定義が曖昧で、クライアントからの要求も苛立たしいものばかりです。
彼は、自分の作品を、8 分間見る価値のある短編映画の形で記録することに決めました。
ヤセルさんのような労働者は、多くの場合、多くの組織階層の背後に隠れ、下請け業者の下請け業者として働いているため、問題や訴訟が発生した場合でも責任の所在が曖昧になる。
このプロジェクトのリーダーの一人であるDAIRとベルリン工科大学のミラグロス・ミチェリ氏は、報告書に記載された企業からコメントや変更は見られていないものの、まだ初期段階だと述べた。しかし、結果は十分なものだったため、さらに調査を進める価値があるようだ。「おそらくブラジル、フィンランド、中国、インド出身のデータワーカーからなる第2グループでこの作業を続ける予定です」と彼女は記している。
これらの報告書の価値を決定づける要素、つまり逸話的な性質を軽視する人もいるだろう。しかし、統計で嘘をつくのは簡単だが、逸話には必ず少なくともいくらかの真実が含まれている。なぜなら、これらの話は情報源から直接得られたものだからだ。たとえ、ケニア、シリア、ベネズエラでこれらの問題を抱えているモデレーターが12人しかいなかったとしても、彼らの発言は、それを頼りにする人すべて、つまりほぼすべての人に懸念を抱かせるはずだ。