パスワードを忘れた? アカウント作成
16478130 submission
人工知能

ChatGPT 開発の背後にはケニアの労働者による人力作業

タレコミ by headless
headless 曰く、
注目を集める OpenAI の対話向け言語モデル ChatGPT だが、その開発には 1 時間 2 ドル以下で働くケニアの労働者が多数かかわっていたという (TIME の記事Windows Central の記事The Register の記事)。

ChatGPT の前に OpenAI が開発した GPT-3 は高精度な文章生成能力を示していたが、学習に使用した素材の関係で一般的な使用に向かない有害なコンテンツを生成することもあった。このような失敗を繰り返さないためには、ヘイトスピーチや暴力、性的虐待といった有害なコンテンツを回避する AI が必要になる。そのため、OpenAIではインターネットのダークサイドから抽出した数万件のテキストスニペットへのラベル付けを米サンフランシスコの Sama とにアウトソーシングした。Sama はケニアやウガンダ、インドで労働者を雇い、IT 企業からの依頼を受けてデータにラベル付けを行う企業だ。

Sama は 2021 年 11 月から作業を開始したが、TIME がインタビューした Sama の従業員によれば暴力や性的虐待などを生々しく描いたテキストにラベル付けする作業は拷問のようだったという。2022 年 2 月には別プロジェクトとして性的および暴力的な画像を収集する作業のパイロットプログラムも開始したが、契約時に言及のなかった違法なコンテンツの収集を要求された Sama は作業を打ち切り、他のプロジェクトもすべて終了するとOpenAI に通告。同月、予定より早く契約を打ち切ることになった。

Sama は従業員のトラウマになるような作業を続けさせたくなかったと説明するが、TIME が 2 月 14 日に発行した Facebook の過酷なコンテンツモデレーションに関する記事で作業を請け負う企業として Sama が紹介されたことも関係しているという。記事が出てから 3 日後、Sama はルフトハンザ航空の子会社 zeroG から契約を打ち切られており、これを契機として OpenAI との契約を打ち切ることにしたようだ。

Sama は自然言語処理とコンテンツモデレーションをやめてコンピュータービジョンに注力する計画を進めており、今年 1 月 10 日には Facebook のコンテンツモデレーションを含むセンシティブなコンテンツにかかわる業務をすべて打ち切ると発表している。Sama がやめても AI システムのために人力でデータにラベル付けする需要はなくならない。大量の人力作業とスクレイピングデータを必要とすることは根本的な問題だが、OpenAI が対処しているようには見えないと AI 倫理が専門の Andrew Strait 氏は述べている。
この議論は、 ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

人生unstable -- あるハッカー

読み込み中...