ケニアの「Sama」というクラウドソーシングの請負企業がOpen AI社の依頼を受けて『ChatGPT』のデータセットのブラッシング、精査を行っているらしいんです。
Samaが具体的に何をしているかというと、『ChatGPT』は基本的に大量のテキストデータを集めて学習するわけですが、ソースの中から政治的に問題のある文章とか、交通事故の詳しいレポートとか、性的虐待にまつわるようなテキストを弾く仕事をしている。
つまりOpen AIは生成結果として出たらまずい内容のテキスト、自社が損をするようなテキストをSamaにアウトソースして排除しているわけです。
こういった事実は搾取として当然批判を受けているわけですが、生成内容もこうした状況を踏まえるとおそらく、どんどん「プロダクトっぽいこと」しか言わなくなる。