画像生成AIのステーブル・ディフュージョンやミッドジャーニーなどは、LAION-5Bのデータセットに基づいて構築されている。LAION-5Bは、大規模言語モデルに使用されているデータセットと同様、インターネット上で利用可能な情報を、ロボットを利用して収集し生成したデータセットである。ここにはウェブから無差別に抽出して集められた約60億のタグ付き画像があり、著作権のある創作物が多数含まれることが知られている。

更新情報知らせます はい 不要