GPT-3はその初期、予測を行うために45テラバイトのデータと1750億個のパラメータや係数を使って訓練され、1回の訓練を実行するのに1200万ドルかかった。中国のAIモデルのWu Dao(悟道)2.0は、1兆7500億個のパラメータを持つ。
34,000本の雑学記事からランダム表示
GPT-3はその初期、予測を行うために45テラバイトのデータと1750億個のパラメータや係数を使って訓練され、1回の訓練を実行するのに1200万ドルかかった。中国のAIモデルのWu Dao(悟道)2.0は、1兆7500億個のパラメータを持つ。