今回、新たに開発した「AlphaGoZero」は答えを導くデータがなくても、人工知能がみずから試行錯誤を繰り返して、よりよい答えにたどり着く、「強化学習」という手法を取り入れたということです。
そして、囲碁の基本ルール以外には何も教えず、わずか3日間で500万回の対戦をひとりでに繰り返して強さを身につけた結果、トップ棋士を破った従来型の人工知能に圧勝したということです。
さらに、新型の人工知能は白紙の状態から学習する中で、数千年におよぶ囲碁の歴史で人間が編み出してきた「定石」と呼ばれる、最善の手をいくつも思いついただけでなく、全く新しい「定石」を生み出したとしています。