囲碁は従来のプログラミングで対応するにはあまりに緻密で直感的なゲームだが、AlphaGoは行動の選択と報酬の仕組みによってルールを学習し、対局の仕方を身につけた。このAI技術は「強化学習」として知られている。
そして18年にシルヴァーらは、このプログラムのより一般化したヴァージョンを開発した。「AlphaZero(アルファゼロ)」と呼ばれ、囲碁以外にもチェスや将棋を学習し、プロレヴェルで対局することが可能なAIである。
こうして19年11月にDeepMindが詳細を発表したのが、「MuZero(ミューゼロ)」と呼ばれるAIだ。このヴァージョンではAlphaZeroが対応した囲碁などのゲームに加え、さらに多くのゲームのプレイを学習できるようになった。しかも重要なのは、事前にルールを知る必要がないという点である。