2011年、グーグルは検索クエリ[編註:ユーザーが検索のために入力したキーワード]を使ってインフルエンザの爆発的感染を予測する人工知能プログラム「Google Flu Trends」を開発した。同社はこのプログラムを使って5,000万件の検索クエリを調査し、インフルエンザの発病率と極めて緊密な相関関係にある45のキーワードを見つけ出した。
しかし、これもまたデータマイニングの罠の一例だ。妥当な調査であれば、キーワードをあらかじめ特定していただろう。Google Flu Trendsはレポート発表後、108週のうち100週にわたって、インフルエンザ発症数を平均100パーセント近く過大に見積もった。Google Flu Trendsによるインフルエンザの予測は、もう行われていない。