インターネット時代になって、グーグルがPageRankというおもしろい方法を編み出しました。たとえば、私が「madonna」でインターネット検索したとしましょう。「madonna」というのはブルックリンのパン屋さんなのですが、それは出てきませんね。そのパン屋さんのサイトにリンクしている人は20人くらいでしょうか。しかし、歌手のマドンナのサイトにリンクしているのは60億人ですから、検索結果としてはそちらが上に表示される。インターネットのコンテンツを探すのならそれで正しいわけですが、エンタープライズにおけるドキュメント検索では、それは有効ではないでしょう。
理由は2つあって、1つはエンタープライズのドキュメントは、互いにリンクし合っていません。ですが我々の技術では、パラメトリックサーチのおかげで、パラメータをドリルダウンすることで別の種類のドキュメントを探すことができますし、あるいはクエリによる串刺し検索ができます。3~4の検索エンジンを連携しているのです。ここに、確率を使います。各検索エンジンの結果をどのように評価するかのアルゴリズムがあるのです。
もう1つは、検索エンジンのページランキングは言語に依存しているということです。キーワードによって判断しているので、オートノミーの数学モデルのIDOLによる意味理解というアプローチとは違う。IDOLは非構造化データを解析するための500の機能を持っていて、それによって情報の意味理解を可能にします。さらに、ビデオライブラリのアーカイブとサーチができますし、大量データの処理も可能で、理論値としての上限はありません。情報量の増加にともなって対応できます。