“sex"は、それを含んでいるメイルがspamである 確率が0.97であることを示しているし、"sexy” なら 0.99になる。 そしてベイズの規則を用いれば、他の証拠が無い場合 (普通はそんなことはないが)、 両方の単語を含んでいるメイルがspamである確率は 99.97% であることが確かに言えるわけだ。

確率を計測するために、ベイズ確率を使った方法では spamである証拠とspamでない証拠を両方とも考慮しなければならない。 “unsubscribe” や “opt-in” と言った単語がspamである確率を押し上げるのと 同じくらい、spam中にほとんど現われない、 “though"、"tonight"、"apparently"と言った単語はその確率を押し下げる。 したがって、正当なメイルがたまたま"sex"という語を含んでいたとしても それがspamと認識されることはない。

更新情報知らせます はい 不要