« ケンコー | Main | 第49回京王杯スプリングカップ(G2) »

May 15, 2004

学習型フィルタが効かない

 非常に悩ましい事がある。それが迷惑メールことスパムメールだ。私は現在、使い捨てのアドレスを含め、6個のメールアドレスを受信しており、それぞれに、使用頻度それ相応のスパムメールが到着する。

 最も多いのが、某レンタルHPスペースさんの所で頂いたおまけメールアドレスだ。使用暦も一番長く、一時はホームページ上に載せていたとは言え、5月14日に届いたメールを確認したら、何と64通のメールを総てがスパムかウィルスだった。ここまで来ると笑えるね。

 まぁ、ここの場合。サーバー様サイドに、とある事情があってこの様にメールが来るようになってしまったので、随分前からこのメールは、「最新ウィルス&スパムメール受信専用」メールアドレスとして、日々研究させてもらっています。色々スパムにも廃り流行りがあって面白いよ。

 ちなみに、64通、総てを受信していません。POPサーバから、ヘッダと本文20行を取得するようにnPOPQを設定しているので、メールが受信できないとかの被害は発生してません。このソフトはお勧めです、大量のメールが来る人には特にね。(富士通PCに付いてる「@メール」も良いんだけど……あれ、販売してないのかな。)

 さて。では2番目にスパムが来るのは?と言うと、何とNiftyが発行してくれた、私個人の非公開メールアドレスなのだ。多分、Niftyのドメインに向け、適当に文字列を入力していきメルアドを特定した後、送られて来るタイプのスパムが多いのだと思う。

 更に始末が悪い事に、以前紹介した学習フィルタを突破して、5月14日も8通中6通がスパムメールだった。これは……正直学習フィルタの効果の程を(かなり)疑いたくなる。

 そんな中、Niftyの社長さんがまた記事を書いておられたのでご紹介。

 古河建純 インターネットBlog: スパムメール対策(その4)

 うーん、この記事で掲載されているグラフを見る限り、多くの方に効果があるようなのだが……。

 ちなみに、私のフィルタがまだまだ学習が必要なのかと言うとそうでもない。以下の画像を参照。

growfilter

 学習度は3404ポイントとなっており、これは、

3000~  かなり優秀なフィルター精度です。  未知のメールにも十分対応可能です。(@nifty:Webメールのご利用方法)より引用

 との事で、問題が無いハズなのだが。

 適用直後はスパムの多くをシャットダウンしてくれてはいたが、成長に伴い、逆に受信する数が増えているなど、この辺りに秘密がありそうだ。

 また、突破してくるスパムは、その後全く同様の内容のスパムが何通か届く事があるので、単純にアルゴリズムに穴があるんではないかと思う。どうか?

 私の場合、到着するスパムの殆どが英語だけで記述され、HTMLのファイルが添付されている確立も高いので、アルゴリズムを修正するのに手間が居るのなら、せめて、

 「件名/本文に日本語を含まないメールをスパムと判断する」
 「添付ファイルがHTMLであるメールの削除」

 と言った受信設定が欲しいのだが。

 まだ学習フィルタを適用して半年経過したわけでもないので、正確なデータが集まっていないと言うのも否定できないが、もっと大胆にスパムの判断を下すオプション設定などが欲しい。

#ちなみに、迷惑メール2000に対し、通常メール100……。さみしぃ。

|

« ケンコー | Main | 第49回京王杯スプリングカップ(G2) »

Comments

Post a comment



(Not displayed with comment.)


Comments are moderated, and will not appear on this weblog until the author has approved them.



TrackBack

TrackBack URL for this entry:
http://app.cocolog-nifty.com/t/trackback/1924/596488

Listed below are links to weblogs that reference 学習型フィルタが効かない:

« ケンコー | Main | 第49回京王杯スプリングカップ(G2) »