2005年04月14日
livedoorランキング欠陥の修正は容易か難しいか?
とりあえず、プログラム関連の話題なので、休止中だけどコメント・・・
なんでも評定さんのランキング欠陥の公開実験に勝手に参加中。
本業プログラマですので、コメントを。
結論から言うと完全な対処は難しいですが、
ランキング上位から、OOPBlogを追い出すだけなら・・・って抜け道探すと
山ほどありますねぇ・・・
そもそも、URLってリダイレクト、iframe先でさらにiframe
さらにその先でjavascript使って、とか多重に自動的に
読み込んで最後がlivedoorってやられると、自動検出は無理ですね。
※どちらかというと、iframeであることを通知できないIE等のブラウザの仕様が悪いのであって、livedoor側の欠陥とまで言い切ってしまうのは、言い過ぎだと思いますが・・・
せめて、短所・問題点ぐらいで。
欠陥だと、法律的な賠償とか、そういう意味を含んでますからねぇ・・・
※すなおに、通報により、該当Blogバンの方が
簡単な気がしてきます・・・
なんでも評定さんのランキング欠陥の公開実験に勝手に参加中。
本業プログラマですので、コメントを。
結論から言うと完全な対処は難しいですが、
ランキング上位から、OOPBlogを追い出すだけなら・・・って抜け道探すと
山ほどありますねぇ・・・
そもそも、URLってリダイレクト、iframe先でさらにiframe
さらにその先でjavascript使って、とか多重に自動的に
読み込んで最後がlivedoorってやられると、自動検出は無理ですね。
※どちらかというと、iframeであることを通知できないIE等のブラウザの仕様が悪いのであって、livedoor側の欠陥とまで言い切ってしまうのは、言い過ぎだと思いますが・・・
せめて、短所・問題点ぐらいで。
欠陥だと、法律的な賠償とか、そういう意味を含んでますからねぇ・・・
※すなおに、通報により、該当Blogバンの方が
簡単な気がしてきます・・・
つまり、すべてのサイトのiframe問題を対処しようとするから、難しくなります。
上位100サイトから、iframeサイトを追い出すと考えれば処理は非常に楽になります。
1.ランキングを集計します。
2.1位から100位が決定するまで以下の処理を繰り返します。
3.各サイトのrefferのうちアクセス数の多い物から上位100件ぐらいに以下の処理を繰り返します。
4.refferの相手サイトのhtmlを取得し、そのサイト内にからリンクを抽出します。その抽出先が見つからない場合は、そのサイト内のすべてのjavascriptを読み出し同様にリンク(aタグのみ)を抽出します。
そして、リンクと自分のURLを比較し、リンクされているかどうか、を検出します。
検出できない場合は、そのreferをランキングポイントの集計からはずします。
検出した場合は、さらに、iframe,img,javascriptのsrcで同様の
物がないか探します。
iframeを単独で探さないのは、iframe単独検出だとjavascriptにより、
見た目はiframeでないiframeを作られるのを防ぐためです。
同様にimgタグなどもはじけます。
追記:
jacascriptで、
document.write('<');
document.write('i');
document.write('f');
document.write('r');
とか1文字づつかかれた上に、aタグ入れられるとやっかいですが・・・
その場合は、ばっさりjavascriptによるリンクはノンカウント
にして、かつiframeやimg、javascriptのsrcの中に該当URLが
ある場合はNGって対処ですかねぇ・・・
javascriptがやっかいだなぁ・・・
でも、blogpepleとかの場合javascriptによるリンクなので、
これをノンカウントにするのはやっかいですねぇ・・・
※追記さらに・・・
URL自体はまったく別なURLにしておくが、
そのURLは302でリダイレクトでlivedoorに持ってくる
ってのもありますね・・・
ていうか、無理・・・
ちなみに、4の処理は追記以外なら、perlを使えば専用のライブラリがあるので、
比較的簡単に記述できます。
ここでのポイントは、
ランキング集計後に、上位サイトのポイント計算時のみに、
referの集計を入れることです。
これにより、100以内に入るまではiframeが有効ですが、
100位に入ったとたん、iframeがはじかれるため
ランキングには影響しません。
また、すべてのreferを検索すると、莫大な時間がかかりますが
ランキングに影響するほど影響のあるreferは上位十数件ですので
これをはじけば十分効率的だと思います。
上位100今でのrefer上位100位まで、とすると
100x100ですので
計算量的には、高々1万件
1秒間に10トランザクション処理すれば、20分ぐらい
集計に余分な時間がかかるだけっす。
まぁ、毎秒1トランザクションとCPUが遅ければ、
referの上位10位だけみるとかでも、十分かと。
いずれにしろ、1時間程度の追加計算で、集計可能になると
思います。
完全に、悪を排除するのは難しいですが、
適度に排除するのであれば十分かと。
ただ、まぁ、OOPであれ、なんであれ、アクセス数はアクセス数で
某alexaなどのメジャーサイトへの対策として、
宣伝効果というか、livedoor自体のランキングを外部の公式サイトに対して
引き上げる効果はあるわけで、
完全な悪とは言い切れないわけですよ
だって、無料なんだし。
なんで、無料かといえば、アクセス数と引き替えに無料なワケですからねぇ。
人間のアクセスも1アクセス
ロボットのアクセスも1アクセス。
見えないアクセスも1アクセス。
livedoor内に限ってしまえば、はじく意味がありますが、
広い世界の中で、livedoorのランキングをあげるという意味では
さぁ、livedoorはどういう対処を入れてくるんでしょうか?
(w
トラックバックURL
この記事へのトラックバック
1. livedoorBlogランキングには、ユニークアクセスだけでなくプラスαが必要かも [ なんでも評点 ] 2005年04月15日 03:41
4月13日早朝のメンテは、結局“肩透かし”に終わったかのようである。まだしばらく様子を見ないとわからないが、今のところiframeによる幽霊アクセスの対策が組み込まれたようには見えない。
実験ブログの方も4月13日のアクセス数が物凄いことになってしまった。Ninja Too
2. livedoorランキングの不正問題 [ GO AHEAD!! ] 2005年04月16日 00:49
以前からlivedoorBlogランキングには、ポイントを不正に稼ぐことが出来る、という噂は流れていた。
実際ランキングを見てみると、ほとんど更新されていないブログがランキング入りしているブログや、内容的には??なブログも何故かランキング入りしているブログもちらほら.
3. ブログランキングについて(ちょっと長いです…) [ 無重力実験とアニメについて ] 2005年04月17日 04:32
「ひなたのゆめ」さんで、ライブドアのブログランキングについて興味深い考察が載せられていて、ありがたいことにこの拙文(新聞で言えば「本紙」とでも表現するのでしょうか)についても紹介していただいております。感謝感謝です。
それで、この記事が非常に考えさせら



