ブログが丸ごとパクられました。「http://www.advieshoreca.nl/6s/csctccase.asp」は偽物です

異変に気づいたのは1/30夜の話なのだが、いつの間にか当サイトアナザーディメンション(http://estpolis.com/)のコンテンツを丸ごとパクったサイトが登場した。
※URLはパクリサイトで自動置換されるため全角です

【本物のURL】
http://goo.gl/w8jia1
※パクリサイトで自動変換されるため、敢えて短縮URLとしています。

【パクリサイトのURL】
http://www.advieshoreca.nl/6s/csctccase.asp

このサイトなかなか凝った作りをしていて、当サイトが新しい記事を公開すると、連動してその記事を自動的にコピーする仕組みとなっているようだ。なので、告発記事をアップし(この記事がパクリサイトに反映されるかを確認したい)、状況が変わるまで当サイトの更新は一時停止しようと思う。

ご覧いただいている方にはご迷惑をおかけしますが、何卒ご理解いただくようよろしくお願いいたします。また、よろしければこの問題の解決にご協力いただけたらと思います(パクリサイトのスパム報告とか、この記事の拡散とか)。

パクリサイトの手口

当サイトの記事は、ドメイン配下に「YYYY/MM/記事のID.html」という感じでURLが設定されている。
パクリサイトはこの部分をURL変数として持つ事で、恐らくだが当サイトのデータを自動的に取得する利用する仕組みとなっているようだ。例えば1つ前の記事だと、

【当サイト】
http://estpolis.com/2015/02/17087.html
※URLはパクリサイトで自動置換されるため全角です

【パクリサイト】
http://www.advieshoreca.nl/6s/csctccase.asp?2015/02/17087.html

みたいな感じで、自動的に記事をパクるシステムとなっている。
しかも、よくあるパクリ記事は記事内の画像を本家サイトに直リンクしているが、このパクリサイトはパクリ元のドメインを自分のドメインに自動的に置き換えるため、結果として画像は表示されない仕組みとなっているようで、「この記事はパクってます」なんて画像差し替えによる報復は通用しない。

かなり手が込んでいるのだ。

当サイトが受けている被害

そもそも先月下旬から検索経由のアクセスが激減していて、おかしいなと思ったのが気づいたきっかけだったのだが、さらに嫁からの申告でサイト名で検索すると、パクリサイトがトップに出ている事が分かった。
pakuri_top
そして、当サイトは表示されない(^^;
これじゃあまるでこっちがパクリサイトである、、、。細かい事まではチェック出来ていないが、検索に関してはかなりの影響を受けていると思われる。

同様の被害にあっているサイトがある

そして、同様の被害にあっているサイトもいるようで、現在その人達とも連絡を取り合っている状況だ。どうも、

http://www.advieshoreca.nl/6s/csctccase.asp

この部分がパクリ先のサイトを表しているようで、IDを変えると同じようなパクリサイトが登場する。相当手が込んでますよね、、、。

対象はiPhoneをテーマにしているサイトが多く、どうも犯人が運営していると思われるECサイトへ誘導する事が目的のように思われる。「Iphone Store」なんて文字が出る地点で、その辺りが怪しい。

犯人は何者か?

とりあえず相手のドメイン(advieshoreca.nl)を「Who is」で検索。

Domain name: advieshoreca.nl
Status: active

Registrar:
uw webhosting provider
Stadionplein 23
8025CP Zwolle
Netherlands

DNSSEC: no

Domain nameservers:
ns1.webstekker.com
ns3.webstekker.nl
ns4.webstekker.com

Record maintained by: NL Domain Registry

tracerouteで相手のサーバーを調査。

traceroute to advieshoreca.nl (193.93.174.56),

「Webstekker」という海外のホスティングサービスを使っている事までは分かっている。

終わりに

とりあえず現時点でやっている事は、グーグルに対して著作権侵害による削除(DMCA)を申告し、その対応を待っている状況(2/4時点では動き無し)。

こういうサイトの性質上、今のパクリサイトをIndex削除しても、すぐに別のサイトが出来てしまうという懸念がある。なので、落ち着くまでサイトの更新は出来そうにない。なんとも悲しいが、仕方ない。

とりあえず状況に変化があれば、本記事への追記という形で記載していこうと思う。

2015/02/04 12:50追記

「2015/02/04 12:41」に記事を公開し、速攻でパクリサイトにも反映されている事を確認。
自動取得は確定ですね。この後、この記事だけ削除されたりしたら、犯人は日本人の可能性が高そう(少なくとも日本語は理解できる人)。
pakuri2

2015/02/04 18:00追記

この記事でパクリサイトの仕様がある程度分かってきました。

  • 閲覧者がパクリサイトを表示すると、その都度当サイトのデータ(WordPressが吐くHTML)を取得している(=こちらの記事を更新すると即反映される)
  • パクリ元サイト(今回で言えば当サイト)のドメインは、HTMLのソースコードベースで全てパクリサイトのドメインに置換される。つまり、本文はもちろんhrefタグの中味とかも置換される
  • パクリサイトが危ないと認識していると思われる一部のキーワードは置換される(例:Google(半角英数字)→god)

特に、「グーグル→god」は不覚にも笑いそうになった。それどころじゃないんですが。

パクリサイトが行う置換の例

pakuri_4
pakuri_3
こんな感じで、パクリ元サイトのドメインは自動的に置換されるし、
pakuri_6
グーグルはgodに変わる。

2015/02/05 18:00追記

Twitterなどでかなり拡散され、様々な助言をいただいております。ありがとうございます。

いくつか分かってきた事を追記。
サーバーのログ(Apache)を確認すると、パクリサイトを表示すると以下のドメインからアクセスされます。

estpolis.com ip.space.by.uwwebhostingprovider.nl – – [05/Feb/2015:08:51:57 +0900] “GET /wp-content/themes/dp-escena_custom/images/300x120xidol.jpg.pagespeed.ic.2rdbZPZ1M6.jpg HTTP/1.1” 200 13370 “-” “Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.2; Trident/4.0; .NET CLR 1.1.4322; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C; .NET4.0E)”

これを遮断したらパクリサイトの表示が出来なくなるかもと思い、「.htaccess」ファイルに以下の記述を追加しましたが効果はありませんでした。

order deny,allow
deny from 193.93.174.143
deny from .uwwebhostingprovider.nl

また、RSS全文配信が原因ではという助言もいただきました。コメント欄も反映されることから関係ないとは思いますが、一時的に全文配信を停止しています。こちらも効果はありませんが。

2015/02/09 23:00追記

グーグルとのやりとりが続いていますが、その内容を別記事で紹介します。

2015/02/11 23:00追記

WordPressのプラグインを使用し、暫定対応は完了しました。
GoogleのIndex削除や、恒久対策はまだです。

本件のまとめ記事書きました。

SPONSORED LINK