
WEBページのクローリング研究の一貫として、Webページの画面キャプチャを取得するツールを作ってみました。
ツール概要
アクセス
サムネイルツール
機能
URLを入力して「表示」ボタンを押すだけで対象ページの画像を取得してくれます。
※フォーマット:PNG
画面サイズを「1024x768」「640x480」「320x240」の3パターン用意しています。
ちゃんとしたエミュレーションはしていないですが、UserAgentの切り替えも行えます。ただし、WebサイトでUA判定を行なっている場合の判定ぐらいしか反応しません。
とりあえず、WebページのJavaScriptによる動的サイトなどに対応する構成にしているので、読み込み完了した状態でページ全体が画像出力されます。
システム
NodeJS[v0.10.29]+CasperJS[1.1.0-beta3](PhantomJS[1.9.0])を組み合わせてcapture関数を使っています。
OS:Debian8
画面キャプチャ
今後のアイデア
・NodeJSで動作していてスクレイピングにも対応しているので、デバッグやテストをWEB上で行う場合に使用できるようにする予定
・Webページの各種情報も取得して、画像+ソース情報+その他上位ネットワーク情報などの監視ツールとしても改造しだいで使えると思う。
0 件のコメント:
コメントを投稿