phpでスクレイピング

DOMDocumentを使って、スクレイピングを行う。

  $dom = new DOMDocument('1.0', 'UTF-8');
  $html = file_get_contents("http://advangen2.raku2repeat.com/");
  $html = mb_convert_encoding($html, "HTML-ENTITIES", 'auto');
  @$dom->loadHTML($html);

  $xpath = new DOMXpath($dom);
  $node = $xpath->query("//div[@id='leftcolumn']")->item(0);
  echo $node->ownerDocument->saveHTML( $node );

前の記事

リダイレクト (htaccess)