scrapy是python爬虫神器,特别是css和xpath这两种选择器实在太好用了,大部分时候都可以代替麻烦的正则表达式。同时也不经好奇,在PHP下是否也有类似的选择器。
答案是没找到css类似的选择器,但xpath却是有的。就是使用DOMXPath()类。使用案例:
$url='http://www.nuomiphp.com/';
$html= file_get_contents($url);
$dom = new DOMDocument();
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$textlabels = $xpath->query("//a[@class='btn btn-light btn-labeled']");
foreach ($textlabels as $v){
var_dump($v->nodeValue);
}
更多查询规则可以百度下DOMXPath的使用方法