php snoopy如何使用,snoopy 简介及使用

//采集php开源网set_time_limit(0);require_once("Snoopy.class.php");$snoopy=new Snoopy();//登陆论坛$submit_url = "http://www.phpoac.com/bbs/logging.php?action=login";$submit_vars["loginmode"] = "normal";$submit_vars["styleid"] = "1";$submit_vars["cookietime"] = "315360000";$submit_vars["loginfield"] = "username";$submit_vars["username"] = "***"; //你的用户名$submit_vars["password"] = "*****"; //你的密码$submit_vars["questionid"] = "0";$submit_vars["answer"] = "";$submit_vars["loginsubmit"] = "提 交";$snoopy->submit($submit_url,$submit_vars);if ($snoopy->results){//获取连接地址$snoopy->fetchlinks("http://www.phpoac.com/bbs");$url=array();$url=$snoopy->results;//print_r($url);foreach ($url as $key=>$value){//匹配http://www.phpoac.com/bbs/forumdisplay.php?fid=156&sid=VfcqTR地址即论坛板块地址if(!preg_match("/^(http:\/\/www\.phpoac\.com\/bbs\/forumdisplay\.php\?fid=)[0-9]*&sid=[a-zA-Z]{6}/i",$value)){unset($url[$key]);}}//print_r($url);//获取到板块数组$url,循环访问,此处获取第一个模块第一页的数据$i=0;foreach ($url as $key=>$value){if ($i>=1){//测试限制break;}else{//访问该模块,提取帖子的连接地址,正式访问里需要提取帖子分页的数据,然后根据分页数据提取帖子数据$snoopy=new Snoopy();$snoopy->fetchlinks($value);$tie=array();$tie[$i]=$snoopy->results;//print_r($tie);//转换数组foreach ($tie[$i] as $key=>$value){//匹配http://www.phpoac.com/bbs/viewthread.php?tid=68127&extra=page%3D1&page=1&sid=iBLZfKif (!preg_match("/^(http:\/\/www\.phpoac\.com\/bbs\/viewthread\.php\?tid=)[0-9]*&extra=page\%3D1&page=[0-9]*&sid=[a-zA-Z]{6}/i",$value)){unset($tie[$i][$key]);}}//print_r($tie[$i]);//归类数组,将同一个帖子不同页面的内容放一个数组里$left='';//连接左边公用地址$j=0;$page=array();foreach ($tie[$i] as $key=>$value){$left=substr($value,0,52);$m=0;foreach ($tie[$i] as $pkey=>$pvalue){//重组数组if (substr($pvalue,0,52)==$left){$page[$j][$m]=$pvalue;$m++;}}$j++;}//去除重复项开始//$page=array_unique($page);只能用于一维数组$paget[0]=$page[0];$nums=count($page);for ($n=1;$n {$paget[$n]=array_diff($page[$n],$page[$n-1]);}//去除多维数组重复值结束//去除数组空值unset($page);$page=array();//重新定义page数组$page=array_filter($paget);//print_r($page);$u=0;$title=array();$content=array();$temp='';$tt=array();foreach ($page as $key=>$value){//外围循环,针对一个帖子if (is_array($value)){foreach ($value as $k1=>$v1){//页内循环,针对一个帖子的N页$snoopy=new Snoopy();$snoopy->fetch($v1);$temp=$snoopy->results;//读取标题if (!preg_match_all("/

(.*) /i",$temp,$tt)){echo "no title";exit;}else{$title[$u]=$tt[1][1];}unset($tt);//读取内容if (!preg_match_all("/

(.*) /i",$temp,$tt)){print_r($tt);echo "no content1";exit;}else{foreach ($tt[1] as $c=>$c2){$content[$u].=$c2;}}}}else{//直接取页内容$snoopy=new Snoopy();$snoopy->fetch($value);$temp=$snoopy->results;//读取标题if (!preg_match_all("/

(.*) /i",$temp,$tt)){echo "no title";exit;}else{$title[$u]=$tt[1][1];}unset($tt);//读取内容if (!preg_match_all("/

(.*) /i",$temp,$tt)){echo "no content2";exit;}else{foreach ($tt[1] as $c=>$c2){$content[$u].=$c2;}}}$u++;}print_r($content);}$i++;}}else{echo "login failed";exit;}?>

以上就介绍了snoopy 简介及使用,包括了方面的内容,希望对PHP教程有兴趣的朋友有所帮助。

本文原创发布php中文网,转载请注明出处,感谢您的尊重!

相关文章

相关视频

网友评论

文明上网理性发言,请遵守 新闻评论服务协议我要评论

47d507a036d4dd65488c445c0974b649.png

立即提交

专题推荐064df72cb40df78e80e61b7041ee044f.png独孤九贱-php全栈开发教程

全栈 100W+

主讲:Peter-Zhu 轻松幽默、简短易学,非常适合PHP学习入门

7dafe36c040e31d783922649aefe0be1.png玉女心经-web前端开发教程

入门 50W+

主讲:灭绝师太 由浅入深、明快简洁,非常适合前端学习入门

04246fdfe8958426b043c89ded0857f1.png天龙八部-实战开发教程

实战 80W+

主讲:西门大官人 思路清晰、严谨规范,适合有一定web编程基础学习

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值