当前位置：移动技术网 > IT编程>开发语言>PHP > php实现递归抓取网页类实例

php实现递归抓取网页类实例

2018年06月24日 | 移动技术网IT编程 | 我要评论

本文实例讲述了php实现递归抓取网页类的方法。分享给大家供大家参考。具体如下：

<?php
class crawler{
 private $_depth=5;
 private $_urls=array();
 function extract_links($url)
 {
  if(!$this->_started){
   $this->_started=1;
   $curr_depth=0;
  }else{
   $curr_depth++;
  }
  if($curr_depth<$this->_depth)
  {
   $data=file_get_contents($url);
   if(preg_match_all('/((?:http|https)://(?:www.)*(?:[a-za-z0-9_-]{1,15}.+[a-za-z0-9_]{1,}){1,}(?:[a-za-z0-9_/.-?&:%,!;]*))/',$data,$urls12))
   {
    foreach($urls12[0] as $k=>$v){
     $check=get_headers($v,1);
     if(strstr($v,$url) && $check[0]=='http/1.1 200 ok' && !array_search($v,$this->_urls) && $curr_depth<$this->_depth){
      $this->_urls[]=$v;
      $this->extract_links($v);
     }
    }
   }
  }
  return $this->_urls;
 }
}
?>

希望本文所述对大家的php程序设计有所帮助。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

LAMP环境部署（CentOS7+源码包）

LAMP环境部署（CentOS7+源码包）1 LAMP简介2 LAMP部署2.1 部署前准备2.2 安装Apac... [阅读全文]
如何去设计前端框架能力？星巴克消息开放项目从0到1，从点到面的思考

文章概要摘要从满足星巴克项目需求单点出发，发散到从点到面的思考。从而总结了自己思考的基本流程（方法论）。从如下四... [阅读全文]
Tp5和Tp3语法上的差别

使用了很多年的Thinkphp3转手用Thinkphp5来开发项目，刚开始有点不习惯，为了顺应技术的发展学习了T... [阅读全文]
闲下来想一想

自从去年系统大升级以来，不但需要维稳新系统，新需求一个接一个。虽然疫情期间，工作不但没有闲下来反而更忙了。不过话... [阅读全文]
PHP制作日历，实现在1970年到2020年之间的任何一个月份的输出。上半部分

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transiti... [阅读全文]
Mac版webstorm

1.格式化快捷键：Option+Command+l2.保存时自动格式化设置——Prettier：（1）下载安装P... [阅读全文]
Redis 高并发下处理抢购，抢红包，秒杀

欢迎大家访问我的博客www.kevink.club, 定时更新php, swoole, golang,redis... [阅读全文]
TP6.0开启debug

记录：composer安装好tp6.0最新版后：1，将项目根目录下的.example.env文件复制一份，将名称... [阅读全文]
ElementUI dialog弹框退出时重置表单数据

需求进行项目开发，用到了ElementUI的dialog弹出框，当再次点击弹出框时发现，原本数据的还存在解决查阅... [阅读全文]
swoole 学习小结

websocket_server.php<?php/** * Created by PhpStor... [阅读全文]

网友评论


验证码：

php实现递归抓取网页类实例

2018年06月24日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论