当前位置：移动技术网 > IT编程>开发语言>PHP > thinkphp 抓取网站的内容并且保存到本地的实例详解

thinkphp 抓取网站的内容并且保存到本地的实例详解

2017年12月08日 | 移动技术网IT编程 | 我要评论

thinkphp 抓取网站的内容并且保存到本地的实例详解

我需要写这么一个例子，到电子课本网下载一本电子书。

电子课本网的电子书，是把书的每一页当成一个图片，然后一本书就是有很多张图片，我需要批量的进行下载图片操作。

下面是代码部分：

 public function download() {
    $http = new \org\net\http();
    $url_pref = "http://www.dzkbw.com/books/rjb/dili/xc7s/";
    $localurl = "public/bookcover/";
    $reg="|showimg\('(.+)'\);|";
    $i=1;
    
    do {
      $filename = substr("000".$i,-3).".htm";
      $ch = curl_init();
      curl_setopt($ch, curlopt_url, $url_pref.$filename);
      curl_setopt($ch, curlopt_returntransfer, 1);
      curl_setopt($ch, curlopt_connecttimeout, 10);
      curl_setopt($ch, curlopt_followlocation, 1);
      $html = curl_exec($ch);
      curl_close($ch);
      
      $result = preg_match_all($reg,$html,$out, preg_pattern_order);
      if($result==1) {
        $picurl = $out[1][0];
        $picfilename = substr("000".$i,-3).".jpg";
        $http->curldownload($picurl, $localurl.$picfilename);
      }
      $i = $i+1;
    } while ($result==1);

    echo "下载完成";
  }

我这里是以人教版地理七年级地理上册为例子 http://www.dzkbw.com/books/rjb/dili/xc7s/001.htm

网页是从001.htm开始，然后数字一直加

每个网页里面都有一张图，就是对应课本的内容，以图片的形式展示课本内容

我的代码是做了一个循环，从第一页开始抓，一直抓到找不到网页里的图片为止

抓到网页的内容后，把网页里面的图片抓取到本地服务器

抓取后的实际效果：

以上就是thinkphp 抓取网站的内容并且保存到本地的实例详解，如有疑问请留言或者到本站社区交流讨论，感谢阅读，希望能帮助到大家，谢谢大家对本站的支持！

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

MongoDB $type 操作符

描述在本章节中，我们将继续讨论MongoDB中条件操作符 $type。$type操作符是基于BSON类型来检索集... [阅读全文]
彻底解决小程序无法触发SESSION问题

转自冯奎博客fengkui.net一、首先找到第一次发起网络请求的地址，将服务器返回set-cookie当全局变... [阅读全文]
tp5框架基于ajax实现异步删除图片的方法示例

本文实例讲述了tp5框架基于ajax实现异步删除图片的方法。分享给大家供大家参考，具体如下：为了提高用户体验，我们为商品相册制作了ajax无刷新异步删除的功能，... [阅读全文]
thinkphp5框架路由原理与用法详解

本文实例讲述了thinkphp5框架路由原理与用法。分享给大家供大家参考，具体如下：路由理解概括的说：路由就是网络请求的url与thinkphp应用层的逻辑处理... [阅读全文]
让whoops帮我们告别ThinkPHP6的异常页面

春节期间熟悉了tp6，也写了一个tp6的博客程序，但系统的异常页面实在另外头疼，很多时候无法查看到是哪行代码出的问题。所以就特别的想把whoops引进来，经过... [阅读全文]
thinkphp5 + ajax 使用formdata提交数据（包括文件上传）后台返回json完整实例

本文实例讲述了thinkphp5 + ajax 使用formdata提交数据（包括文件上传）后台返回json。分享给大家供大家参考，具体如下：知识点总结1.j... [阅读全文]
YII2框架实现表单中上传单个文件的方法示例

本文实例讲述了yii2框架实现表单中上传单个文件的方法。分享给大家供大家参考，具体如下：有些时候我们提交的表单中含有文件。怎么样让表单里的数据和文件一起提交。我... [阅读全文]
YII2框架中自定义用户认证模型，完成登陆和注册操作示例

本文实例讲述了yii2框架中自定义用户认证模型，完成登陆和注册操作。分享给大家供大家参考，具体如下：有些时候我们需要自已定义用户类，操作自已建的用户表，来完成登... [阅读全文]
YII2框架中分页组件的使用方法示例

本文实例讲述了yii2框架中分页组件的使用方法。分享给大家供大家参考，具体如下：当数据过多，无法一页显示时，我们经常会用到分页组件，yii2中已经帮我们封装好了... [阅读全文]
YII2框架中验证码的简单使用方法示例

本文实例讲述了yii2框架中验证码的简单使用方法。分享给大家供大家参考，具体如下：验证码的使用是比较频繁的。yii2中已经帮我们做好了封装。首先我们在控制器里创... [阅读全文]

网友评论


验证码：

thinkphp 抓取网站的内容并且保存到本地的实例详解

2017年12月08日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论