当前位置：移动技术网 > IT编程>脚本编程>NodeJs > 详解50行代码，Node爬虫练手项目

详解50行代码，Node爬虫练手项目

2019年07月19日 | 移动技术网IT编程 | 我要评论

first

项目地址：crawler-for-github-trending

项目中基本每一句代码都写有注释(因为就这么几行😂)，适合对node爬虫感兴趣的同学入入门。

introduction

50 lines, minimalist node crawler for trending.

一个50行的node爬虫，一个简单的, , 体验项目。

usage

首先保证电脑已存在node环境，然后

1.拉取本项目

git clone https://github.com/zy2071/crawler-for-github-trending.git
cd crawler-for-github-trending
npm i
node index.js

2.或者下载本项目压缩包，解压

cd crawler-for-github-trending-master // 进入项目文件夹
npm i
node index.js

examples

当启动项目后，可以看到控制台输出

listening on port 3000!

此时打开浏览器，进入本地服务 http://localhost:3000/daily

http://localhost:3000/time-language // time表示周期，language代表语言例如：
http://localhost:3000/daily // 代表今日可选参数：weekly,monthly
http://localhost:3000/daily-javascript// 代表今日的java分类可选参数：任意语言

稍微等待即可看到爬取完毕的返回数据：

[
 {
 "title": "lib-pku / libpku",
 "links": "https://github.com/lib-pku/libpku",
 "description": "贵校课程资料民间整理",
 "language": "javascript",
 "stars": "14,297",
 "forks": "4,360",
 "info": "3,121 stars this week"
 },
 {
 "title": "squeezerio / squeezer",
 "links": "https://github.com/squeezerio/squeezer",
 "description": "squeezer framework - build serverless dapps",
 "language": "javascript",
 "stars": "3,212",
 "forks": "80",
 "info": "2,807 stars this week"
 },
 ...
]

more

本项目仅供爬取体验，每次访问都会实时爬取数据，所以数据返回速度会比较慢，实际操作应该是定时爬取数据然后将数据存进数据库，数据从数据库返回从而提高数据返回效率。

但项目很基础，可以作为以上各个node模块最基础的练手使用，希望可以帮到大家 😀

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

使用npm命令提示: 'npm' 不是内部或外部命令,也不是可运行的程序的处理方法

在安装nodejs时候，有时候我们会把它安装在d盘或别的盘时，经常会遇到npm环境变量没有配好，需要自己手动去配置。在安装完nodejs后输入node -... [阅读全文]
Node.js API详解之 dns模块用法实例分析

本文实例讲述了node.js api详解之 dns模块用法。分享给大家供大家参考，具体如下：node.js api详解之 dnsdns (域名服务器)模块包含两... [阅读全文]
详解如何修改 node_modules 里的文件

前言有时候使用npm上的包，发现有bug，我们知道如何修改，但是别人可能一时半会没法更新，或者是我们特殊需求，别人不愿意修改，这时候我们只能自己动手丰衣足食。那... [阅读全文]
使用Typescript和ES模块发布Node模块的方法

本文主要介绍了使用typescript和es模块发布node模块的方法，分享给大家，具体如下：typescript已经成为一种非常流行的javascript语言... [阅读全文]
详解Node.js使用token进行认证的简单示例

本文只介绍简单的应用，关于json web token的具体介绍以及原理请参考阮一峰老师的json web token 入门教程。使用的node框架是koa2，... [阅读全文]
Node.js API详解之 module模块用法实例分析

本文实例讲述了node.js api详解之 module模块用法。分享给大家供大家参考，具体如下：node.js api详解之 modulenode.js 有一... [阅读全文]
Node Express用法详解【安装、使用、路由、中间件、模板引擎等】

本文实例讲述了node express用法。分享给大家供大家参考，具体如下：安装npm install --save express基本使用//引用expres... [阅读全文]
Node Mongoose用法详解【Mongoose使用、Schema、对象、model文档等】

本文实例讲述了node mongoose用法。分享给大家供大家参考，具体如下：mongoose简介是一个将javascript对象与数据库产生关系的一个框架，o... [阅读全文]
Node.js API详解之 Error模块用法实例分析

本文实例讲述了node.js api详解之 error模块用法。分享给大家供大家参考，具体如下：node.js api详解之 errornode.js 中运行的... [阅读全文]
Node.js API详解之 net模块实例分析

本文实例讲述了node.js api详解之 net模块。分享给大家供大家参考，具体如下：node.js api详解之 netnet 模块提供了创建基于流的 tc... [阅读全文]

网友评论


验证码：

详解50行代码，Node爬虫练手项目

2019年07月19日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论