写个Node 爬虫下载视频

起因

周末想找点 React 的视频看看,找到一个蛮不错的视频教程站,看了部分教程,感觉合胃口,然而只能在线播放,并不符合我睡前拿平板看视频的习惯,于是乎,就想写个爬虫把视频都抓下来。

分析

爬之前分析了一波,似乎任何反扒措施都没有,这就是赤果果的在诱惑我,爬了它!

视频下载地址

分析视频播放页面,用了DPlayer 这个播放器,光明正大的吧视频的url放在 script 里,这个用正则匹配就ok! "视频播放页面"

入口页面

再分析下入口页面,目标就是这个 a 标签的 href。用 cherrio 就能获取到了。 "入口页面"

异步请求的页面

本来只想下载一套视频的,后面看到这个网站把免费的归为一类,就想一起爬了。后面看 network 发现是个异步请求下拉更新dom,直接爬只能爬取一部分,做法就是观察异步请求的规则,多次爬取。 "异步"

上代码

废话不多说,直接看项目

"爬取成果"

爬虫没加延时时间,频繁爬取,会被封ip的。

请不要频繁爬取,爬起后的视频请勿商用。

声明

别人录视频,还免费公开,实属不易,本爬虫初衷只为自己方便批量下载视频,非商用。

本文仅学习爬虫,非商用。

若有冒犯,请联系我删除。

文章来源:

Author:大刀分享站-dddog.com.cn
link:https://www.dddog.com.cn/tutorial/jack-tut-05/