写个Node 爬虫下载视频
起因
周末想找点 React 的视频看看,找到一个蛮不错的视频教程站,看了部分教程,感觉合胃口,然而只能在线播放,并不符合我睡前拿平板看视频的习惯,于是乎,就想写个爬虫把视频都抓下来。
分析
爬之前分析了一波,似乎任何反扒措施都没有,这就是赤果果的在诱惑我,爬了它!
视频下载地址
分析视频播放页面,用了DPlayer 这个播放器,光明正大的吧视频的url放在 script 里,这个用正则匹配就ok!
入口页面
再分析下入口页面,目标就是这个 a 标签的 href。用 cherrio 就能获取到了。
异步请求的页面
本来只想下载一套视频的,后面看到这个网站把免费的归为一类,就想一起爬了。后面看 network 发现是个异步请求下拉更新dom,直接爬只能爬取一部分,做法就是观察异步请求的规则,多次爬取。
上代码
废话不多说,直接看项目
爬虫没加延时时间,频繁爬取,会被封ip的。
请不要频繁爬取,爬起后的视频请勿商用。
声明
别人录视频,还免费公开,实属不易,本爬虫初衷只为自己方便批量下载视频,非商用。
本文仅学习爬虫,非商用。
若有冒犯,请联系我删除。
文章来源:
Author:大刀分享站-dddog.com.cn
link:https://www.dddog.com.cn/tutorial/jack-tut-05/
上一篇:如何从零开始组建一个佣兵团