大家好,我是菜鸟哥!周末宅在家没有事情,只能看看动漫,逛逛B站。
最近,菜鸟哥都在B站上欣赏小小姐姐的舞蹈视频,像是欣小萌、慕慕有奶糖等UP主都是菜鸟哥的关注对象。菜鸟哥只是单纯地从舞蹈欣赏的角度,来观看小姐姐们的舞蹈视频。
刚好,菜鸟哥也已经好久没有为大家奉上福利了,今天,就带领大家,来批量抓取小姐姐们的舞蹈视频,让大家一次看个够。
01.抓取视频子页面地址
接下来的内容,我们将以欣小萌的视频抓取为例进行。
首先,我们打开舞蹈视频的主页,可以看到所有的舞蹈视频内容。
看到这样的界面,熟悉菜鸟哥之前文章的小伙伴们也大概知道抓取的流程。通过F12,打开开发者模式,然后再network下,找到以search?mid=开头的链接。点进去后,就可以看到舞蹈视频的关键信息内容。
我们需要抓取的就是bvid数据,通过这个数据,便可以构建每个舞蹈视频的链接,例如:
https://www.bilibili.com/video/BV1uR4y1G7bd。
当然,我们的程序可以借鉴之前菜鸟哥同大家分享的(这里贴上扬名立万的链接)程序,来抓取每个舞蹈视频的bvid数据。
上述程序的内容分析,也可以借鉴之前分享的文章。获取到bvid数据后,接下来我们就来分析如何下载视频到本地。
上述的程序中,是视频提取程序的入口函数。
第7行程序,首先提取出链接地址当中的BV数据,也即bvid数值。
第8行程序,利用get_cid函数,获取cid的数据;
第9行程序,利用get_list函数,来获取视频的链接地址。
第11-15行程序,通过requests库抓取视频写入到本地。
上述程序中,给出了get_cid和get_list函数,函数都是利用requests库来向链接请求json数据,然后提取json数据当中的关键信息。
值得注意的是,上述的第11行程序中,构造的请求链接,有qn参数。其中,80表示的是1080高清。数值与清晰度的对应关系,如下表所示。
02.结果展示
程序讲解完毕后,接下来我们就看一下抓取的结果吧。
上图展示的是抓取视频的封面,可以看到,几乎每张封面都是小姐姐的舞蹈动作。下面菜鸟哥为大家展示一个小姐姐的舞蹈视频。
重播
00:00
/
00:00
正在直播
总结:
以上就是菜鸟哥今天为大家带来的福利内容,希望大家在学习程序的同时,能够下载自己喜欢的B站小姐姐舞蹈视频。
其实Python功能还是很强大,爬虫,数据分析,机器学习,自动化测试,运维,web网站后端开发样样都可以做,真的是非常一门值得学习的语言。有兴趣的同学可以操练起来,欢迎大家在下方留言吱一声,记得给个三连哦!
我是菜鸟哥,我们下期文章不见不散。