大家好,我是菜鸟哥!周末宅在家没有事情,只能看看动漫,逛逛B站。

最近,菜鸟哥都在B站上欣赏小小姐姐的舞蹈视频,像是欣小萌、慕慕有奶糖等UP主都是菜鸟哥的关注对象。菜鸟哥只是单纯地从舞蹈欣赏的角度,来观看小姐姐们的舞蹈视频。

刚好,菜鸟哥也已经好久没有为大家奉上福利了,今天,就带领大家,来批量抓取小姐姐们的舞蹈视频,让大家一次看个够。

01.抓取视频子页面地址

接下来的内容,我们将以欣小萌的视频抓取为例进行。

首先,我们打开舞蹈视频的主页,可以看到所有的舞蹈视频内容。

看到这样的界面,熟悉菜鸟哥之前文章的小伙伴们也大概知道抓取的流程。通过F12,打开开发者模式,然后再network下,找到以search?mid=开头的链接。点进去后,就可以看到舞蹈视频的关键信息内容。

我们需要抓取的就是bvid数据,通过这个数据,便可以构建每个舞蹈视频的链接,例如:
https://www.bilibili.com/video/BV1uR4y1G7bd。

当然,我们的程序可以借鉴之前菜鸟哥同大家分享的(这里贴上扬名立万的链接)程序,来抓取每个舞蹈视频的bvid数据。

上述程序的内容分析,也可以借鉴之前分享的文章。获取到bvid数据后,接下来我们就来分析如何下载视频到本地。

上述的程序中,是视频提取程序的入口函数。

第7行程序,首先提取出链接地址当中的BV数据,也即bvid数值。

第8行程序,利用get_cid函数,获取cid的数据;

第9行程序,利用get_list函数,来获取视频的链接地址。

第11-15行程序,通过requests库抓取视频写入到本地。

上述程序中,给出了get_cid和get_list函数,函数都是利用requests库来向链接请求json数据,然后提取json数据当中的关键信息。

值得注意的是,上述的第11行程序中,构造的请求链接,有qn参数。其中,80表示的是1080高清。数值与清晰度的对应关系,如下表所示。

02.结果展示

程序讲解完毕后,接下来我们就看一下抓取的结果吧。

上图展示的是抓取视频的封面,可以看到,几乎每张封面都是小姐姐的舞蹈动作。下面菜鸟哥为大家展示一个小姐姐的舞蹈视频。


重播

播放

00:00
/
00:00
正在直播

00:00

进入全屏
    点击按住可拖动视频

    总结:

    以上就是菜鸟哥今天为大家带来的福利内容,希望大家在学习程序的同时,能够下载自己喜欢的B站小姐姐舞蹈视频。

    其实Python功能还是很强大,爬虫,数据分析,机器学习,自动化测试,运维,web网站后端开发样样都可以做,真的是非常一门值得学习的语言。有兴趣的同学可以操练起来,欢迎大家在下方留言吱一声,记得给个三连哦!

    我是菜鸟哥,我们下期文章不见不散。

    发表回复

    您的邮箱地址不会被公开。 必填项已用 * 标注