您当前的位置:首页 > 电脑百科 > 程序开发 > 语言 > Python

Python-获取B站UP主的所有视频-七朵组合为例

时间:2019-09-06 10:34:06  来源:  作者:

前几天,我分享了一篇文章,里面讲的是用户GUI下载包含B站在内的视频的Python程序。今天我们以国内第一支主打中国风的女子组合--七朵组合为例,利用之前的分享的知识,下载UP主的所有B站视频。

Python-获取B站UP主的所有视频-七朵组合为例

一代七朵-咏春

先看下七朵组合的百度百科(这个时候已经更新为最新的五位成员了):

七朵组合,中国内地女子演唱组合,由喻筱博、颜灵兰、韦欢、吴圆圆、刘木子五位成员组成。2012年6月28日,推出组合首支单曲《咏春》,从而正式出道 [1] ;10月23日,演唱的歌曲《心慌慌》获得“鹏城歌飞扬”深圳原创音乐第三季度十佳金曲奖 [2] ;12月9日,凭借单曲《咏春》获得香港TVB8金曲榜年度最佳新人奖以及年度最佳组合奖提名 [3] 。2013年5月17日,发布中国风单曲《玉生烟》;11月13日,推出“欢”季恋歌单曲《宫商角徵羽》 [4] 。2014年2月14日,发布情人节单曲《蝴蝶恋》 [5] ;4月16日,获得音悦台V-Chart Awards颁奖典礼“最具人气潜力奖”的提名 [6] 。2017年,发布了中国风单曲《青蛇》。2018年1月21日,发布中国风单曲《将军令》 [7] ;10月22日,参加“古画会唱歌”音乐创新大赛,单曲《墨染梅霜》以第一名的成绩进入决赛圈 [8] 。2019年1月11日,发行中国风单曲《女侠》 [9] 。

Python-获取B站UP主的所有视频-七朵组合为例

回归七朵-青蛇

在我的印象里,第一次认识七朵组合,是在2014年安徽卫视的春节联欢晚会上,七朵组合在舞台上像7只美丽的百灵鸟,表演着她们的中国风歌曲《咏春》,她们美丽的身姿深深地吸引到了我,从那以后,她们出的每一首歌,我都听过,有喜欢的,也有不喜欢的。即使有不喜欢的,我依然要全力向大家推荐她们,因为她们太欠红了!

七朵不红,天理难容!

印象比较深刻的歌曲有很多:《咏春》、《落花情》、《扬州慢》、《玉生烟》、《孔明》、《青蛇》、《醉花荫》、《江南夜》等等。

最特别的,咏春的春节特别版,圆圆的两声yayiyayiyou,让人回味无穷;孔明中欢欢的最后那几句,孔明恐恐恐,也怕女儿梦,陪你喝两盅,再去对隆中,独守着空城,南阳夜也冷,寒月照三更,琵琶惹古筝,你独守着,准我为你折腰,也是点睛之笔。

最近还新出了一首《哪吒》,也是非常好听!!!赶紧去听吧!!!

好啦,回归正题:

思路:

(1)获取UP主所有视频的id,结合播放页面https://www.bilibili.com/video/av65732818,可以看出,id即为av后面的数字,即只要获取到id,即可得到所有的视频播放链接;

(2)利用you-get,一个一个下载;

缺点:不能多进程下载,下载进度缓慢。

开始解析:

1、打开七朵组合的投稿页面

Python-获取B站UP主的所有视频-七朵组合为例

 

按照之前分享过的方法,找到这些视频的链接在哪里!

2、鼠标右键(Chrome)--检查--F5--Network--XHR,可以看到这样一条信息

Python-获取B站UP主的所有视频-七朵组合为例

 

这里面包含着我们想要的视频的id信息!

有人问,为啥你这么快就找到了呢?你怎么找的呢?

其实基本的两种方法还是有的,但是像网易云音乐那种加密的除外!

(1)Ctrl+F,搜索原页面中包含的信息;

(2)看XHR项的大小,能达到kb级别的很有可能是你需要的东西;

然后我们开始点击下一页,可以发现是这样的

Python-获取B站UP主的所有视频-七朵组合为例

 

又出现了一条和上一页面类似的链接,比较发现,只有page的参数不一致,那就循环page就行啦!

好啦,分析到此结束!

代码如下:

# author:Jinbu Zhang

# 目的:爬取哔哩哔哩视频某位作者的所有视频

# 思路:1、获取该作者在B站发布的所有视频地址;2、调用you-get库下载到指定路径

import requests
import json
import you_get
import os
import time
import random
import sys
import winreg
headers = {"User-Agent":"Mozilla/5.0 (windows NT 10.0; Win64; x64) AppleWebKit/537.36 
(Khtml, like Gecko) Chrome/73.0.3683.103 Safari/537.36"}
def get_desktop():
 key = winreg.OpenKey(winreg.HKEY_CURRENT_USER,r'SoftwareMicrosoftWindowsCurrentVersionExplorerShell Folders')
 return winreg.QueryValueEx(key, "Desktop")[0]
save_path = get_desktop() + '\' + 'you_get'+'\'
if not os.path.exists(save_path):
 os.mkdir(save_path)
# 播放页视频下载
def download_mv_bilibili(mv_id):
 mv_id_download = 'https://www.bilibili.com/video/av'+str(mv_id)
 os.system("you-get -o %s %s"%(save_path,mv_id_download))
# 对得到的json数据进行解析(字典访问形式)
def explain_json(json_data):
 mv_datas = json_data['data']['vlist']
 mv_infors = []
 for mv_data in mv_datas:
 mv_title = mv_data['title']
 mv_author = mv_data['author']
 # 41842701
 mv_id = mv_data['aid']
 mv_length = mv_data['length']
 mv_description = mv_data['description']
 mv_cover = mv_data['pic']
 mv_play = mv_data['play']
 mv_comment = mv_data['comment']
 print('==' * 60)
 time.sleep(0.5)
 print('>>%s...'%mv_title)
 print('>>>https://www.bilibili.com/video/av%s' % mv_id)
 print('==' * 60)
 # 下载MV&视频
 # download_mv_bilibili(mv_id)
# 对URL进行访问,得到的数据进行解析
def get_html(access_url):
 response = requests.get(access_url,headers=headers)
 html = response.text
 json_data = json.loads(html)
 mv_infor = explain_json(json_data)
# 主函数拼凑URL
def main():
 base_url = 'https://space.bilibili.com/ajax/member/getSubmitVideos?mid=43636152&pagesize=30&tid=0&page={}&keyword=&order=pubdate'
 for k in range(1,4):
 time.sleep(2)
 access_url = base_url.format(k)
 html = get_html(access_url)
if __name__ == "__main__":
 main()

结果展示:

Python-获取B站UP主的所有视频-七朵组合为例

 

好啦,今天的python爬虫分析就到这里,有需要交流的可以私信或者加我的微信【其他文章中留过,大家记得关注我,以后会给大家分享更多!】

谢谢啦!



Tags:Python   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
大家好,我是菜鸟哥,今天跟大家一起聊一下Python4的话题! 从2020年的1月1号开始,Python官方正式的停止了对于Python2的维护。Python也正式的进入了Python3的时代。而随着时间的...【详细内容】
2021-12-28  Tags: Python  点击:(1)  评论:(0)  加入收藏
学习Python的初衷是因为它的实践的便捷性,几乎计算机上能完成的各种操作都能在Python上找到解决途径。平时工作需要在线学习。而在线学习的复杂性经常让人抓狂。费时费力且效...【详细内容】
2021-12-28  Tags: Python  点击:(1)  评论:(0)  加入收藏
Python 是一个很棒的语言。它是世界上发展最快的编程语言之一。它一次又一次地证明了在开发人员职位中和跨行业的数据科学职位中的实用性。整个 Python 及其库的生态系统使...【详细内容】
2021-12-27  Tags: Python  点击:(2)  评论:(0)  加入收藏
菜单驱动程序简介菜单驱动程序是通过显示选项列表从用户那里获取输入并允许用户从选项列表中选择输入的程序。菜单驱动程序的一个简单示例是 ATM(自动取款机)。在交易的情况下...【详细内容】
2021-12-27  Tags: Python  点击:(4)  评论:(0)  加入收藏
近日只是为了想尽办法为 Flask 实现 Swagger UI 文档功能,基本上要让 Flask 配合 Flasgger, 所以写了篇 Flask 应用集成 Swagger UI 。然而不断的 Google 过程中偶然间发现了...【详细内容】
2021-12-23  Tags: Python  点击:(6)  评论:(0)  加入收藏
有不少同学学完Python后仍然很难将其灵活运用。我整理15个Python入门的小程序。在实践中应用Python会有事半功倍的效果。01 实现二元二次函数实现数学里的二元二次函数:f(x,...【详细内容】
2021-12-22  Tags: Python  点击:(32)  评论:(0)  加入收藏
Verilog是由一个个module组成的,下面是其中一个module在网表中的样子,我只需要提取module名字、实例化关系。module rst_filter ( ...); 端口声明... wire定义......【详细内容】
2021-12-22  Tags: Python  点击:(9)  评论:(0)  加入收藏
运行环境 如何从 MP4 视频中提取帧 将帧变成 GIF 创建 MP4 到 GIF GUI ...【详细内容】
2021-12-22  Tags: Python  点击:(6)  评论:(0)  加入收藏
面向对象:Object Oriented Programming,简称OOP,即面向对象程序设计。类(Class)和对象(Object)类是用来描述具有相同属性和方法对象的集合。对象是类的具体实例。比如,学生都有...【详细内容】
2021-12-22  Tags: Python  点击:(9)  评论:(0)  加入收藏
所谓内置函数,就是Python提供的, 可以直接拿来直接用的函数,比如大家熟悉的print,range、input等,也有不是很熟,但是很重要的,如enumerate、zip、join等,Python内置的这些函数非常...【详细内容】
2021-12-21  Tags: Python  点击:(5)  评论:(0)  加入收藏
▌简易百科推荐
大家好,我是菜鸟哥,今天跟大家一起聊一下Python4的话题! 从2020年的1月1号开始,Python官方正式的停止了对于Python2的维护。Python也正式的进入了Python3的时代。而随着时间的...【详细内容】
2021-12-28  菜鸟学python    Tags:Python4   点击:(1)  评论:(0)  加入收藏
学习Python的初衷是因为它的实践的便捷性,几乎计算机上能完成的各种操作都能在Python上找到解决途径。平时工作需要在线学习。而在线学习的复杂性经常让人抓狂。费时费力且效...【详细内容】
2021-12-28  风度翩翩的Python    Tags:Python   点击:(1)  评论:(0)  加入收藏
Python 是一个很棒的语言。它是世界上发展最快的编程语言之一。它一次又一次地证明了在开发人员职位中和跨行业的数据科学职位中的实用性。整个 Python 及其库的生态系统使...【详细内容】
2021-12-27  IT资料库    Tags:Python 库   点击:(2)  评论:(0)  加入收藏
菜单驱动程序简介菜单驱动程序是通过显示选项列表从用户那里获取输入并允许用户从选项列表中选择输入的程序。菜单驱动程序的一个简单示例是 ATM(自动取款机)。在交易的情况下...【详细内容】
2021-12-27  子冉爱python    Tags:Python   点击:(4)  评论:(0)  加入收藏
有不少同学学完Python后仍然很难将其灵活运用。我整理15个Python入门的小程序。在实践中应用Python会有事半功倍的效果。01 实现二元二次函数实现数学里的二元二次函数:f(x,...【详细内容】
2021-12-22  程序汪小成    Tags:Python入门   点击:(32)  评论:(0)  加入收藏
Verilog是由一个个module组成的,下面是其中一个module在网表中的样子,我只需要提取module名字、实例化关系。module rst_filter ( ...); 端口声明... wire定义......【详细内容】
2021-12-22  编程啊青    Tags:Verilog   点击:(9)  评论:(0)  加入收藏
运行环境 如何从 MP4 视频中提取帧 将帧变成 GIF 创建 MP4 到 GIF GUI ...【详细内容】
2021-12-22  修道猿    Tags:Python   点击:(6)  评论:(0)  加入收藏
面向对象:Object Oriented Programming,简称OOP,即面向对象程序设计。类(Class)和对象(Object)类是用来描述具有相同属性和方法对象的集合。对象是类的具体实例。比如,学生都有...【详细内容】
2021-12-22  我头秃了    Tags:python   点击:(9)  评论:(0)  加入收藏
所谓内置函数,就是Python提供的, 可以直接拿来直接用的函数,比如大家熟悉的print,range、input等,也有不是很熟,但是很重要的,如enumerate、zip、join等,Python内置的这些函数非常...【详细内容】
2021-12-21  程序员小新ds    Tags:python初   点击:(5)  评论:(0)  加入收藏
Hi,大家好。我们在接口自动化测试项目中,有时候需要一些加密。今天给大伙介绍Python实现各种 加密 ,接口加解密再也不愁。目录一、项目加解密需求分析六、Python加密库PyCrypto...【详细内容】
2021-12-21  Python可乐    Tags:Python   点击:(8)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条