Python反爬实战掌握酷狗音乐排行榜加密规则
目录
- 效果展示
- 爬取目标
- 工具使用
- 项目思路解析
- 简易源码分享
效果展示
爬取目标 网址:酷我音乐
文章图片
工具使用 开发工具:pycharm
开发环境:python3.7, Windows10
使用工具包:requests,re
项目思路解析 找到需要解析的榜单数据
文章图片
随意点击一个歌曲获取到音乐的详情数据 通过抓包的方式获取到音乐播放数据
文章图片
找到MP3的数据提交地址 mp3数据来自于这个url地址
文章图片
文章图片
提交数据的网址:
https://wwwapi.kugou.com/yy/index.php?r=play/getdata&callback=jQuery19102816534571347611_1626783818555&hash=A38449E76C74D45825F565C1FDB825C0&dfid=3dKstH1sJdRa44o6Vj0ZIryF&mid=4458f6d567640b39de367a394d69879e&platid=4&album_id=40437970&_=1626783818556
将多个网址数据进行对比看看哪些参数是需要自行修改的
文章图片
变化的url数据有3个
- hash
- album_id
- _
文章图片
歌曲的数据都是来自网页源代码
文章图片
梳理整体思路:
- 从首页源码里提取出对应的hash、album_id值
- 组合成新的url地址
- 获取到json数据总的歌曲播放地址
简易源码分享 本章内容只限学习,切勿用作其他用途!!!!!
import requestsimport reimport time?def Tools(url):headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36 Edg/91.0.864.70'}response = requests.get(url, headers=headers)return response?def Save(name, url):mp3 = Tools(url).content# 请求mp3地址链接 返回格式是16进制f = open('./kugou/{}.mp3'.format(name), 'wb') # w 文件存在就写入不存在就会创建b进制读写f.write(mp3)f.close()print('{}下载完成....'.format(name))?url = 'https://www.kugou.com/yy/html/rank.html'response = Tools(url).textalbum_id = re.findall(r'"album_id":(\d*?),', response) # idHash = re.findall(r'"Hash":"(.*?)",', response)# hash?for a, h in zip(album_id, Hash):# 生成时间戳time1 = int(time.time() * 1000)# 包含歌曲下载地址的urlurls = 'https://wwwapi.kugou.com/yy/index.php?r=play/getdata&hash={}&dfid=0zlWqK0UWNFa0weUnX0hjlFa&mid=f79511e2e86914b99e351c42ba1f8bc7&platid=4&album_id={}&_={}'.format(h, a, time1)response1 = Tools(urls).json()audio_name = response1['data']['audio_name'].split('-')[1]play_url = response1['data']['play_url']Save(audio_name, play_url)?
【Python反爬实战掌握酷狗音乐排行榜加密规则】以上就是Python实战酷狗音乐反爬排行榜加密规则的详细内容,更多关于Python反爬酷狗音乐排行榜加密规则的资料请关注脚本之家其它相关文章!
推荐阅读
- python学习之|python学习之 实现QQ自动发送消息
- 逻辑回归的理解与python示例
- python自定义封装带颜色的logging模块
- 【Leetcode/Python】001-Two|【Leetcode/Python】001-Two Sum
- Python基础|Python基础 - 练习1
- Python爬虫|Python爬虫 --- 1.4 正则表达式(re库)
- Python(pathlib模块)
- python青少年编程比赛_第十一届蓝桥杯大赛青少年创意编程组比赛细则
- Python数据分析(一)(Matplotlib使用)
- 《机器学习实战》高清中文版PDF英文版PDF+源代码下载