python爬不同图片分别保存在不同文件夹中的实现
例如,爬取赵丽颖,赵本山,赵文卓,赵欢,赵日天的图片分别保存在赵丽颖,赵本山,赵文卓,赵欢,赵日天命名的文件夹中,
测试代码
文章图片
文章图片
别的图就不放了
import requestsimport timeimport os# 请求头,伪装成浏览器headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'}# keyword = '云斑白条天牛' # 关键字keywords = ['赵丽颖','赵本山','赵文卓','赵欢','赵日天']max_page = 2i=1 # 记录图片数for keyword in keywords:os.makedirs(keyword)for page in range(1,max_page):page = page*30# 网址url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord='\+keyword+'&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=©right=&word='\+keyword+'&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn='\+str(page)+'&rn=30&gsm=1e&1596899786625='# 请求响应response = requests.get(url=url,headers=headers)# 得到相应的json数据json = response.json()if json.get('data'):for item in json.get('data')[:30]:# 图片地址img_url = item.get('thumbURL')# 获取图片image = requests.get(url=img_url)# 下载图片newstr = './'+keyword+'/'+str(i)+'.jpg'# with open('./%s/%d.jpg'%keywords ,%i,'wb') as f:with open(newstr,'wb') as f:f.write(image.content) # 图片二进制数据time.sleep(1) # 等待1sprint('第%d张%s图片下载完成...'%(i,keyword))i+=1print('End!')
你要修改的参数 将你想要爬的数据填入keywords 数组中即可
# 这里放你要查询的数组keywords = ['','','',']
【python爬不同图片分别保存在不同文件夹中的实现】max_page是爬取百度图片的页数,一页是30张,这里写2的话就能爬30张,3能爬60张,以此类推
max_page = 3
你要的代码 代码如下:
import requestsimport timeimport os# 请求头,伪装成浏览器headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'}# 这里放你要查询的数组keywords = ['','','',']max_page = 4i=1 # 记录图片数for keyword in keywords:os.makedirs(keyword)for page in range(1,max_page):page = page*30# 网址url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord='\+keyword+'&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=©right=&word='\+keyword+'&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn='\+str(page)+'&rn=30&gsm=1e&1596899786625='# 请求响应response = requests.get(url=url,headers=headers)# 得到相应的json数据json = response.json()if json.get('data'):for item in json.get('data')[:30]:# 图片地址img_url = item.get('thumbURL')# 获取图片image = requests.get(url=img_url)# 下载图片newstr = './'+keyword+'/'+str(i)+'.jpg'# with open('./%s/%d.jpg'%keywords ,%i,'wb') as f:with open(newstr,'wb') as f:f.write(image.content) # 图片二进制数据time.sleep(1) # 等待1sprint('第%d张%s图片下载完成...'%(i,keyword))i+=1print('End!')
到此这篇关于python爬不同图片分别保存在不同文件夹中的实现的文章就介绍到这了,更多相关python爬图片保存不同文件夹内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
推荐阅读
- python学习之|python学习之 实现QQ自动发送消息
- 逻辑回归的理解与python示例
- python自定义封装带颜色的logging模块
- 【Leetcode/Python】001-Two|【Leetcode/Python】001-Two Sum
- Python基础|Python基础 - 练习1
- Python爬虫|Python爬虫 --- 1.4 正则表达式(re库)
- 别墅庭院设计,不同的别墅庭院设计也给人视觉上完全不一样的!
- 2018-09-03(李克富视角点评训练营81/90)|2018-09-03(李克富视角点评训练营81/90) 那只蛙从“井”爬出来又进入了“隧道”
- 使用协程爬取网页,计算网页数据大小
- Python(pathlib模块)