博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python使用get在百度搜索并保存第一页搜索结果
阅读量:6673 次
发布时间:2019-06-25

本文共 790 字,大约阅读时间需要 2 分钟。

python使用get在百度搜索并保存第一页搜索结果

作者:vpoet

mail:vpoet_sir@163.com

注:随意copy,不用在意我的感受

1 #coding:utf-8 2 import urllib 3 import urllib2 4 import re 5  6 """ 7 使用GET在百度搜索引擎上查询 8 此例演示如何生成GET串,并进行请求. 9 """10 if __name__=="__main__":11     url = "http://www.baidu.com/s"12     search = [('w','QQ')]13     getString = url + "?" + urllib.urlencode(search)14 15     req = urllib2.Request(getString)16     fd = urllib2.urlopen(req)17     baiduResponse=""18     while 1:19         data= fd.read(1024)20         if not len(data):21             break22         baiduResponse+=data23     fobj=open("baidu.html",'w')24     fobj.write(baiduResponse)25     fobj.close()

 

搜索QQ保存的网页截图为:

打开看看:

再和百度搜索QQ的结果对比:

对的,是一样的。我们保存的网页没有图片是因为我们只保存的网页的html结构并没有将其中的图片链接从服务器上下载下来,懂了吧

转载于:https://www.cnblogs.com/vpoet/p/4659594.html

你可能感兴趣的文章
我的友情链接
查看>>
本体编辑和知识获取软件--protege汉化版
查看>>
C# 利用NPOI来导入Excel表
查看>>
23张非常精美的圣诞桌面壁纸分享
查看>>
稀疏矩阵的压缩存储和转置
查看>>
华为S5700交换机开启WEB配置
查看>>
mysql主从同步错误解决和Slave_IO_Running: NO
查看>>
Coding and Paper Letter(十七)
查看>>
感谢51CTO提供这个平台让我可以分享“姿势”
查看>>
Toast 自定义位置和带图
查看>>
outlook设置gmail邮箱报错:Outlook 无法连接到接收(POP3)电子邮件服务器
查看>>
linux中文件的常用操作
查看>>
php rabbitmq操作类及生产者和消费者实例代码
查看>>
C# 面向对象三大特征 的简单描述
查看>>
Tomcat服务器集群与负载均衡实现
查看>>
我的友情链接
查看>>
crontab使用进程锁flock解决冲突
查看>>
MySQL 5.6 for Windows 解压缩版配置安装
查看>>
linux使用ntfs-3g 挂载NTFS分区
查看>>
森林、域树、域之间的关系? AD与站点之间的关系?
查看>>