用python实现 百度 站内搜索

摘要: 用PYTHON 实现baidu站内搜索, 有很多网站,为了搜索省事,或者是为了利用baidu ,google 搜索推广等。直接在页面调用了,google或者baidu 的站内搜索功能,只搜索与本站相关的内容。如何用python 自己写程序调用这些搜索引擎的借口,直接得到结果,显示在自己的页面中呢.经过测试是可以,以百度为例,代码如下:import re

用PYTHON 实现baidu站内搜索, 有很多网站,为了搜索省事,或者是为了利用baidu ,google 搜索推广等。直接在页面调用了,google或者baidu 的站内搜索功能,只搜索与本站相关的内容。如何用python 自己写程序调用这些搜索引擎的借口,直接得到结果,显示在自己的页面中呢.

经过测试是可以,以百度为例,代码如下:

import re
import urllib
import urllib2

def baiduInnerSearch(keyword):
print keyword
website='www.yihaomen.com'

values = {
"word":keyword.encode('gbk','ignore')
}
data=urllib.urlencode(values)
search_url='http://www.baidu.com/baidu?tn=bds&cl=3&ct=2097152&si='+website+'&s=on&'+data
print search_url
resp = urllib2.urlopen(search_url)
content = resp.read()
content=content.decode('gbk','ignore')
#打印出baidu搜索出来的内容
print content
#在此结果的基础上,用正则表达式,可以得到自己想要部分的信息

if __name__=='__main__':
baiduInnerSearch('python')

运行之后,接可以看到打印出来的搜索内容,配置正则表达式,就可以分析出内容,标题等,然后再自己的页面显示,有时间写个正则表达式解析的文章。

上一篇: 在网页中调用本地可执行文件之三(mac os)(run exe from web browser)
下一篇: 伦敦2012奥运会开幕式,让我失望
 评论 ( What Do You Think )
名称
邮箱
网址
评论
验证
   
 

 


  • 微信公众号

  • 我的微信

站点声明:

1、一号门博客CMS,由Python, MySQL, Nginx, Wsgi 强力驱动

2、部分文章或者资源来源于互联网, 有时候很难判断是否侵权, 若有侵权, 请联系邮箱:summer@yihaomen.com, 同时欢迎大家注册用户,主动发布无版权争议的 文章/资源.

3、鄂ICP备14001754号-3, 鄂公网安备 42280202422812号