燕之庐网站建设 - 优质网站设计公司

python

2010/02/09

Python urlopen 使用小示例

Tags:

打开一个网页获取所有的内容、获取Http头、使用代理等小结

一、打开一个网页获取所有的内容

from urllib import urlopen
doc = urlopen(“http://www.baidu.com”).read()
print doc

二、获取Http头

from urllib import urlopen
doc = urlopen(“http://www.baidu.com”)
print doc.info()
print doc.info().getheader(‘Content-Type’)

三、使用代理

1. 查看环境变量

print “n.join(["%s=%s" % (k, v) for k, v in os.environ.items()])
print os.getenv(“http_proxy”)

2. 设置环境变量

import os
os.putenv(“http_proxy”, “http://proxyaddr:<port>”)

3. 使用代理

# Use http://www.someproxy.com:3128 for http proxying
proxies = {‘http’: ‘http://www.someproxy.com:3128′}
filehandle = urllib.urlopen(some_url, proxies=proxies)
# Don’t use any proxies
filehandle = urllib.urlopen(some_url, proxies={})
# Use proxies from environment – both versions are equivalent
filehandle = urllib.urlopen(some_url, proxies=None)
filehandle = urllib.urlopen(some_url)
北京网站建设公司

请您留下评论

本文评论的 RSS feed。 引用消息(Trackback) URL

您必须 登录 才能发表评论。