一个Python图片抓取小爬虫

     一个Python小爬虫,用于批量抓取页面上的图片,比如NBA贴吧中有一个贴子进而有大量精美动态图片,用下面这个Python就可一以次下全部下载至本地

      NBA贴子地址:http://tieba.baidu.com/p/3191208081


import re
import urllib

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html
def getImg(html):
    reg = r'src="(.*?\.jpg)" pic_ext=' #此处为正则表达式,用于匹配页面中的图片链接,不同的网页图片链接的格式有所不用,此处需按需调整
    imgre = re.compile(reg)
    imglist = re.findall(imgre,html)
    x = 1
    for imgurl in imglist:
        urllib.urlretrieve(imgurl,'%s.gif' % x )
        print "第",x,"张下载完成!"
        x+=1
#将图片所在网页链接放入此处,大部分在WINDOWS下使用,所以不采用变量传入的方式        
html = getHtml("http://tieba.baidu.com/p/3191208081")
#print html
getImg(html)

效果如下:

执行过程:

—————————————————————————————————

该帖子所有图片均在这个文件夹下了:

带来撑爆你的硬盘吧~

Python 进行中~