国产一级二级无码毛片,国产精偷伦视频在线观看

當(dāng)前位置：首頁 > 范文|應(yīng)用文 > IT技術(shù)專欄 > 腳本欄目

簡(jiǎn)單的抓取圖片的Python爬蟲

來源：易賢網(wǎng) 閱讀：1936 次日期：2015-01-03 10:41:08

溫馨提示：易賢網(wǎng)小編為您整理了“簡(jiǎn)單的抓取圖片的Python爬蟲”,方便廣大網(wǎng)友查閱！

代碼如下:

# -*- coding: cp936 -*-

import urllib2

import urllib

mmurl="http://xxxxxx.com/json/request_top_list.htm?type=0&page="

i=0#第二頁有個(gè)人的頁面沒圖片,會(huì)出現(xiàn)IO錯(cuò)誤

while i<15:

url=mmurl+str(i)

#print url #打印出列表的url

up=urllib2.urlopen(url)#打開頁面，存入句柄中

cont=up.read()

#print len(cont)#頁面的長(zhǎng)度

ahref='<a href="http'#篩選頁面內(nèi)網(wǎng)頁鏈接的關(guān)鍵字

target="target"

pa=cont.find(ahref)#找出網(wǎng)頁鏈接的頭部位置

pt=cont.find(target,pa)#找出網(wǎng)頁鏈接的尾部位置

for a in range(0,20):#如才能不把20硬編碼進(jìn)去？如何找到文件結(jié)尾？

urlx=cont[pa+len(ahref)-4:pt-2]#從頭部到尾部，將網(wǎng)頁鏈接存入變量

if len(urlx) < 60:#如果網(wǎng)頁鏈接長(zhǎng)度適合【len（）?。。?！】

urla=urlx #那么就準(zhǔn)備將其打印出來

print urla #這是想要的model個(gè)人URL

#########以下開始對(duì)model個(gè)人的URL進(jìn)行操作#########

mup=urllib2.urlopen(urla)#打開model個(gè)人的頁面，存入句柄中

mcont=mup.read()#對(duì)model頁面的句柄進(jìn)行讀出操作，存入mcont字符串

imgh="<img style=" #篩選頁面內(nèi)【圖片】鏈接的關(guān)鍵字

imgt=".jpg"

iph=mcont.find(imgh)#找出【圖片】鏈接的頭部位置

ipt=mcont.find(imgt,iph)#找出【圖片】鏈接的尾部位置

for b in range(0,10):#又是硬編碼····

mpic=mcont[iph:ipt+len(imgt)]#原始圖片鏈接，鏈接字符的噪聲太大

iph1=mpic.find("http")#對(duì)上面的鏈接再過濾一次

ipt1=mpic.find(imgt) #同上

picx=mpic[iph1:ipt1+len(imgt)]

if len(picx)<150:#仍有一些URL是“http：ss.png><dfsdf>.jpg”(設(shè)為100竟然會(huì)誤傷)

pica=picx #【是len(picx)<100而不是picx!!】不然會(huì)不顯示

print pica

############################

###########開始下載pica這個(gè)圖片

urllib.urlretrieve(pica,"pic\\tb"+str(i)+"x"+str(a)+"x"+str(b)+".jpg")

########### pica圖片下載完畢.(加上各循環(huán)體的數(shù)字，以免名字重復(fù))

############################

iph=mcont.find(imgh,iph+len(imgh))#開始下一個(gè)循環(huán)

ipt=mcont.find(imgt,iph)

############model個(gè)人URL內(nèi)的【圖片鏈接】提取完畢##########

pa=cont.find(ahref,pa+len(ahref))#將原來的頭部位作為起始點(diǎn)，繼續(xù)向后找下一個(gè)頭部

pt=cont.find(target,pa)#繼續(xù)找下一個(gè)尾部

i+=1

更多信息請(qǐng)查看IT技術(shù)專欄

更多信息請(qǐng)查看腳本欄目

上一篇：python執(zhí)行shell獲取硬件參數(shù)寫入mysql的方法

下一篇：簡(jiǎn)單使用Python自動(dòng)生成文章

易賢網(wǎng)手機(jī)網(wǎng)站地址：簡(jiǎn)單的抓取圖片的Python爬蟲

由于各方面情況的不斷調(diào)整與變化，易賢網(wǎng)提供的所有考試信息和咨詢回復(fù)僅供參考，敬請(qǐng)考生以權(quán)威部門公布的正式信息和咨詢?yōu)闇?zhǔn)！

相關(guān)閱讀腳本欄目

Bottle框架中的裝飾器類和描述符應(yīng)用詳解10月30日

Python探索之SocketServer詳解10月30日

Python探索之實(shí)現(xiàn)一個(gè)簡(jiǎn)單的HTTP服務(wù)器10月30日

python探索之BaseHTTPServer-實(shí)現(xiàn)Web服務(wù)器介紹10月30日

13個(gè)最常用的Python深度學(xué)習(xí)庫介紹10月30日

深入理解Python中的*重復(fù)運(yùn)算符10月30日

python logging日志模塊詳解10月30日

System表空間不足的報(bào)警問題淺析10月22日

Android開發(fā)自定義TextView省略號(hào)樣式的方法10月22日

MySQL 清除表空間碎片的實(shí)例詳解10月22日

Ubuntu下MySQL安裝及配置遠(yuǎn)程登錄教程10月22日

Python 2.x如何設(shè)置命令執(zhí)行的超時(shí)時(shí)間實(shí)例10月22日

windows 64位下redis安裝教程10月22日

Android 自定義 HorizontalScrollView 打造多圖片OOM 的橫向滑動(dòng)效果10月22日

淺談Node Inspector 代理實(shí)現(xiàn)10月22日

java web開發(fā)之購物車功能實(shí)現(xiàn)示例代碼10月22日

Android開發(fā)中GridView用法示例10月22日

Django ORM框架的定時(shí)任務(wù)如何使用詳解10月22日

SpringMail使用過程中的報(bào)錯(cuò)解決辦法10月22日

Android 使用自定義RecyclerView控件實(shí)現(xiàn)Gallery效果10月22日

易賢網(wǎng)移動(dòng)網(wǎng)站

2025國考·省考課程試聽報(bào)名

報(bào)班類型
姓名
手機(jī)號(hào)
驗(yàn)證碼