用php代替js玩轉(zhuǎn)dom的思路及示例代碼
來(lái)源:易賢網(wǎng) 閱讀:801 次 日期:2014-07-31 09:59:44
溫馨提示:易賢網(wǎng)小編為您整理了“用php代替js玩轉(zhuǎn)dom的思路及示例代碼”,方便廣大網(wǎng)友查閱!
事情的起源比較簡(jiǎn)單,我需要把一個(gè)導(dǎo)航頁(yè)的數(shù)據(jù)整理好寫(xiě)入數(shù)據(jù)庫(kù)。一個(gè)比較直觀的方法是對(duì)html文件進(jìn)行分析,通用的方法是用php的正則表達(dá)式來(lái)匹配。但是這樣做開(kāi)發(fā)和維護(hù)都很困難,代碼可讀性非常差。 

導(dǎo)航頁(yè)的數(shù)據(jù)都是規(guī)則的排列在dom樹(shù)當(dāng)中的,用js可以用幾個(gè)循環(huán)輕松的對(duì)其進(jìn)行操作,而且js需要依賴瀏覽器,操作數(shù)據(jù)庫(kù)很困難。其實(shí)php就有現(xiàn)成的類庫(kù)對(duì)dom樹(shù)種的節(jié)點(diǎn)進(jìn)行增刪改查操作,在此做一些筆記。 

這里涉及到2個(gè)類 domdocument 和 domxpath。 

其實(shí)思路比較明確,就是通過(guò)domdocument將一個(gè)html file轉(zhuǎn)換成dom樹(shù)的數(shù)據(jù)結(jié)構(gòu),再用domxpath的實(shí)例去搜索這個(gè)dom樹(shù),拿到想要特定節(jié)點(diǎn),接下來(lái)就可以對(duì)當(dāng)前節(jié)點(diǎn)的子樹(shù)進(jìn)行遍歷,得到想要的結(jié)果。 

在當(dāng)前目錄下有一個(gè)這樣一個(gè)導(dǎo)航的html文件 ./hao.html 

現(xiàn)在需要得到所有<a>標(biāo)簽的中文內(nèi)容,php代碼如下: 
代碼如下:

<?php 
//將html/xml文件轉(zhuǎn)換成dom樹(shù) 
$dom = new domdocument(); 
$dom->loadhtmlfile(hao.html); 

//得到所有class為fix的dl標(biāo)簽 

// example 1: for everything with an id 
//$elements = $xpath->query(//*[@id]); 

// example 2: for node data in a selected id 
//$elements = $xpath->query(/html/body/div[@id='yourtagidhere']); 

// example 3: same as above with wildcard 
//$elements = $xpath->query(*/div[@id='yourtagidhere']); 
$xpath = new domxpath($dom); 
$dls = $xpath->query('//dl[@class=fix]'); 

foreach ($dls as $dl) { 
$spans = $dl->childnodes; 
foreach ($spans as $span) { 
echo trim($span->textcontent).\t; 
} 
echo \n; 
} 
?> 

輸出結(jié)果如下: 

注意:值得注意的一點(diǎn)是domdocument的默認(rèn)編碼方式是latin,所以在處理utf編碼的中文的時(shí)候,需要在<head>后面緊跟著填入 
代碼如下:

<meta http-equiv=content-type content=text/html; charset=utf-8> 

在其他位置,或者是只寫(xiě)上<meta content=charset=utf-8>都是不識(shí)別的哦
更多信息請(qǐng)查看網(wǎng)絡(luò)編程
易賢網(wǎng)手機(jī)網(wǎng)站地址:用php代替js玩轉(zhuǎn)dom的思路及示例代碼
由于各方面情況的不斷調(diào)整與變化,易賢網(wǎng)提供的所有考試信息和咨詢回復(fù)僅供參考,敬請(qǐng)考生以權(quán)威部門公布的正式信息和咨詢?yōu)闇?zhǔn)!

2025國(guó)考·省考課程試聽(tīng)報(bào)名

  • 報(bào)班類型
  • 姓名
  • 手機(jī)號(hào)
  • 驗(yàn)證碼
關(guān)于我們 | 聯(lián)系我們 | 人才招聘 | 網(wǎng)站聲明 | 網(wǎng)站幫助 | 非正式的簡(jiǎn)要咨詢 | 簡(jiǎn)要咨詢須知 | 加入群交流 | 手機(jī)站點(diǎn) | 投訴建議
工業(yè)和信息化部備案號(hào):滇ICP備2023014141號(hào)-1 云南省教育廳備案號(hào):云教ICP備0901021 滇公網(wǎng)安備53010202001879號(hào) 人力資源服務(wù)許可證:(云)人服證字(2023)第0102001523號(hào)
云南網(wǎng)警備案專用圖標(biāo)
聯(lián)系電話:0871-65099533/13759567129 獲取招聘考試信息及咨詢關(guān)注公眾號(hào):hfpxwx
咨詢QQ:526150442(9:00—18:00)版權(quán)所有:易賢網(wǎng)
云南網(wǎng)警報(bào)警專用圖標(biāo)