有声小说,完美世界,大主宰天蚕土豆

使用Selenium來(lái)抓取動(dòng)態(tài)加載的頁(yè)面

作者：網(wǎng)絡(luò)轉(zhuǎn)載發(fā)布時(shí)間：[ 2015/2/25 17:45:41 ] 推薦標(biāo)簽：Selenium 單元測(cè)試

　　有些頁(yè)面是通過(guò)js以及ajax動(dòng)態(tài)加載的，例如：花瓣網(wǎng)。這時(shí)如果我們直接分析原始頁(yè)面的html，是得不到有效的信息的。當(dāng)然，因?yàn)闊o(wú)論怎樣動(dòng)態(tài)加載，基礎(chǔ)信息總歸是包含在初始頁(yè)面中得，所以我們可以用爬蟲(chóng)代碼來(lái)模擬js代碼，js讀取頁(yè)面元素值，我們也讀取頁(yè)面元素值;js發(fā)送ajax，我們拼湊參數(shù)、發(fā)送ajax并解析返回的json。這樣總歸是能做的，但是比較麻煩，有沒(méi)有比較省力的方法呢？比較好的方法大概是內(nèi)嵌一個(gè)瀏覽器了。
　　Selenium是一個(gè)模擬瀏覽器，進(jìn)行自動(dòng)化測(cè)試的工具，它提供一組API可以與真實(shí)的瀏覽器內(nèi)核交互。Selenium是跨語(yǔ)言的，有Java、C#、python等版本，并且支持多種瀏覽器，chrome、firefox以及IE都支持。
　　在Java項(xiàng)目中使用Selenium，需要做兩件事：
　　在項(xiàng)目中引入Selenium的Java模塊，以Maven為例：
　　<dependency> <groupId>org.seleniumhq.selenium</groupId> <artifactId>selenium-java</artifactId> <version>2.33.0</version> </dependency>
　　下載對(duì)應(yīng)的driver，以chrome為例：http://code.google.com/p/chromedriver/downloads/list
　　下載后，需要將driver的位置寫(xiě)到Java的環(huán)境變量里，例如我在mac下將其下載到了/Users/yihua/Downloads/chromedriver，則需要在程序里添加以下代碼(當(dāng)然在JVM參數(shù)里寫(xiě)-Dxxx=xxx也是可以的)：
　　System.getProperties().setProperty("webdriver.chrome.driver"，"/Users/yihua/Downloads/chromedriver");
　　Selenium的API挺簡(jiǎn)單的，核心是WebDriver，下面是動(dòng)態(tài)渲染頁(yè)面，并獲取終html的代碼：
@Test
public void testSelenium() {
System.getProperties().setProperty("webdriver.chrome.driver"， "/Users/yihua/Downloads/chromedriver");
WebDriver webDriver = new ChromeDriver();
webDriver.get("http://huaban.com/");
WebElement webElement = webDriver.findElement(By.xpath("/html"));
System.out.println(webElement.getAttribute("outerHTML"));
webDriver.close();
}
　　值得注意的是，每次new ChromeDriver()，Selenium都會(huì)建立一個(gè)Chrome進(jìn)程，并使用一個(gè)隨機(jī)端口在Java中與chrome進(jìn)程進(jìn)行通信來(lái)交互。由此可見(jiàn)有兩個(gè)問(wèn)題：
　　因此如果直接關(guān)閉Java程序，Chrome進(jìn)程可能是無(wú)法關(guān)閉的。這里需要顯示的調(diào)用webDriver.close()來(lái)關(guān)閉進(jìn)程。
　　創(chuàng)建進(jìn)程的開(kāi)銷還是比較大的，盡量對(duì)webDriver進(jìn)行復(fù)用會(huì)比較好。可惜根據(jù)官方的文檔，webDriver不是線程安全的，所以我們需要建立一個(gè)webDriver池來(lái)保存它們。不清楚Selenium是否有這樣的接口，反正我是自己寫(xiě)了一個(gè)WebDriverPool來(lái)完成這個(gè)任務(wù)。

關(guān)鍵詞閱讀

測(cè)試熱點(diǎn)文章

技術(shù)專題

活動(dòng)專題

【獲獎(jiǎng)名單公布】加入Alltesting眾測(cè)免費(fèi)領(lǐng)取新發(fā)行測(cè)試書(shū)籍
加入Alltesting眾測(cè)免費(fèi)領(lǐng)取新發(fā)行書(shū)籍《京東質(zhì)量團(tuán)隊(duì)轉(zhuǎn)型實(shí)踐從測(cè)試到測(cè)試開(kāi)發(fā)的蛻變》
【Alltesting眾測(cè)2典】0元測(cè)試體驗(yàn)+100元現(xiàn)金券+免費(fèi)性能測(cè)試
先測(cè)試后付費(fèi)-Alltesting眾測(cè)超級(jí)福利
2000元性能測(cè)試服務(wù)，安全生產(chǎn)，穩(wěn)定運(yùn)行，為您的系統(tǒng)保駕護(hù)航！！！
在線性能測(cè)試工具（WebPR）培訓(xùn)與技術(shù)交流（第二期）
Alltesting眾測(cè)平臺(tái)全新功能已開(kāi)啟！！
生命周期管理軟件ALM-本地安裝版本正式發(fā)布！！！

亚洲好骚综合-亚洲黄色录像-亚洲黄色网址-亚洲黄色网址大全-99久久99久久-99久久99久久精品国产