LocoySpider中文名是火車采集器,非常好用的一個(gè)網(wǎng)站采集和分析工具,免費(fèi)使用,功能強(qiáng)大,可以通過(guò)這個(gè)軟件查看這個(gè)網(wǎng)站的大部分內(nèi)容!
軟件介紹
火車采集器是一款專為站長(zhǎng)提供的網(wǎng)站采集分析工具,這款軟件幾乎能采集所有網(wǎng)頁(yè),而且速度非?,采集/發(fā)布如同復(fù)制/粘貼一樣精準(zhǔn)。通過(guò)靈活的配置,您可以很輕松的從網(wǎng)頁(yè)上抓取文字、圖片、文件等任何資源。
功能詳解
1、規(guī)則自定義-通過(guò)采集規(guī)則的定義,可以搜索所有網(wǎng)站采集幾乎任何類型的信息。
2、多任務(wù),多線程-可以同時(shí)進(jìn)行多個(gè)信息采集任務(wù),每個(gè)任務(wù)可以使用多個(gè)線程。
3、所見(jiàn)即所得-任務(wù)采集過(guò)程所見(jiàn)即所得,過(guò)程中遍歷的鏈接信息、采集信息、錯(cuò)誤信息等都會(huì)及時(shí)的反映在軟件界面中。
4、數(shù)據(jù)保存-數(shù)據(jù)邊采集邊自動(dòng)保存到關(guān)系數(shù)據(jù)庫(kù)中,并且數(shù)據(jù)結(jié)構(gòu)能夠自動(dòng)適應(yīng),軟件可以根據(jù)采集規(guī)則自動(dòng)創(chuàng)建數(shù)據(jù)庫(kù),以及其中的表和字段,也可以通過(guò)導(dǎo)庫(kù)方式靈活的將數(shù)據(jù)保存到客戶已有的數(shù)據(jù)庫(kù)結(jié)構(gòu)中。
5、斷點(diǎn)續(xù)采-信息采集任務(wù)可以在停止后從斷點(diǎn)開(kāi)始繼續(xù)采集,從此你用不再擔(dān)心你的采集任務(wù)意外中斷了。
6、網(wǎng)站登錄-支持網(wǎng)站Cookie,支持網(wǎng)站可視化登錄,即使登錄時(shí)需要驗(yàn)證碼的網(wǎng)站也能采集。
7、計(jì)劃任務(wù)-通過(guò)這個(gè)功能可以讓你的采集任務(wù)定時(shí)、定量或者一直循環(huán)執(zhí)行。
8、采集范圍限制-可以根據(jù)采集的深度和網(wǎng)址的標(biāo)識(shí)來(lái)限制采集的范圍。
9、文件下載-可以將采集到的二進(jìn)制文件(諸如:圖片、音樂(lè)、軟件、文檔等等)下載到本地磁盤或者采集結(jié)果數(shù)據(jù)庫(kù)中。
10、結(jié)果替換-可以將采集的結(jié)果根據(jù)規(guī)則替換成你定義的內(nèi)容。
11、條件保存-可以根據(jù)某個(gè)條件來(lái)決定那些信息保存,那些信息過(guò)濾。
12、過(guò)濾重復(fù)內(nèi)容-軟件可根據(jù)用戶設(shè)置和實(shí)際情況對(duì)重復(fù)內(nèi)容和重復(fù)網(wǎng)址自動(dòng)刪除重復(fù)內(nèi)容。
13、特殊鏈接識(shí)別-運(yùn)用此功能可以將用JavaScript動(dòng)態(tài)生成的鏈接或其他更古怪的連接識(shí)別出來(lái)。
14、數(shù)據(jù)發(fā)布-可以通過(guò)自定義接口,將已采集的結(jié)果數(shù)據(jù)發(fā)布到任意的內(nèi)容管理系統(tǒng)和指定數(shù)據(jù)庫(kù)中,F(xiàn)在已支持的目標(biāo)發(fā)布媒體包括:數(shù)據(jù)庫(kù)(access,sqlserver,mysql,oracle),靜態(tài)htm文件。
15、預(yù)留編程接口-定義多個(gè)編程接口,用戶可以在事件中利用PHP,C#語(yǔ)言進(jìn)行編程,擴(kuò)充采集功能。
- PC官方版
- 安卓官方手機(jī)版
- IOS官方手機(jī)版