|
|
熊貓采集軟件可能與你見(jiàn)過(guò)的某些類(lèi)似工具軟件全然不同:功能強大,但又操作簡(jiǎn)單。兩者的差別,類(lèi)似于從DOS操作系統轉到windows視窗操作系統。前者需要專(zhuān)業(yè)技術(shù)人員才能有效操作,而熊貓則是面向普通大眾的可視化操作平臺。
熊貓采集軟件利用熊貓精準搜索引擎的解析內核,實(shí)現對網(wǎng)頁(yè)內容的仿瀏覽器解析,在此基礎上利用原創(chuàng )的技術(shù)實(shí)現對網(wǎng)頁(yè)框架內容與核心內容的分離、抽取,并實(shí)現相似頁(yè)面的有效比對、匹配。因此,用戶(hù)只需要指定一個(gè)參考頁(yè)面,熊貓采集軟件系統就可以據此來(lái)匹配類(lèi)似的頁(yè)面,來(lái)實(shí)現用戶(hù)需要采集資料的批量采集。
在此過(guò)程中,用戶(hù)不再需要使用非常專(zhuān)業(yè)的“正則表達式”技術(shù),不要需要借助技術(shù)高手來(lái)編寫(xiě)采集匹配規則。熊貓采集軟件系統會(huì )將參考頁(yè)面的內容解析分解后,由用戶(hù)利用鼠標點(diǎn)選需要采集的對象即可,系統據此就可以知道用戶(hù)需要采集的內容。熊貓采集軟件的模板定制過(guò)程,是一個(gè)對目標頁(yè)面進(jìn)行機器學(xué)習、機器訓練的過(guò)程。
熊貓采集軟件力求設計成為一款通用性的泛采集工具軟件,實(shí)現瀏覽器可見(jiàn)的內容都可以采集。
在功能設計上力求通用性,提供各種可以自由組合的功能方法,由用戶(hù)靈活采用,以實(shí)現各自的不同采集需求,因此采集工具軟件的一些常見(jiàn)功能都會(huì )具備。
下面列出熊貓獨有的一些特色功能:
輸入網(wǎng)址即可采集
輸入關(guān)鍵詞即可采集
云采集功能
依據內容判斷文章相似度,并過(guò)濾重復
多模板功能
萬(wàn)能的可視化發(fā)布功能
靈活的數據清洗功能
靈活的數據二次加工功能
通用性的采集軟件
智能化輔助操作
全程可視化鼠標操作
可采集結構復雜的對象集合
采集結果可以是由多張表組成的復雜數據關(guān)系
強悍的抗干擾能力
電話(huà):171 9219 7361
建議/合作: 139 1618 6547
郵箱:123jlxie@ 163.com
Copyright @ 2011 www.t6bz.cn All Rights Reserved 上海齊索信息科技有限公司 滬ICP備16048952號-4