多模板自适应采集_熊猫智能采集软件介绍
软件介绍
当前页面:熊猫智能采集软件> 软件介绍> 多模板自适应采集

多模板自适应采集

此项功能是熊猫独有的。
对于大型网站的综合类栏目的内容页面,往往都是版面种类丰富。(典型的如阿里巴巴、慧聪中的二级企业网站,多大门户网站非新闻板块等等)。此时如果是设置一个模板,是无法采集完整的。如果需要完整采集数据,就需要针对该板块出现的不同页面版面风格,分别建立一套自定义模板,这样才有可能采集完整。
实际采集中,自始至终都是单一版面风格页面的场合,越来越少,存在多版面的场合越来越多、越来越复杂,数据采集的完整性也就越来越困难。

多模板采集

熊猫独有的多模板功能,可以针对实际需要,新增足够多的模板,来确保采集结果数据的100%完整。采集结果数据的“完整度”,是衡量一个采集软件成熟度的基本特征之一,但往往被忽视。
熊猫在采集运行时,会将所有定义的模板和采集目标页面,做一个相似度的分析,并按相似度做一个排序。按相似度排序后的顺序,逐个进行模板匹配,直到匹配成功。
如上图所示,列表的右上方有个按钮“模板均失败时改用自动解析模式”。此功能是确保在意外遗漏的情况下,启用系统的自动分析功能,来做一个最终的补救。

熊猫独有的部分高级功能分项阐述

5码2期计划网页版-黑马全人工计划网页版-7码滚雪球计划电话:021-5160 1615

5码2期计划网页版-黑马全人工计划网页版-7码滚雪球计划手机:171 9219 7361

建议/合作: 139 1618 6547

5码2期计划网页版-黑马全人工计划网页版-7码滚雪球计划邮箱:123jlxie@ 163.com

5码2期计划网页版-黑马全人工计划网页版-7码滚雪球计划

服务时间:周一至周五(09:00-18:00)

友情链接:

Copyright @ 2011 qercindia.com All Rights Reserved 上海齐索信息科技有限公司