概述

信息时代的发展带来网络海量信息的形成,政府单位、各大企业以及银行、教育机构都迫切希望快速、高效地搜集提取与自身利益相关的、自己需要的有用信息,信息采集系统正式这样一种高效工具。它能够针对定制的目标数据源,实时进行信息采集、抽取、挖掘、处理,从而为各种信息服务系统提供数据输入。

16-17-01.jpg


功能特点

信息批量采集:批量采集信息标题、正文、发布时间、作者及附件(PDF、RAR、图片)等各种数据;

互联网数据挖掘:从指定网站抓取所需数据,通过分析和处理后保存到本地库;

自动监控并抓取信息,如新闻、论坛等,然后进行分析处理;

网站内容维护:定时采集并自动发布到指定的网站。
垃圾过滤:自动过滤网页中信息的正文内容,剔除广告、版权等垃圾信息。
支持多语言网页的采集:支持中、英、日、韩、俄、法、西、德、阿拉伯语等语言。
支持对多种条件的检索:包括按标题、日期等,同时提供排序功能。


应用方向

异构网站信息的采集
竞争情报系统的数据采集
舆情系统的数据采集
报业系统的数据采集



版权所有 苏ICP备14028181号
@2010-2015 BoShan. All right reserved Powered by BoShan