信息采集系统

系统概述

  基于互联网指定信息的信息采集系统,降低了内容维护的工作量,并能及时的丰富门户网、政务网、多媒体查询平台的信息内容,使政府信息发布快速、丰富、有效。

系统特点

数据采集添加全自动
  网站抓取的目的主要是添加到您的网站中,网站信息采集系统可以实现信息采集添加全自动完成。

需要登录的网站也照抓
  对于需要登录才能看到信息内容的网站,网站信息采集系统可以实现轻松登录并采集,即使有验证码也可以穿过登录采集到您需要的信息。

任意类型的文件都能下载
  如果需要采集图片、Flash、视频等二进制文件,网站信息采集系统经过简单设置就可以把任意类型的文件保存到本地。

多级页面采集
  可以同时采集到多级页面的内容。如果一条信息分布在很多不同的页面上,网站信息采集系统也能自动识别N级页面实现信息采集抓取 。

自动识别JavaScript特殊网址
  不少网站的网页连接是类似javascript:showurl('abcd')这样的特殊网址,不是通常的http://开头的,网站信息采集系统也能自动识别抓到内容 。

可以自动获取各分类网址
  比如供求信息,往往有很多很多个分类,经过简单设置网站信息采集系统就可以自动抓取到这些分类网址,并把抓取到的信息自动分类 。

多页新闻自动抓取、广告过滤
  有些一条新闻里面还有下一页,网站信息采集系统也可以把各个页面都抓取到的。并且抓取到的新闻中的图片和文字同时可以保存下来,并能把广告过滤掉 。

自动破解防盗链
  很多下载类的网站都做了防盗链了,直接输入网址是抓不到内容的,但是网站信息采集系统能自动破解防盗链。