独品网页批量采集是一款指定区域指定属性采集网页内容的软件,可自定义过滤条件采集方式,速度快,精确度高,网页资源批量采集神器。
软件说明:
采集discuz、phpwind等论坛博客贴内大图、贴内文章、贴内链接,可限定版块或排除版块,还可以指定发帖作者、帖子内容等。
采集小说文章、软件链接、视频音乐,可全站查找、按搜索关键字查找等。
软件使用:
简单型:添加任务>填写网址>分析页面>填写命令>采集下载
详细型:新建数据>添加任务>填写网址>分析页面>得到采集命令>填写过滤函数>设置参数>选择保存路径>采集>下载
软件功能:
1、链接地址:可以是单个地址也可以循环地址,还可以是其他任务采集到的所有链接地址。 如http://bbs.dupinsoft.com/thread-[1-360]-1-1.html 包括360个页面
2、采集命令:命令分为两部分,前一部分为指定区域,后一部分指定内容,如:
(独品论坛贴内图片)、(区域内文本)
3、链接过滤、采集过滤:均使用函数过滤,自带常用过滤函数find、notfind、findin、notfindin,使用:find(,贴图鉴赏)、notfind(value,image/face)
4、执行参数:涉及到采集完成后自动下载、按网页标题保存、文件重复时跳过、是否保留到IE缓存等