本地下载文件大小:18.66 MB
高速下载需优先下载高速下载器
无人值守免费自动采集器Editor Tools是自在工坊推出的一款网站自动更新工具,业内简称ET,目前很多网站都需要大量的人力去维护更新才能保证网站的流量,这项工作是每个站长都必须面对的问题,无人值守免费自动采集器可以帮助站长解决这一问题,接入需要采集网站的,设置采集数据项、关键词、采集格式、类型文件等信息,并对采集的信息进行编码转换、支持UBB代码,使用无人值守免费自动采集器可以极大的减轻我们网站采集发布的工作量,采集器使用简单,只要建立采集规则到配置中间规则到配置发布规则,便可以开始自动采集工作了,需要的朋友快来双鱼下载站下载吧,软件绿色免安装,方便大家的使用。
1、全自动无人值守
全自动无人值守无需人工值守,24小时自动实时监控目标,实时高效采集,昼夜不停为您提供内容更新。满足长期运行需求,将您从繁重工作中解脱
2、适用广泛
最全能的采集软件,支持任意类型网站采集,适用率高达99.9% ,支持发布到所有类型网站程序,更可以采集本地文件,免接口发布。
3、信息随心所欲
支持信息自由组合,通过强大的数据整理功能对信息深度加工,创造全新内容
4、任意格式文件下载
不论静态或动态,不论是图片、音乐、电影、软件,又或者是PDF文档、WORD文档,甚至种子文件,只要你想
5、伪原创
高速同近义词替换、多词随机替换、段落随机排序,助力内容SEO
6、无限多级页面采集
从支持多级目录开始,无论是垂直方向多层信息页面,还是平行方向复数内容分页,抑或AJAX调页面,为你轻松采集
7、自由扩展
开放的接口模式,可以自由二次开发,自定义任何功能,实现所有需求
反防盗链、反防采集
数据项自动编辑
数据参数自由组合
高速伪原创
字符解码
任意格式文件下载
动态文件自动识别
POST采集支持
HTTPS支持
支持下载FTP文件
支持FTP发布文件
无限级垂直页面采集
敏感词关键词精准筛选文章
延时采集
列表缩略图及额外信息采集
定时采集
多平台全球语言翻译
数据项翻译,翻译结果整理
全球编码网页自动识别
多级列表支持
HTTP响应头信息采集
SFTP支持(SSH协议)
FTPS支持(TLS/SSL加密)
支持滚动更新的工作日志
随机水印位置
登录Cookies自动更新
自定义智能文件目录
配置数据库备份恢复
记录数据库自动清理
同名文件智能处理
窗口直接复制目录
自动截取,摘要生成
自动拼音转换,自动大小写转换
随机采集间隔时间
独立及随机UserAgent标识
数据项二次整理
自动分词/关键词
正则采集/正则整理
多个代理自动轮换
使用ET采集3获取自动摘要
ET采集3数据项增加了一个“截取”选项,“截取”选项用于将数据项的内容按指定长度的字数自动截断。
我们可以用该功能实现自动摘要。
步骤如下:
1、新建数据项,下图我们建立了一个名为“自动摘要”的数据项。
2、复制正文数据项的采集规则粘贴到自动摘要的规则里,勾选“去首尾空白”,设置截取字数。
3、建立自动摘要的数据整理组。
示例中第一条规则用于去除所有HTML标记,第二条规则过滤换行,第三条规则将连续的空白替换为一个空格。
4、在自动摘要数据项里关联整理组,然后点测试按钮进行测试。
5、从测试结果可以看到,我们想要的从正文自动截取生成摘要的功能已经实现了。
如何采集回复
在采集文章时,我们常常需要采集如回复、评论以及类似格式的信息,比如论坛帖子的回复、新闻的评论。
它们的特点是,在同一个页面上呈现多条相同格式的内容。
采集回复,分为两种情况,一种是直接使用 【正文】数据项采集,另一种是新建数据项采集。
一、直接使用正文数据项采集
这种方式,适合于正文(即主题)与回复的代码格式相同,例如绝大部分论坛。
通常我们只需要勾选 正文的选项【匹配多条】即可。
1、图一是discuz!x论坛的一种用【正文】数据项同时采集主题和回复的设置。
2、图二是另一种discuz!x论坛的用【正文】数据项同时采集主题和回复的设置。
3、图三是百度贴吧用【正文】数据项同时采集主题和回复的设置。
下图是测试结果,可以看到采集的由ET分隔符分隔的多条回复信息,在实际发布回复时,会自动去掉ET分隔符。
4、发布的设置
如果有使用独立的回复接口网址,那么在发布配置中开启,【回复关联参数名】留空,回复信息将逐一向【回复接口】提交,完成回复的添加;
如果没有开启独立的回复,那么回复信息将和正文一起提交给【发布接口】。
需要注意的是,要同时采集回复,那么【正文】数据项的【数据项采集规则】必须兼容正文和回复的格式。
由于回复通常有多页,所以以上图示勾选了【有分页】选项,并设置了【数据分页】(数据分页的设置请见相关文章。)
二、使用独立数据项采集回复
这种方式适合 正文与回复代码格式不同的情况,比如新闻的评论。
1、在采集配置中新建回复数据项,做好相关设置,能正确采集到回帖内容。
2、在发布配置-发布项中新建一个参数,用于从采集规则中的回复数据项获取采集结果。
3、在发布配置-基本设置中,设置回复关联参数,为第2步新建的参数名。
设置完成。
用户可根据采集目标的情况,选择适合的方式采集回复信息。
一体机驱动/ 131 MB
系统增强/ 45.33 MB
杂类其他/ 8.32 MB
站长工具/ 24.5 MB
游戏辅助/ 110 MB
软件评论
请自觉遵守互联网相关政策法规,评论内容只代表网友观点,与本站立场无关!