DEDE全自动采集插件

DedeCms织梦内容管理系统自动采集、伪原创、发布、更新一体化插件

[置顶]采集服务器环境设置

抢板凳

更新日志:

v3.78,Build:2626,时间:2015-03-30

内容:

1.修正了一个FIXURL的逻辑错误。
2.将文章生成标志前置,防止因某些原因不能正常生成以后死循环。
3.根据用户需求,扩充了采集规则,增加了[关键字]和[内容摘要]的匹配规则,留空则自动获取。
4.伪原创中增加了【繁简转换】的选项,同时支持文章和图集模型。
5.修正了一个在线升级时出现文件写入失败的错误。

 

本次更新涉及的文件:
/plus/autocollect/data/class.php
/plus/autocollect/data/template.php
/plus/autocollect/fun_gen.php
/plus/autocollect/fun_image.php
/plus/autocollect/fun_comm.php

更新操作:
请v3用户在插件后台控制面板上,点 在线升级插件 ,根据提示操作,就可以完成升级。
如果已经在全局设置里面勾选【自动升级到最新的发行版】,则可以自动升级到此版本,不需要手工在线升级。

阅读全文..

更新日志:

v3.76,Build:2508,时间:2013-05-31

内容:

1.修正了一个,文章内容分页最多只能采集到50页的逻辑问题。
2.修正了一个在某些特殊情况下,文章内容分页采集的顺序可能出现混乱的逻辑问题。
3.修正了一个在某些特殊网页里面,不能正确匹配关键字和内容摘要的问题。
4.修正了一个在DEDE系统配置参数里面设置了【不提取第一张图片作为缩略图】,但并不生效的逻辑问题。

 

本次更新涉及的文件:
/plus/autocollect/data/class.php
/plus/autocollect/data/template.php
/plus/autocollect/fun_gen.php
/plus/autocollect/fun_image.php
/plus/autocollect/fun_comm.php

更新操作:
请v3用户在插件后台控制面板上,点 在线升级插件 ,根据提示操作,就可以完成升级。
如果已经在全局设置里面勾选【自动升级到最新的发行版】,则可以自动升级到此版本,不需要手工在线升级。

阅读全文..

更新日志:

v3.74,Build:2475,时间:2013-02-28

内容:

1.增加了在内容SEO关键字中进行标签替换的功能。目前支持以下标签替换:{title},文章标题;{keywords},文章关键字;{summary},文章摘要;{sitename},网站名字;{siteurl},网站链接。
2.写入重要数据文件时进行crc32验证,保证数据文件完整性。
3.修正了一个取消正文伪原创时,仍然进行在线翻译的逻辑错误。
4.PHP5.3.18以上在CURL多线程采集时存在一个BUG,造成插件程序的多线程采集不能正常使用。现已修改插件程序适应此BUG。已知的受影响版本有:PHP5.3.20、PHP5.4.10。

 

本次更新涉及的文件:
/plus/autocollect/data/class.php
/plus/autocollect/data/template.php
/plus/autocollect/fun_gen.php
/plus/autocollect/fun_image.php
/plus/autocollect/fun_comm.php

更新操作:
请v3用户在插件后台控制面板上,点 在线升级插件 ,根据提示操作,就可以完成升级。
如果已经在全局设置里面勾选【自动升级到最新的发行版】,则可以自动升级到此版本,不需要手工在线升级。

阅读全文..

更新日志:

v3.72,Build:2443,时间:2012-11-27

内容:

1.修正了一个,导入同义词词组时如果文件是GBK编码,可能会显示乱码的逻辑问题。
2.修正了一个当DEDE安装在二级路径时,非正常设置二级路径参数可能会造成插件程序无法启动的逻辑问题。
3.修复了当网页为全英文网页字符时,判断网页代码可能不正确的逻辑问题。
4.修正了一个测试采集时,禁用多线程采集不起作用的逻辑错误。
5.修正了一个当PHP版本低于5.2.0时,设置多线程采集将会程序出错的问题。
6.为方便操作,在采集节点列表中增加了AJAX方式启用/禁用节点,和切换列表页采集频率的功能。具体使用方法是:点击节点名字前面的(或者×)就可以启用或禁用该节点,点击节点的[下次采集时间],就可以切换列表页采集频率为高频率或自动调整。

本次更新涉及的文件:
/plus/autocollect/data/class.php
/plus/autocollect/data/template.php
/plus/autocollect/fun_gen.php
/plus/autocollect/fun_image.php
/plus/autocollect/fun_comm.php

更新操作:
请v3用户在插件后台控制面板上,点 在线升级插件 ,根据提示操作,就可以完成升级。
如果已经在全局设置里面勾选【自动升级到最新的发行版】,则可以自动升级到此版本,不需要手工在线升级。

阅读全文..

更新日志:

v3.7,Build:2234,时间:2012-08-31

内容:
1.修正了一个在某些特殊情况下,运行中的插件会停止运行的逻辑问题。
2.增加了每个采集节点都可以使用单独的【SEO变量参数】的功能,从节点参数里面进去设置。如果不进行设置,默认使用的是全局【SEO变量设置】。
3.增加对软件模型的支持。(仅部分支持,因PHP采集效率问题,不支持将软件文件采集到本地,也就是只能盗链软件文件。)
4.改进了伪原创【打乱句子顺序】时,标点符号显示比较怪异的问题。
5.增加了【随机标题】的伪原创选项,开启时会从内容中随机取出一句作为标题。
6.修正了当图片网址中包括类似于8080等特殊端口时,不能正确匹配图片网址的逻辑问题。
7.修正了当【在线翻译】使用谷歌引擎时,有时不返回翻译结果的问题。

本次更新涉及的文件:
/plus/autocollect/data/class.php
/plus/autocollect/data/template.php
/plus/autocollect/fun_gen.php
/plus/autocollect/fun_image.php

更新操作:
请v3用户在插件后台控制面板上,点 在线升级插件 ,根据提示操作,就可以完成升级。
如果已经在全局设置里面勾选【自动升级到最新的发行版】,则可以自动升级到此版本,不需要手工在线升级。

阅读全文..

更新日志:

时间:2012-07-10

内容:
1.修正了【有道翻译】当使用【英文->简体中文】的一个逻辑问题,该问题可能会导致翻译结果不能正确返回。
2.将【在线翻译】安排到伪原创的第一步,改进了翻译后的文本不能正确的进行中文分词的问题。
3.给【SEO变量设置】和【全局设置】按钮各增加了一个【重置】功能,“重置”链接在该页面的右上角。
4.修改了【SEO变量】中【自定义正文头部、尾部和正文摘要】的使用方式,当此项目设置为空时,将不会进行自定义设置;以前的处理方式是当该项目为空,则使用系统默认值设置。
5.修正了一个当图片网址中存在空格等特殊字符时,将不能正确采集图片的问题。
6.修正了不能正确匹配优酷视频缩略图的问题。
7.修正了当使用在线翻译时,图片网址也可能会被翻译,从而导致图片不能正确显示的问题。
8.增加了自动优化和修复全部数据表的功能。

本次更新涉及的文件:
/plus/autocollect/data/class.php
/plus/autocollect/data/template.php
/plus/autocollect/fun_gen.php
/plus/autocollect/fun_image.php

更新操作:
请v3用户在插件后台控制面板上,点 在线升级插件 ,根据提示操作,就可以完成升级。
如果已经在全局设置里面勾选【自动升级到最新的发行版】,则可以自动升级到此版本,不需要手工在线升级。

阅读全文..

更新日志:

时间:2012-06-01

内容:
1.修正了一个当在节点参数中设置了【采集数量限制】,可能会造成无法正常入库的逻辑问题。
2.修正了一个当使用插件定义的【getLitPath】函数生成预览图时,可能会无法正常生成的逻辑问题。
3.修正了一个当网页正文中包含类似于【& #160;】等特殊字符时,可能会显示成乱码的问题。
4.针对某些服务器不支持【自触发】的问题,在全局设置中增加了一个【自触发】选项,默认是【启用】;如服务器不支持自触发则可以选择为【禁用】,【禁用】后可能会造成程序运行缓慢。
5.针对文章模型新增了一个【在线翻译】的功能,目前支持【有道】和【谷歌】两种翻译引擎,支持语言有:简体中文、英语、日语、法语、韩语互译,且有原文对照和完全替换两种显示方式,进节点伪原创方式即可看到此选项。
【有道】只支持简体中文与英、日、法、韩四种外语的双向转换,外语之间的相互转换(如:英->日)不支持;
另外GBK编码下很多外语(比如:韩语)会显示成乱码。为了兼容性考虑,建议使用UTF8编码的DEDE安装程序。
6.因百度模版调整,造成邮件报告中显示的【百度快照】日期混乱,现已修正。

本次更新涉及的文件:
/plus/autocollect/data/class.php
/plus/autocollect/data/template.php
/plus/autocollect/fun_gen.php
/plus/autocollect/fun_image.php

更新操作:
请v3用户在插件后台控制面板上,点 在线升级插件 ,根据提示操作,就可以完成升级。
如果已经在全局设置里面勾选【自动升级到最新的发行版】,则可以自动升级到此版本,不需要手工在线升级。

阅读全文..

更新日志:

时间:2012-04-20

内容:
1.通过改进底层数据读取机制,彻底解决插件控制面板可能会出现的“白板”问题。
2.修改了文章栏目列表页分页的生成机制,从以前的会生成所有分页(当分页过多时会造成生成超时),修改成最多只生成前50个分页。
3.根据用户建议,给文章内容增加了一个【文章分页】的选项。该项目有3个选项,分别是:保持原始分页、去掉分页和自动分页。
4.修正了一个在采集规则中自定义【缩略图匹配规则】时,可能不能正确匹配的逻辑问题。
5.修正了一个当节点参数中【导入顺序】不是随机导入时,导入顺序可能会出现错误的逻辑问题。
6.修正了一个在GBK编码下,插件控制面板【运行信息】页面的信息可能不能正常刷新的问题。

本次更新涉及的文件:
/plus/autocollect/data/class.php
/plus/autocollect/data/template.php
/plus/autocollect/fun_gen.php
/plus/autocollect/fun_image.php

更新操作:
请v3用户在插件后台控制面板上,点 在线升级插件 ,根据提示操作,就可以完成升级。
如果已经在全局设置里面勾选【自动升级到最新的发行版】,则可以自动升级到此版本,不需要手工在线升级。

阅读全文..