DEDE全自动采集插件

DedeCms织梦内容管理系统自动采集、伪原创、发布、更新一体化插件

正在浏览标签为 DEDE全自动采集 的文章

第二版自动采集插件安装 完成以后,需要进行一定的设置才能正常使用。

插件设置:
首先,还是需要先在DEDE后台设置好采集规则。

DEDE的采集规则是没有对应栏目的,采集的文章内容还不知道能放到哪里去。所以我们需要设置好采集规则和网站栏目ID的一一对应关系,具体设置在 /plus/autocollect.php 件里面。

对应关系有两种写法:
$coNodes[20]=58; //采集节点ID在前,网站栏目ID在后,如采集节点为5,栏目ID为6,那么这里就是$coNodes[5]=6;
$coNodes[21]=70; //有多少个采集规则,这里就写多少条对应关系
注释说的很清楚了,采集节点ID在前,网站栏目ID在后,如采集节点为5,栏目ID为6,那么这一行应该这么写:
$coNodes[5]=6;

这是第一种写法,第二种写法用来改变默认的采集选项
$coNodes[76]=array(24,0,1,0);
等号后面是一个数组,这个数组有4个元素,第一个元素是栏目ID,这里是24
第二个元素是媒体采集选项,0[(默认)2采集该媒体到本地,1不采集使用原始媒体链接,0不采集去掉媒体]
第三个元素1[1检查百度收录,(默认)0不检查]
第四个元素0[0不使用伪原创,(默认)1正文中的关键字替换伪原创,2打乱句子排列顺序(会强制去掉图片等),4标题中的关键字替换伪原创
可以组合使用比如同时想要替换正文和标题中的关键字来进行伪原创,那么这里就是1+4=5]

如果某个采集节点为25,对应的栏目ID为3,需要采集图片到本地,不检查百度收录,使用正文和标题关键字替换,那么对应关系要这么写:
$coNodes[25]=array(3,2,0,5);

有几条采集规则,就需要写几行对应关系。

$maketime选项,是设置重新生成主页的间隔时间(单位秒),一般保持默认就可以。当然,你也可以根据自己的实际需要设置成相应的整数。
$maketime = 60; //主页及栏目列表页创建间隔时间,单位秒

$locktime选项,是设置采集线程锁定时间。第二版插件设置了线程锁机制,同一时间只允许一个采集线程。
$locktime=300; //采集线程锁定时间,如果采集线程出错,多少秒以后允许再次采集

这两个设置保持默认就可以了。

$maxAddArchives=0; //每天最多可以入库多少文章,为0不限制,建议200。如开启此选项,入库到达上限以后网页还是照样采集,但要等到第二天才入库。
$addArchivesTime=0; //入库文章的最少间隔时间,单位秒,为0不限制,建议600。如开启此选项,每次入库以后必须等待一定的时间才能再次入库。这个选项用来限制采集文章入库的速度。

插件使用:

插件安装好以后,到DEDECMS后台管理 -> 模板 -> 默认模板管理 -> 修改footer.htm ,在最后面加上以下(橙黄色字体)内容:

<script language=”javascript”>
document.write(“<img src=’http://www.xxx.com/plus/autocollect.php?”+Math.random()+”‘ border=’0′ style=’display:none’>”);
</script>

这里的www.xxx.com替换成你的网站域名。
设置好以后手工生成一遍首页,以后每当有人访问你的网站首页时,本采集插件就会自动运行。

手工调试:
在浏览器地址栏输入 http://你的域名/plus/autocollect.php?act=show 就可以手工调试并查看采集程序运行情况。

日志:
/plus/autocollect/log 下面有一些类似于 2010-06-23.log 的文件,就是插件自动运行时生成的日志。

阅读全文..

DEDE全自动采集插件第二版 正式发布,以下是它的安装方法.

插件安装:

首先解压缩插件安装包并上传到网站根目录,然后到DEDECMS后台管理 -> 模块 -> 模块生成向导,填写以下(橙黄色字体)内容:

阅读全文..