目前,DEDE自动采集插件 已经 更新到了V2.4 ,插件的采集能力也从以前的每天不到1000,提高到现在的每天4000+。

但是这个提高到4000+是有前提的:

首先,你必须要有足够多的内容供插件采集。
如果你的采集目标站点每天才更新几篇或者几十篇,那么就算你加几十个这样的采集节点,满打满算可能更新的文章也不到1000个,地主家也没有余粮啊。
给大家提供几个测试链接,更新超快,都是几分钟一篇的。
http://ent.qq.com/3jym/scroll.htm 腾讯娱乐滚动新闻
http://finance.ce.cn/rolling/ 中国经济网财经滚动新闻
http://news.china.com.cn/rollnews/index.html 中华网滚动新闻

其次,文章里面的图片不能太多,大概每10篇文章里面有2、3个图。如果图片太多,插件就把时间都浪费在下载图片上面,自然没法达成4000+的目标了。

最后,你要在设置文件[ /plus/autocollect.php ]里面进行正确的设置:
$coIntervalTime=60;
这个是采集进程间隔时间,在上次采集进程以后,至少间隔多少秒才能再次启动采集进程。这个还是保持默认60秒不变。

$addArchivesTime=0;
这是入库文章的最少间隔时间,单位为秒。如果你想测试采集能力,可以把这里修改为0,也就是不限制。一般建议为180秒。

$maxAddArchives=0;
这个是最重要的,这是每天最多可以入库多少文章。挑战极限采集能力,你应该把它修改为0,这样才是不限制每天入库数量。新站建议为200篇

$maketime = 300;
这是主页及栏目列表页创建间隔时间,单位秒。文章多了以后,创建栏目时要花费相当多的时间,建议设置为300秒,甚至更长的时间比如600秒。

需要说明的是,采集能力的提高是需要增加系统资源(包括CPU和内存等)消耗的
内存占用峰值最高可能达到120M,CPU占用率峰值可能超过50%。
如果是合租的虚拟主机,资源限制严格的时候,就不适合将采集能力提高到这么多,点这里查看: 如何精心设置配置文件,限制服务器资源占用

但对于VPS或者独立的服务器来说,这个就不是问题了。