今天记录一下 帝国cms网站计划任务自动采集功能(支持自动入库)如何使用,图文教程。文章中不少细节和参考点,希望大家在阅读的过程中参考。
另外再次声明,本站不出售插件,仅做笔记和使用教程,如果有需要,请前往懒鸟飞官方购买。

安装步骤
- 上传autocj.php到 e/admin目录 目录不要改动(如果非要改 需要修改下里面的require的文件地址)
- 打开autocj.php 设置一下 密钥
- 去宝塔里配置好计划任务 选择链接访问
- 地址写 你的网址/e/admin/autocj.php?mm=密钥&classid=采集任务ID
- 采集任务ID可以在后台 栏目-采集管理-管理采集节点-预览 查看网址里的classid=后面就是采集任务id
https://www.abc.com/e/admin/autocj.php?mm=随机密码&classid=采集任务ID //链接示范

注意事项
作者使用过程中的一些心得:如果一次性采集太多 一定要把php超时改高 要不然可能采集超时!
- 手动采集一条规则,完整一页资源,采集了5分半钟。
- 手动点击执行定时任务后,日志不会马上更新,大约5分钟后,再看日志,就会显示采集列表完成。
- 但日志显示成功,并不一定是采集入库完成,最好再多等会。
- 等了半天,发现不会入库。然后又点击了执行采集,过了会,发现同一个规则又采集了几篇文章,然后我检查资源站,并没有完全采集完这一页。
- 也就是说采集的时候超时卡住了。没有采集完全成功。所以没有入库。
- 之后我每个一段时间,就采集一下,连续执行了5次,才把一个页面的文章都采集并自动入库完成。
- 发现问题,之前手动在帝国后台采集一页数据,需要5分钟。
- 但宝塔面板定时任务执行时,一般执行2分钟左右,这是因为宝塔面板php设置超时时间100秒,也就是php程序执行超过100秒就被强行关闭了。
- 我改成1000秒,也就是16分钟,之后测试,还是一样的问题。之后查资料,发现还要修改php配置中“脚本内存限制”改成了1GB,然后再测试,就成功采集。
- 查看日志,日志会限制入库成功的时间,基本上也是5分钟。
所以PHP设置方面,请根据需求,下图是我的设置,大家可以参考。


原创文章,作者:iMJX,如若转载,请注明出处:https://www.imjx.com/6183.html
TG:@erbao857
赞助作者TRX
赞助作者ETH