1. 前端使用纯HTML、JS和JSON,后端使用Python生成标准JSON格式数据,支持链接统计以外的采集。
  2. 内置30个常用网站采集规则。
  3. 支持多线程抓取,采集30+个网站仅需5秒内完成。
  4. 相同网站的内容可放在一个框架内,可实现局部刷新和滚动。
  5. 采集时间显示,按照采集页面自带更新时间或按时间排序的第一条时间采集,并提供采集完成时间显示。
  6. 内容链接可通过base64编码、字符逆序、大小写反转等方式实现加密,从而防止链接盗链。
  7. 提供内容链接点击统计功能。
  8. 部分内容提供鼠标悬停提示,如ap。

安装:

  1. 运行python3 caiji.py采集程序(如需保持后台运行,请使用screen或nohup命令);
  2. 打开首页访问。

注:caiji.py为后端采集程序,其余文件为前端文件,应该保存在同一目录下。其他设置和修改请参考源代码中的注释。

admin.php为第三方数据库管理程序,用于查看内容链接统计(默认密码为admin,请务必在文件中修改)。

点击统计数据库log.db会在首次访问内容链接时生成,如未建立请保证主目录可写。

为了安全起见,建议将后端程序caiji.py和数据库查看程序admin.php改为复杂文件名或者移动到非web目录下(需同时修改文件内的生成JSON保存目录为网站根目录,默认为当前目录)。

默认使用多线程抓取,如有问题请改用单线程。今

日头条的采集请更换为自己的cookie,因为头条短时间采集内容相同的太多,相同cookie分段采集后几乎不会有重复的数据;但采集一段时间后推荐的都是杂七杂八无关的垃圾内容,请定期更换cookie或自行加入随机的头条cookie生成规则。

采集站的logo大部分已修改为透明图层png,在非白色背景下可能会很难看。

1 89 - 免费|一站式聚合全网最新最热榜单及热门内容的系统源码免费下载

免费下载地址:

资源下载
下载价格免费
原文链接:https://www.jocat.cn/archives/76688,转载请注明出处。
0
显示验证码
没有账号?注册  忘记密码?