1 Star 4 Fork 0

shenl / SinMH 2.0 Guide

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
collect.md 3.03 KB
一键复制 编辑 原始数据 按行查看 历史
shenl 提交于 2017-03-18 10:35 . 新增采集功能提示

采集功能说明

采集功能仅供同步已取得版权的漫画,若采集到未取得版权的漫画,请立即删除该漫画,否则请自行承担由此引发的一切法律后果。

功能按钮(右侧)

  • 更新采集规则:此功能将授权的采集规则更新到最新
  • 开启采集任务:后台采集任务控制开关,只有开启后,后台任务才能运行,此按钮仅为开关控制,若未按照相关说明配置后台任务,此开关无效
  • 关闭采集任务:后台采集任务控制开关,关闭此项后,后台任务停止采集,注意:此开关对java下载无效!

列表采集

列表采集是指按照被采集站的漫画列表进行采集;

列表采集表单字段默认含义说明:

  • 站点:选择被采集站点
  • 起始页:要采集的列表起始页码(若不填则起始页为1)并非漫画ID
  • 结束页:要采集的列表结束页码(若不填则结束页为起始页码)并非漫画ID
  • Start:添加采集任务按钮

特别注意:以上为通用采集流程,部分站点列表采集表单字段含义有变化,请详细阅读对应站点采集说明

示例: 站点:爱看漫(ikanman.com), 起始页:1, 结束页:2; 生成列表地址: http://www.ikanman.com/list/update_p1.html http://www.ikanman.com/list/update_p2.html

采集参数配置

采集的参数配置位于:common/config/param-local.php下的collect部分 具体使用详见注释说明; java采集配置参数说明位于java可运行文件所在目录的README.md

漫画采集

漫画采集是指按照单个漫画进行采集

漫画采集表单字段默认含义说明:

  • 漫画链接:漫画的详情介绍页面链接
  • Start:添加漫画采集任务按钮

特别注意:大部分漫画链接为漫画的详情介绍页面的浏览器地址栏显示的链接,但是部分站点的链接并非如此,,请详细阅读对应站点采集说明

爱看漫(ikanman.com)采集说明

本站采集模式与默认模式一致,需要特别注意的是需要开启 PHP 的 mcrypt 扩展!

可米酷漫画【定制】采集说明(comicool.cn)

  • 列表采集说明:

    本站列表采集与默认方式不同,每个提交仅生成一个列表;列表内容为从指定漫画ID向后指定数量的漫画列表。

    • 起始页:起始漫画ID
    • 结束页:列表页包含漫画数量

    示例:起始页:100, 结束页:20; 生成列表地址:http://proxy.icomico.com/allcomic4h5?callback=jsonp_allcomic&comic_id=100&page_size=20

  • 漫画采集说明: 本站漫画链接并非浏览器地址栏链接,具体链接格式为 http://proxy.icomico.com/comicdetail4web?callback=jsonp_comicdetail&comic_id={comicId}&device_id=a0571cefb98400d4a1518df1f72f2498&_=1474181139196

    请将{comicId}替换为需要采集的漫画ID;

    特别说明: 由于本站漫画链接较为复杂,故不建议进行漫画采集,推荐使用列表采集

HTML
1
https://gitee.com/shenl/SinMH-2.0-Guide.git
git@gitee.com:shenl/SinMH-2.0-Guide.git
shenl
SinMH-2.0-Guide
SinMH 2.0 Guide
master

搜索帮助