代码拉取完成,页面将自动刷新
我是初学者,不怎么懂,最近再选择爬虫的技术路线。感觉这个比webharvest还难用,几乎没有资料。研习了一周,还是算了,感觉采用这个风险比较大。
嗯,是有一定门槛,都是走源码+sample的方式了。可以的话,建议列一下哪些地方没有搞懂。
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。
有完整的例子吗?我看了几个配置例子,都不同,估计有早期版本,有现在的。
代码不清晰,不知道自己再干嘛。代码很简洁,本来这是好事情,比如:
final String xml = "tianyancha.xml";
final Config conf = new XMLConfBuilder(xml).build();// 通过XMLBuilder构建CONF对象
new Spiderman(conf).go();
我的理解,控制都是通过配置文件做的,可是配置文件也没有说清楚。
状态更改为 已关闭
登录 后才可以发表评论