4 Star 9 Fork 9

山东小木 / jfinal_jsoup_meinvtu

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

去年,做了几个JFinal项目,大量使用了Java爬虫去全网抓取数据,清洗筛选后入库,成为本地结构化数据。

Java中JSOUP做HTML解析是最好的工具,没有之一。

之前听过一句话,大体意思就是

我们所能访问的网页本身就是一个数据宝藏,天然的对外数据接口。

只要我们能拿到网页的Html代码,就可以拿到网站的公开数据。

利用JSoup针对直接加载显示数据的网页,也可以轻松拿到Html代码,后面的操作类似JQuery的API,有这类似的DOM操作形式。

还可以扩展爬虫的能力,分布式,多线程,异步,定时任务执行,总之,了解和核心使用方法,剩下的都是怎么玩儿的事儿了!

项目视频演示地址:

https://www.bilibili.com/video/av54760586

项目截图:

1、首页

首页

2、启动爬虫,雷达扫描

雷达扫描

3、添加明星

添加

4、相册主页

相册

5、相册里的照片

照片列表

6、幻灯片播放

幻灯片播放

7、大图单页

大图单页

代码使用技术 JFinal

JFinal Undertow

Bootstrap

JQuery

Layer

JSoup

Mysql

Jbolt

更多资源请关注公众号:

关注公众号

空文件

简介

JFinal+JSoup开发的爬虫案例—抓美女 展开 收起
Java
取消

发行版

暂无发行版

贡献者

全部

近期动态

加载更多
不能加载更多了
Java
1
https://gitee.com/909854136/jfinal_jsoup_meinvtu.git
git@gitee.com:909854136/jfinal_jsoup_meinvtu.git
909854136
jfinal_jsoup_meinvtu
jfinal_jsoup_meinvtu
master

搜索帮助