Sign in
Sign up
Explore
Enterprise
Education
Search
Help
Terms of use
About Us
Explore
Enterprise
Education
Blog
Sign in
Sign up
Categories
Development Tools
Version Management System
Dev/Debug
Wiki/Document Took
Compile/Build/Deploy
Maven Plugin
IDEA Plugin
Gulp Extension
Testing Tool
Code Scan
Web Development
Web Framework
jQuery Plugin
UI Framework
JavaScript Toolkit
RESTful Projects
Backend Management
Website Theme
Vue.js Components
Web Sipder
OAuth/SSO
Angular Plguin
Bootstrap Plugin
React Compnent
RPC Development Framework
API Gateway
短网址
Mobile Development
Android Component/ Project
Mobile App
iOS Component
Alipay Applet
PhoneGap/Cordova Plugin
Cross-platform Mobile Development
Baidu Applet
QuickApp
harmony
TV Devel
Development Lib
Chinese/English Segmenter
Payment Dev
Security Dev
Common Toolkit
Excel Toolkit
Barcode/QRCode
Template Engine
Desktop UI Component/Framework
Network Development Package
Audio Process
Network Tool
Network Service
Data Mining
Job/Task Scheduling
Programming Language/Scripting Language
Cache Component
Markdown Tools
Search Engine
Microservice
Workflow
Chart/Diagram Component
Authority Management
Reporting Tool
Code Generator
IoC/AOP Framework
Image Library
Rule Engine
JSON Toolkit
Log Toolkit
Spring Boot Extension
Verification Code
Algorithm/Mathematical Calculation
Node Extension
Process Engine
Animation Development
3G/4G/5G
Web System
Content Management System
New-Sale/E-Shop
BBS
Blog
Questionnaire/Form System
SNS
Teaching Managment
Album/Gallery/Picture
RSS/Atom Tool
Enterprise App
Task/Project Management
Enterprise Application System
Business Intelligence
Financial/Stock Securities
GIS/Map/Navigation/Positioning
Server Development
Distributed Service/Framework
Message Server/Message Queue
Docker
Container/Virtual Machine
Nginx Module
Big Data
Cloud Computing
One-click Installation Package
OpenResty Extension
系统性能优化
Serverless
Application
File Management System
Multimedia
Text Editor
Instant Messaging
Application Software
Visual Studio Code Plugin
DevOps/Network
DevOps
Network Management Tool
System Monitor
Game/Recreation
Game
Game Development
3D Engine
Database Related
DB Development Package
Database Service
Database Management/Monitor
Plugins/Extension
Chrome Extension
Wordpress Plugin
Eclipse Plugin
Firefox Extension
Safari Extension
Jenkins Plugins
Other
Simulation Project
Handbook/Manual/Tutorial
ACM/OJ Project
Operation System
Tutorial Code
Teaching Managment
RISC-V Development
Bio/Medical
2020公益黑客马拉松
新冠病毒相关开源
AI/ML
Artificial Intelligence
VR/AR
Machine Learning/Deep Learning
Computer Vision/Face Recognition
Natural Language Processing
Blockchain
bitcoin
Wechat Projects
Wechat Development Package
WeChat Applet/Game
WeChat Application
WeChat Game
New Tech
Hardware
IoT/Edge Computing
Car Application
Smart Home
Autopilot
Robots
5G
低代码
Web Development
/
Web Sipder
GPL-3.0
All
MulanPSL-2.0
0BSD
AFL-3.0
AGPL-3.0
Apache-2.0
Artistic-2.0
BSD-2-Clause
BSD-3-Clause
BSD-3-Clause-Clear
BSL-1.0
CC-BY-4.0
CC-BY-SA-4.0
CC0-1.0
ECL-2.0
EPL-1.0
EPL-2.0
EUPL-1.1
EUPL-1.2
GPL-2.0
ISC
LGPL-2.1
LGPL-3.0
LPPL-1.3c
MIT
MPL-2.0
MS-PL
MS-RL
MulanPSL-1.0
MulanPubL-1.0
NCSA
OFL-1.1
OSL-3.0
PostgreSQL
UPL-1.0
Unlicense
WTFPL
Zlib
All Languages
Java
JavaScript
PHP
Python
C#
Android
Objective-C
Go
C++
HTML
C
NodeJS
Swift
其他
TypeScript
微信
HTML/CSS
Ruby
Shell
Dart
CSS
C/C++
Kotlin
Docker
Lua
Scala
Matlab
Delphi
SQL
Rust
TeX/LaTeX
Visual Basic
Verilog
ASP
R
Groovy
ActionScript
Erlang
易语言
XML
VimL
Arduino
Perl
Assembly
FORTRAN
QML
PowerShell
Pascal
汇编
Clojure
Emacs Lisp
CoffeeScript
AutoHotkey
Julia
VHDL
Haskell
M
Elixir
Lisp
D
Scheme
XSLT
Common Lisp
Racket
Vala
Logos
OCaml
DOT
Coq
Haxe
Puppet
LiveScript
Smalltalk
Prolog
Nemerle
Eiffel
Standard ML
Ada
eC
Scilab
Crystal
Pawn
Awk
Slash
Zephir
ColdFusion
Stars
Stars
Recommend
Last updated
许雪里/xxl-crawler
Java
Web Sipder
GPL-3.0
273
一个分布式爬虫框架。一行代码开发一个分布式爬虫,拥有"多线程、异步、IP动态代理、分布式、JS渲染"等特性;
over 2 years ago
1 issue
CrawlScript/WebCollector
Java
Web Sipder
GPL-3.0
213
A java crawler for infomation collection.
over 2 years ago
2 issues
Ticsmyc/2019nCoV-Crawler
Java
Web Sipder
新冠病毒相关开源
GPL-3.0
136
爬冠状病毒新型肺炎疫情实时数据+数据持久化+邮件通知
11 months ago
gsh199449/Gather Platform
Java
Web Sipder
GPL-3.0
56
A configurable web spider with a easy-to-use WebUI interface
almost 4 years ago
1 issue
terrydash/avmoo_spider_by_dotnetspider
C#
Web Sipder
GPL-3.0
54
一个基于dotnetspider的爬取大姐姐的爬虫
4 years ago
fffonion/xeHentai
Python
Web Sipder
GPL-3.0
54
绅士站爬虫 镜像自 https://github.com/fffonion/xeHentai
11 months ago
达达软件/AndroidCrawler
Android
Web Sipder
GPL-3.0
51
Android上的一款采集框架, 采用Retrofit + OkHttp + Rxjava + Eventbus + Greendao + Jsoup + Meterial Design, 参考webmagic爬虫框架并用rxjava制作了自定义的采集框架。
almost 4 years ago
测试版本1
updated on
Apr 07
qchats/GetZPInfo
Python
Web Sipder
GPL-3.0
25
招聘信息抓取工具 GetZPInfo 这是一个爬虫软件,用来抓取某人力资源网站的招聘信息,并转发到本地串口连接的LED条型屏上显示。
over 7 years ago
fffonion/JJGet
C#
Web Sipder
GPL-3.0
16
晋江小说下载器
over 1 year ago
v1.2.2
updated on
Aug 10
1 issue
Admin/抖音蓝V企业认证_商家数据采集_抖音爬虫
Web Sipder
GPL-3.0
2
抖音爬虫:分析并记录带有联系方式的商家主页
6 months ago
一笑倾城/网络爬虫
Java
Web Sipder
GPL-3.0
0
2 years ago
Trending Today
Weekly
AJay13/ECommerceCrawlers
1.7K
实战多种网站、电商数据爬虫。包含:淘宝商品、微信公众号、大众点评、招聘网站、闲鱼、阿里任务、scrapy博客园、微博、百度贴吧、豆瓣电影、包图网、全景网、豆瓣音乐、某省药监局、搜狐新闻、机器学习文本采集、fofa资产采集、汽车之家、国家统计局、百度关键词收录数、蜘蛛泛目录、今日头条、豆瓣影评️️️。微信爬虫展示项目:
ssssssss-team/spider-flow
2.8K
新一代爬虫平台,以图形化方式定义爬虫流程,不写代码即可完成爬虫。
芦荟柚子茶/Csharp爬取音乐源码
71
基于.NET的音乐搜索与播放软件(编程语言:C#,爬取4个平台:酷我/网易云/酷狗/QQ) 基本思路: 1、模拟搜索:通过关键字,获取歌曲列表 2、获取歌曲关键信息(歌曲ID之类的唯一标识) 3、使用指定方法(某个url),根据歌曲ID获取歌曲播放地址 4、将歌曲下载到本地,实现下载或播放 限制:vip音乐大多没法爬取(酷我除外),而且为试听品质 代码内容相对较少,代码编写规范,个人认为是很好的入门project
crawlab-team/crawlab
43
Distributed web crawler admin platform for spiders management regardless of languages and frameworks.
Cherokee/neocrawler
502
牛咖-neocrawler nodejs 的爬虫系统。 特点: 支持web界面方式的摘取规则配置(css selector & regex); 包含无界面的浏览器引擎(phantomjs),支持js产生内容的抓取; 用http代理路由的方式防止抓取并发量过大的情况下被对方屏蔽; nodejs none-block 异步环境下的抓取性能比较高; 中央调度器负责网址的调度(同一时间片内一定数量的抓取任务中根据网站的权重来决定派发任务量; 支持多种抓取实例并存,定制摘取引擎和存储方式。
zorlan/蓝天采集器
402
蓝天采集器是一款免费的数据采集发布爬虫软件,采用php+mysql开发,可部署在云服务器,几乎能采集所有类型的网页,无缝对接各类CMS建站程序,免登录实时发布数据,全自动无需人工干预!是大数据、云时代网站数据自动化采集的最佳云端爬虫软件
AJay13/ECommerceCrawlers
1.7K
实战多种网站、电商数据爬虫。包含:淘宝商品、微信公众号、大众点评、招聘网站、闲鱼、阿里任务、scrapy博客园、微博、百度贴吧、豆瓣电影、包图网、全景网、豆瓣音乐、某省药监局、搜狐新闻、机器学习文本采集、fofa资产采集、汽车之家、国家统计局、百度关键词收录数、蜘蛛泛目录、今日头条、豆瓣影评️️️。微信爬虫展示项目:
ssssssss-team/spider-flow
2.8K
新一代爬虫平台,以图形化方式定义爬虫流程,不写代码即可完成爬虫。
朱平齐/RuiJi.Net
97
RuiJi.Net是一个.net分布式抓取、提取框架。支持分布式下载,分布式提取及cookie自管理。RuiJi.Net可以通过轮询使用服务器上IP地址和代理服务器的形式进行抓取操作
takemefly/golddata-spider
69
1、规则简洁灵活易读易写 2、可反复采集数据而不产生重复 3、可同时将数据及数据关系采集融合 4、支持ajax 5、文档和培训视频齐全 。其核心代码从GoldData平台分离而来
crawlab-team/crawlab
43
Distributed web crawler admin platform for spiders management regardless of languages and frameworks.
ecitlm/Node-SpliderApi
325
基于nodejs 的爬虫 API接口项目,包括前端开发日报、知乎日报、前端top框架排行、妹纸福利、搞笑视频、各类视频新闻资讯 热点详情接口数据
xiaominger/StockCrawler
9
股票数据采集器
zorlan/蓝天采集器
402
蓝天采集器是一款免费的数据采集发布爬虫软件,采用php+mysql开发,可部署在云服务器,几乎能采集所有类型的网页,无缝对接各类CMS建站程序,免登录实时发布数据,全自动无需人工干预!是大数据、云时代网站数据自动化采集的最佳云端爬虫软件
calvinwilliams/simspider
106
C语言接口的网络爬虫函数库
Going to Help Center
Search
Git 命令在线学习
如何在 Gitee 导入 GitHub 仓库
Git 仓库基础操作
企业版和社区版功能对比
SSH 公钥设置
如何处理代码冲突
仓库体积过大,如何减小?
如何找回被删除的仓库数据
Gitee 产品配额说明
GitHub仓库快速导入Gitee及同步更新
什么是 Release(发行版)
See more results
Share to
Back to the top