代码拉取完成,页面将自动刷新
基于 puppeteer 的中国行政区域抓取爬虫
git clone git@github.com:dwqs/area-puppeteer.git
npm i
npm start // 生成市县区数据
npm run format // 格式化数据
生成的数据包含两份:cities.js
和 areas.js
,前者是市级数据,后者是县区数据
格式化后会生成两份数据:pca.js
和 pcaa.js
,前者仅省市数据,后者包含省市区数据
import Data from 'path/to/pcaa';
Data['86']
// 所有省份:{'110000': '北京市', '120000': '天津市', '130000': '河北省', ...}
Data['130000']
// 对应省份的所有城市:{'130100': '石家庄市', '130200': '唐山市', '130300': '秦皇岛市', ...}
Data['130200']
// 对应市的所有县区:{'130201': '市辖区', '130202': '路南区', '130203': '路北区', ...}
This repo is released under the WTFPL – Do What the Fuck You Want to Public License.
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。