1 Star 0 Fork 5

mirrornode / Invoice2Excel

forked from yczha / Invoice2Excel 
Create your Gitee Account
Explore and code with more than 6 million developers,Free private repositories !:)
Sign up
Clone or Download
Cancel
Notice: Creating folder will generate an empty file .keep, because not support in Git
Loading...
README.md

Invoice2Excel

摘要:这篇文章介绍如何把发票内容提取出来保存到Excel中。


程序功能

程序会把发票中的内容提取出来然后写入Excel中,一个示例的发票内容如下:

发票示例

提取结果如下:

提取结果

下载windows桌面客户端:https://www.yooongchun.cn/apps

程序使用

  • 下载代码

    git clone https://gitee.com/yczha/Invoice2Excel.git
  • 安装依赖包:

    python -m pip install -r requirements.txt
  • 准备数据

    准备好PDF文件,放置到一个目录下

  • 运行程序

     # 注意:这里data指你的pdf文件放置的文件夹,参考example文件夹的结构 -p data也可以替换为--path=data
    python Invoice2Excel.py --path=data

更多

  • 运行测试,可以通过以下命令运行测试

    python Invoice2Excel.py
  • debug模式:会显示example/test.pdf文件的抽取情况,可视化展示

python Invoice2Excel.py --debug

结果如下:

线段补全

拆解单元格

单词放入单元格

  • 指定输出文件位置

    # 注意:这里data.xlsx指你的pdf结果保存文件, -s data.xlsx也可以替换为--save=data.xlsx
    python Invoice2Excel.py -s data.xlsx
    # 也可以同时指定两个参数
    python Invoice2Excel.py -s data.xlsx -path=data

获取帮助

联系作者获取帮助:

Repository Comments ( 0 )

Sign in for post a comment

About

提取PDF电子发票内容内容保存到Excel expand collapse
Python
MIT
Cancel

Releases

No release

Contributors

All

Activities

Load More
can not load any more
Python
1
https://toscode.gitee.com/mirrornode/Invoice2Excel.git
git@toscode.gitee.com:mirrornode/Invoice2Excel.git
mirrornode
Invoice2Excel
Invoice2Excel
master

Search

141041 ab9339c7 1850385 141043 25c028d5 1850385