9 Star 74 Fork 28

包建强 / FastOCRLabel

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README
MulanPSL-2.0

PaddleOCRLabel

介绍

PaddleOCRLabel是基于百度飞桨(PaddleOCR)开发的一款半自动标注平台。

快速体验

本项目提供了不需要任何编译工作就可以直接运行的方法。 解压缩根目录下的PaddleOCRLabel-Release-1.0.zip,运行其中的exe文件,可以直接使用。 此时,该exe程序使用的PaddleOCR服务,是作者搭建在一台云服务器上的服务,地址是http://1.117.249.116:5000。

开发所需的先决条件

  1. Windows 10系统
  2. Visual Studio 2017
  3. Python3.7

单独运行(不开发)所需的先决条件

  1. Windows 10系统
  2. .NET 4.x
  3. Python3.7

安装教程

1.  运行python_rest

python_rest是一个使用Python Flask编写的Rest服务,调用paddleocr库,获取扫描识别后的文字。(python_rest所用到的Python第三方库请自行安装)

运行命令: cd python_rest python rest.py

python_rest服务可以运行在本机,默认会在本机启动一个http://127.0.0.1:5000的服务。

python_rest服务也可以运行在另一台linux服务器上。点击COR自动标注软件的菜单“设置”->“设置代理”中,把代理服务器的地址,配置为linux服务器的ip和端口即可。

2.  运行paddle_ocrlabel项目

使用Visual Studio 2017打开paddle_ocrlabel目录下的paddle_ocrlabel.sln即可。

3.  不使用Visual Studio 2017,直接运行paddle_ocrlabel

解压缩PaddleOCRLabel-Release-1.0.zip,运行paddle_ocrlabel.exe即可

python_rest服务列表

python_rest目前支持三个服务:

  1. http://127.0.0.1:5000/detect

    [POST]输入参数为图片本地的路径,只返回检测区域

  2. http://127.0.0.1:5000/recognition

    [POST]输入参数为图片本地的路径,返回检测区域和识别文本

  3. http://127.0.0.1:5000/regregion

    [POST]输入参数为图片本地的路径和局部区域的坐标,返回这个局部区域的识别文本

使用说明

  1. 点击软件左上角的“打开目录”按钮,打开要标注的图片所在的目录。

  2. 点击软件左下角的某张图片,点击“单张标注按钮”,对该图片进行标注。

  3. 点击软件左上角的“全部标注按钮”,对该目录下的所有图片进行标注。

  4. 点击标注按钮后,获取到的标注区域,会显示在图片上为蓝色边框的矩形框,并自动保存在本地。

  5. 软件中间的标注区域,虚线为安全区域分界线,手动标注只能在安全区域内进行。

  6. 对服务返回的标注结果不满意?可以手动标注,包括以下几个步骤:

6.1) 点击软件右上角的“启动矩形标注”按钮,然后就可以在软件中间的标注区域,用鼠标圈选区域了。新选的区域的边框为橙色。同时,会在软件左下角的标注区域的列表中新增一个条目,显示新增标注区域的坐标。

6.2) 点击软件右上角的“重新识别选中区域”按钮,会调用python_rest服务,返回该区域的文字,显示在软件左下角的标注区域的列表中。

6.3)软件也支持四点标注功能,点击“启动四点标注”按钮,先后在图片上点击四个点,就显示出一个橙色区域,然后点击“重新识别选中区域”按钮,识别橙色区域中的文字。

<img src="./images/a4.png" width="300">   
  1. 对于返回的识别区域的坐标和文字,显示在软件左下角的标注区域的列表中。有两种排序方式,一种是通用的横排版书籍(自上而下,从左到右),另一种是竖排版的古籍(从右到左,自上而下),可以灵活切换。

  2. 对于手动标注和重新识别文字的结果,可以保存至本地,点击软件右上角的“保存标注”按钮即可,也可以使用快捷键Ctrl+S。

  3. 手动标注过程中,支持回滚操作,点击软件右上角的“撤销标注”按钮即可,也可以使用快捷键Ctrl+Z。回滚支持以下操作:

    9.1)新增矩形标注

    9.2)新增四点标注

    9.3)删除标注

    9.4)移动标注位置

    9.5)重新ocr识别后改变文本内容

    9.6)手动修改文本内容

  4. 软件左上角的的单选框,默认选中“只检测文字区域”,这样python_rest服务只返回检测到的区域的坐标,而不进行文字识别,这样很快就能返回结果。如果选择“检测区域,并识别文字”,则python_rest服务不光返回区域的坐标,还会返回识别的文字,接口速度要比前面的慢一些。

  5. 标注区域支持选中和移动功能。用鼠标选中某个标注区域,该区域的边框会变为红色,可以使用鼠标移动到另一个区域。

  6. 点击标注区域,可以看到标注的四角都有一个小矩形框,拖拽小矩形框,可以改变标注区域的形状。

  7. 标注区域支持删除功能,用鼠标选中某个标注区域,按删除键即可删除之。

  8. 双击右下角的标注列表的某个节点,会弹出修改标注内容的对话框。

  9. 软件左边的“到处该目录下所有标注”,可以把该目录下所有图片的标注内容,导出为一个log格式的文件,以供PaddleOCR训练时作为训练数据使用。

待完善的功能点

  1. 图片的放大和缩小
  2. python_rest服务支持多线程
  3. 移动标注区域时,会把标注区域移动到安全区域之外。

参与贡献

  1. 希望小伙伴们加入到paddle_ocrlabel标注平台的开发和建设中。
木兰宽松许可证, 第2版 木兰宽松许可证, 第2版 2020年1月 http://license.coscl.org.cn/MulanPSL2 您对“软件”的复制、使用、修改及分发受木兰宽松许可证,第2版(“本许可证”)的如下条款的约束: 0. 定义 “软件”是指由“贡献”构成的许可在“本许可证”下的程序和相关文档的集合。 “贡献”是指由任一“贡献者”许可在“本许可证”下的受版权法保护的作品。 “贡献者”是指将受版权法保护的作品许可在“本许可证”下的自然人或“法人实体”。 “法人实体”是指提交贡献的机构及其“关联实体”。 “关联实体”是指,对“本许可证”下的行为方而言,控制、受控制或与其共同受控制的机构,此处的控制是指有受控方或共同受控方至少50%直接或间接的投票权、资金或其他有价证券。 1. 授予版权许可 每个“贡献者”根据“本许可证”授予您永久性的、全球性的、免费的、非独占的、不可撤销的版权许可,您可以复制、使用、修改、分发其“贡献”,不论修改与否。 2. 授予专利许可 每个“贡献者”根据“本许可证”授予您永久性的、全球性的、免费的、非独占的、不可撤销的(根据本条规定撤销除外)专利许可,供您制造、委托制造、使用、许诺销售、销售、进口其“贡献”或以其他方式转移其“贡献”。前述专利许可仅限于“贡献者”现在或将来拥有或控制的其“贡献”本身或其“贡献”与许可“贡献”时的“软件”结合而将必然会侵犯的专利权利要求,不包括对“贡献”的修改或包含“贡献”的其他结合。如果您或您的“关联实体”直接或间接地,就“软件”或其中的“贡献”对任何人发起专利侵权诉讼(包括反诉或交叉诉讼)或其他专利维权行动,指控其侵犯专利权,则“本许可证”授予您对“软件”的专利许可自您提起诉讼或发起维权行动之日终止。 3. 无商标许可 “本许可证”不提供对“贡献者”的商品名称、商标、服务标志或产品名称的商标许可,但您为满足第4条规定的声明义务而必须使用除外。 4. 分发限制 您可以在任何媒介中将“软件”以源程序形式或可执行形式重新分发,不论修改与否,但您必须向接收者提供“本许可证”的副本,并保留“软件”中的版权、商标、专利及免责声明。 5. 免责声明与责任限制 “软件”及其中的“贡献”在提供时不带任何明示或默示的担保。在任何情况下,“贡献者”或版权所有者不对任何人因使用“软件”或其中的“贡献”而引发的任何直接或间接损失承担责任,不论因何种原因导致或者基于何种法律理论,即使其曾被建议有此种损失的可能性。 6. 语言 “本许可证”以中英文双语表述,中英文版本具有同等法律效力。如果中英文版本存在任何冲突不一致,以中文版为准。 条款结束 如何将木兰宽松许可证,第2版,应用到您的软件 如果您希望将木兰宽松许可证,第2版,应用到您的新软件,为了方便接收者查阅,建议您完成如下三步: 1, 请您补充如下声明中的空白,包括软件名、软件的首次发表年份以及您作为版权人的名字; 2, 请您在软件包的一级目录下创建以“LICENSE”为名的文件,将整个许可证文本放入该文件中; 3, 请将如下声明文本放入每个源文件的头部注释中。 Copyright (c) [Year] [name of copyright holder] [Software Name] is licensed under Mulan PSL v2. You can use this software according to the terms and conditions of the Mulan PSL v2. You may obtain a copy of Mulan PSL v2 at: http://license.coscl.org.cn/MulanPSL2 THIS SOFTWARE IS PROVIDED ON AN "AS IS" BASIS, WITHOUT WARRANTIES OF ANY KIND, EITHER EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO NON-INFRINGEMENT, MERCHANTABILITY OR FIT FOR A PARTICULAR PURPOSE. See the Mulan PSL v2 for more details. Mulan Permissive Software License,Version 2 Mulan Permissive Software License,Version 2 (Mulan PSL v2) January 2020 http://license.coscl.org.cn/MulanPSL2 Your reproduction, use, modification and distribution of the Software shall be subject to Mulan PSL v2 (this License) with the following terms and conditions: 0. Definition Software means the program and related documents which are licensed under this License and comprise all Contribution(s). Contribution means the copyrightable work licensed by a particular Contributor under this License. Contributor means the Individual or Legal Entity who licenses its copyrightable work under this License. Legal Entity means the entity making a Contribution and all its Affiliates. Affiliates means entities that control, are controlled by, or are under common control with the acting entity under this License, ‘control’ means direct or indirect ownership of at least fifty percent (50%) of the voting power, capital or other securities of controlled or commonly controlled entity. 1. Grant of Copyright License Subject to the terms and conditions of this License, each Contributor hereby grants to you a perpetual, worldwide, royalty-free, non-exclusive, irrevocable copyright license to reproduce, use, modify, or distribute its Contribution, with modification or not. 2. Grant of Patent License Subject to the terms and conditions of this License, each Contributor hereby grants to you a perpetual, worldwide, royalty-free, non-exclusive, irrevocable (except for revocation under this Section) patent license to make, have made, use, offer for sale, sell, import or otherwise transfer its Contribution, where such patent license is only limited to the patent claims owned or controlled by such Contributor now or in future which will be necessarily infringed by its Contribution alone, or by combination of the Contribution with the Software to which the Contribution was contributed. The patent license shall not apply to any modification of the Contribution, and any other combination which includes the Contribution. If you or your Affiliates directly or indirectly institute patent litigation (including a cross claim or counterclaim in a litigation) or other patent enforcement activities against any individual or entity by alleging that the Software or any Contribution in it infringes patents, then any patent license granted to you under this License for the Software shall terminate as of the date such litigation or activity is filed or taken. 3. No Trademark License No trademark license is granted to use the trade names, trademarks, service marks, or product names of Contributor, except as required to fulfill notice requirements in Section 4. 4. Distribution Restriction You may distribute the Software in any medium with or without modification, whether in source or executable forms, provided that you provide recipients with a copy of this License and retain copyright, patent, trademark and disclaimer statements in the Software. 5. Disclaimer of Warranty and Limitation of Liability THE SOFTWARE AND CONTRIBUTION IN IT ARE PROVIDED WITHOUT WARRANTIES OF ANY KIND, EITHER EXPRESS OR IMPLIED. IN NO EVENT SHALL ANY CONTRIBUTOR OR COPYRIGHT HOLDER BE LIABLE TO YOU FOR ANY DAMAGES, INCLUDING, BUT NOT LIMITED TO ANY DIRECT, OR INDIRECT, SPECIAL OR CONSEQUENTIAL DAMAGES ARISING FROM YOUR USE OR INABILITY TO USE THE SOFTWARE OR THE CONTRIBUTION IN IT, NO MATTER HOW IT’S CAUSED OR BASED ON WHICH LEGAL THEORY, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGES. 6. Language THIS LICENSE IS WRITTEN IN BOTH CHINESE AND ENGLISH, AND THE CHINESE VERSION AND ENGLISH VERSION SHALL HAVE THE SAME LEGAL EFFECT. IN THE CASE OF DIVERGENCE BETWEEN THE CHINESE AND ENGLISH VERSIONS, THE CHINESE VERSION SHALL PREVAIL. END OF THE TERMS AND CONDITIONS How to Apply the Mulan Permissive Software License,Version 2 (Mulan PSL v2) to Your Software To apply the Mulan PSL v2 to your work, for easy identification by recipients, you are suggested to complete following three steps: i Fill in the blanks in following statement, including insert your software name, the year of the first publication of your software, and your name identified as the copyright owner; ii Create a file named “LICENSE” which contains the whole context of this License in the first directory of your software package; iii Attach the statement to the appropriate annotated syntax at the beginning of each source file. Copyright (c) [Year] [name of copyright holder] [Software Name] is licensed under Mulan PSL v2. You can use this software according to the terms and conditions of the Mulan PSL v2. You may obtain a copy of Mulan PSL v2 at: http://license.coscl.org.cn/MulanPSL2 THIS SOFTWARE IS PROVIDED ON AN "AS IS" BASIS, WITHOUT WARRANTIES OF ANY KIND, EITHER EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO NON-INFRINGEMENT, MERCHANTABILITY OR FIT FOR A PARTICULAR PURPOSE. See the Mulan PSL v2 for more details.

简介

一款基于PaddleOCR设计的半自动标注平台,可以运行在window系统上 展开 收起
C# 等 2 种语言
MulanPSL-2.0
取消

发行版

暂无发行版

贡献者

全部

近期动态

加载更多
不能加载更多了
C#
1
https://gitee.com/BaoJianQiang/FastOCRLabel.git
git@gitee.com:BaoJianQiang/FastOCRLabel.git
BaoJianQiang
FastOCRLabel
FastOCRLabel
master

搜索帮助