扫码阅读
手机扫码阅读

19.7K star!厉害了,最好用的OCR开源文字识别工具,没有之一!

156 2024-08-23

我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。

查看原文:19.7K star!厉害了,最好用的OCR开源文字识别工具,没有之一!
文章来源:
测试开发技术
扫码关注公众号

开源OCR项目概述 - Umi-OCR

Umi-OCR是一个基于PaddleOCR开发、使用Python编写的开源OCR项目,目前仅支持Windows平台,拥有19.7k+星标。项目提供免费、方便的离线OCR服务,具有高效和灵活性,支持多种调用方式和多种功能,如截图OCR、批量OCR、PDF识别等。

项目使用指南

用户可以从GitHub、蓝奏云或Source Forge下载最新版本的Umi-OCR,并通过解压后直接点击Umi-OCR.exe文件启动程序。项目特色功能包括:

  • 截图OCR:适合在无法复制的网页上使用,支持快捷键截图和识别,以及图片预览和识别记录的编辑。
  • 批量OCR:允许批量导入图片并识别,支持多种输出格式和文本后处理,以及自定义的忽略区域。
  • 文档识别:支持多种文件格式,可以进行OCR或提取原有文本,并输出为双层可搜索PDF,同时提供排除页眉页脚等忽略区域的功能。

命令行和接口调用

Umi-OCR支持通过命令行或HTTP接口调用。命令行支持多种OCR指令,如截屏、粘贴图片和指定地址等。HTTP接口需先开启HTTP服务,并允许局域网访问。使用方法详见项目文档。

结论

Umi-OCR是一个功能全面且易于使用的开源OCR工具。更多详细使用信息可以参考项目的官方文档,并且用户可以通过关注、点赞、分享来支持该项目。

想要了解更多内容?

查看原文:19.7K star!厉害了,最好用的OCR开源文字识别工具,没有之一!
文章来源:
测试开发技术
扫码关注公众号