随便撸(www.suibianlu.com)精品网站源码,织梦建站模版,游戏源代码分享平台

Tesseract OCR图像识别类库 v4.1.1

时间:2020-09-28[其他免费源码]作者:随便撸

Tesseract OCR 包含了一个OCR引擎 - libtesseract和一个命令行程序 - tesseract。Tesseract 4添加了新的基于LSTM的OCR引擎,该引擎专注于行识别,但仍支持Tesseract 3的传统Tesseract OCR引擎,该引擎通过识别字符模式来工作。通过使用传统OCR引擎模式(--oem 0),可以与Tesseract 3兼容。它还需要训练有素的数据文件来支持旧式引擎,例如tessdata存储库中的文件。


Tesseract具有Unicode(UTF-8)支持,并且可以“开箱即用”地识别100多种语言。


Tesseract支持多种输出格式:纯文本,hOCR(HTML),PDF,仅不可见文本的PDF,TSV。master分支还对ALTO(XML)输出提供了实验性支持。


安装Tesseract:

您可以通过预建的二进制软件包安装正方体 或从源代码编译它。

支持的编译器是:

GCC 4.8及以上

lang 3.4及以上

MSVC 2015、2017、2019年

其他编译器可能可以工作,但未得到官方支持。

Tesseract OCR图像识别类库 v4.1.1 第1张

本文标签:tesseract ocr  tesseract库  图像识别算法 

转载请注明来源:Tesseract OCR图像识别类库 v4.1.1

本文永久链接地址:https://www.suibianlu.com/21390.html

郑重声明:
本站所有内容均由互联网收集整理、网友上传,并且以计算机技术研究交流为目的,仅供大家参考、学习,不存在任何商业目的与商业用途。
若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。 我们不承担任何技术及版权问题,且不对任何资源负法律责任。
如无法链接失效或侵犯版权,请给我们来信:admin#suibianlu.com

Top