手机客户端

您的位置：首页 > 源码 > Tesseract OCR图像识别类库

Tesseract OCR图像识别类库

Tesseract OCR图像识别类库

Tesseract OCR图像识别类库

Tesseract OCR图像识别类库包含了一个OCR引擎

立即下载

10

已有3108人下载

Tesseract OCR图像识别类库

Tesseract OCR图像识别类库

Tesseract OCR图像识别类库

简单介绍

文章导读：Tesseract OCR图像识别类库包含了一个OCR引擎 - libtesseract和一个命令行程序 - tesseract。Tesseract 4添加了新的基于LSTM的OCR引擎，该引擎专注于行识别，但仍支持Tesseract 3的。

Tesseract OCR图像识别类库包含了一个OCR引擎 - libtesseract和一个命令行程序 - tesseract。Tesseract 4添加了新的基于LSTM的OCR引擎，该引擎专注于行识别，但仍支持Tesseract 3的传统Tesseract OCR引擎，该引擎通过识别字符模式来工作。通过使用传统OCR引擎模式（--oem 0），可以与Tesseract 3兼容。它还需要训练有素的数据文件来支持旧式引擎，例如tessdata存储库中的文件。

Tesseract具有Unicode（UTF-8）支持，并且可以“开箱即用”地识别100多种语言。

Tesseract支持多种输出格式：纯文本，hOCR（HTML），PDF，仅不可见文本的PDF，TSV。master分支还对ALTO（XML）输出提供了实验性支持。

安装Tesseract：

您可以通过预建的二进制软件包安装正方体或从源代码编译它。

支持的编译器是：

GCC 4.8及以上

lang 3.4及以上

MSVC 2015、2017、2019年

其他编译器可能可以工作，但未得到官方支持。

最新文章

更多+

下载

更多+

标签

分类源码
大小 2.37MB
版本 v5.2.0
系统

相关下载

更多+

同类推荐

更多+

手机版

返回顶部