首页 > 资讯 > 精选 >java怎么使用tess4j进行图片文字识别功能

562

分享到

java怎么使用tess4j进行图片文字识别功能

2023-07-05 21:07:38 562人浏览八月长安

摘要

这篇文章主要介绍“java怎么使用tess4j进行图片文字识别功能”，在日常操作中，相信很多人在java怎么使用tess4j进行图片文字识别功能问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”java怎么使用t

这篇文章主要介绍“java怎么使用tess4j进行图片文字识别功能”，在日常操作中，相信很多人在java怎么使用tess4j进行图片文字识别功能问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”java怎么使用tess4j进行图片文字识别功能”的疑惑有所帮助！接下来，请跟着小编一起来学习吧！

java使用tess4j进行图片文字识别

一、简介

Tess4J 是Java （JNA）对 Tesseract OCR api 的封装。
很久之前需要做一个自动登陆并对网页上的未处理的数据进行按钮点击，其中需要登陆的验证码校验，因此用了一下Tess4J，能识别一些简单的文字和数字等，识别率好像一般，但出错了就重新换一个验证码再试，多试几次也能成功。现将之前的简单使用过程记录，备查。

Tess4J是对Tesseract OCR API 的Java JNA 封装。使java能够通过调用Tess4J的API来使用Tesseract OCR。支持的格式包括TIFF、JPEG、GIF、PNG、BMP、JPEG、pdf。这个开始接触的时候，我对这两个东西还搞混淆了。明确说一下，Tess4J是java直接可使用的jar包，而Tesseract OCR是支持Tess4J进文件文字识别的基础，Tess4J可直接使用Maven方式引入。

二、使用过程

1.maven依赖引入pom.xml

<!-- tess4j start --><dependency>    <groupId>net.sourceforge.tess4j</groupId>    <artifactId>tess4j</artifactId>    <version>5.6.0</version></dependency><!-- tess4j end -->

2.准备好tessdata目录下的语言库文件

需要提前下载好相关的语言库文件，这里我下了chi_sim.traineddata和eng.traineddata两个
下载地址：https://codechina.csdn.net/mirrors/tesseract-ocr/tessdata
下载好后放在代码里面的目录下

java怎么使用tess4j进行图片文字识别功能

3.写测试代码进行测试

准备好两张图片放置在代码的资源目录下，方便程序读取，

图片1

java怎么使用tess4j进行图片文字识别功能

图片2

java怎么使用tess4j进行图片文字识别功能

两张图片放在资源目录下

java怎么使用tess4j进行图片文字识别功能

代码如下：

package cn.ljhua;import java.awt.image.BufferedImage;import java.io.File;import java.io.IOException;import java.io.InputStream;import javax.imageio.ImageIO;import lombok.extern.slf4j.Slf4j;import net.sourceforge.tess4j.ITesseract;import net.sourceforge.tess4j.Tesseract;import net.sourceforge.tess4j.TesseractException;@Slf4jpublic class Tess4jOcrTest {public static void main(String[] args) {Tess4jOcrTest test = new Tess4jOcrTest();test.ocrTest();}public void ocrTest() {log.info("ocrTest start....");long startMs = System.currentTimeMillis(); //Tesseract的代码开始---------------------->>>>ITesseract instance = new Tesseract();String filePathPre = System.getProperty("user.dir");    String dataPath = filePathPre + File.separator + "tessdata";            instance.setDatapath(dataPath);    //instance.setLanguage("eng");//默认，可以不写    instance.setLanguage("chi_sim");//设置中文识别    String imageName = "verifyCode.png";        try (InputStream inStream = this.getClass().getResourceAsStream("/" + imageName)) {                    BufferedImage bImage = ImageIO.read(inStream);        //doOCR也可以传参为File，我这里传的BufferedImage        String result = instance.doOCR(bImage);        //识别的结果回来可能会带回车，处理掉        result = result.replaceAll("\n", "");        log.info("图片名：" + imageName +" 识别结果："+ result);                } catch (IOException e) {            log.error(e.getMessage(),e);        } catch (TesseractException e) {        log.error(e.getMessage(),e);}                imageName = "vCode2.jpg";        try (InputStream inStream = this.getClass().getResourceAsStream("/" + imageName)) {                    BufferedImage bImage = ImageIO.read(inStream);        //doOCR也可以传参为File，我这里传的BufferedImage        String result = instance.doOCR(bImage);        //识别的结果回来可能会带回车，处理掉        result = result.replaceAll("\n", "");        log.info("图片名：" + imageName +" 识别结果："+ result);                } catch (IOException e) {            log.error(e.getMessage(),e);        } catch (TesseractException e) {        log.error(e.getMessage(),e);}//Tesseract的代码结束--------------------->>>>        log.info("ocrTest success. spend time :{} ms.", (System.currentTimeMillis() - startMs));}}

测试结果截图如：

java怎么使用tess4j进行图片文字识别功能

英文识别出来比较正常，中文识别出来带了空格，如果需要可以通过代码进一步去掉空格，至此，tess4j的简单使用测试完成。

到此，关于“java怎么使用tess4j进行图片文字识别功能”的学习就结束了，希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习，快去试试吧！若想继续学习更多相关知识，请继续关注编程网网站，小编会继续努力为大家带来更多实用的文章！

--结束END--

本文标题: java怎么使用tess4j进行图片文字识别功能

本文链接: https://lsjlt.com/news/355404.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

java怎么使用tess4j进行图片文字识别功能

java使用tess4j进行图片文字识别

一、简介

二、使用过程

1.maven依赖引入pom.xml

2.准备好tessdata目录下的语言库文件

3.写测试代码进行测试

java使用tess4j进行图片文字识别功能

java怎么使用tess4j进行图片文字识别功能

使用python进行图片的文字识别

java使用tesseract-ocr进行文字识别

Android中怎么实现一个图片文字识别功能

Java如何使用Tessdata做OCR图片文字识别

java怎么实现识别二维码图片功能

如何使用PHP进行OCR识别和文字识别？

Android中怎么实现图片识别功能

java图片文字提取功能怎么实现

如何在java项目中利用ocr实现一个图片文字识别功能

Java使用Tessdata做OCR图片文字识别的详细思路

Python调用百度AI实现图片上文字识别功能实例

Java离线中文语音文字识别功能怎么实现

Unity怎么实现OCR文字识别功能

怎么用Python代码实现文字识别功能

怎么java中使用Thumbnails对图片进行处理

怎么使用Python+OpenCV实现图像识别替换功能

node.js（express）中使用Jcrop进行图片剪切上传功能

Python怎么使用opencv进行手势识别

使用golang框架有哪些常见的问题？

golang框架与其他流行框架的比较？

如何使用 C++ STL 扩展 C++ 语言的功能？

PHP 框架安全指南：如何实现安全编码实践？

mysql拆分函数使用要注意哪些事项

C++ 思维导图：全面整理编程核心知识

基于社区支持最强大的PHP框架

如何在 C++ 中有效使用 STL 函数对象？

PHP 框架中的调试和故障排除技术

经验丰富的开发者的PHP框架评估指南