返回顶部
首页 > 资讯 > 精选 >java怎么使用tess4j进行图片文字识别功能
  • 562
分享到

java怎么使用tess4j进行图片文字识别功能

2023-07-05 21:07:38 562人浏览 八月长安
摘要

这篇文章主要介绍“java怎么使用tess4j进行图片文字识别功能”,在日常操作中,相信很多人在java怎么使用tess4j进行图片文字识别功能问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”java怎么使用t

这篇文章主要介绍“java怎么使用tess4j进行图片文字识别功能”,在日常操作中,相信很多人在java怎么使用tess4j进行图片文字识别功能问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”java怎么使用tess4j进行图片文字识别功能”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

    java使用tess4j进行图片文字识别

    一、简介

    Tess4J 是Java (JNA) 对 Tesseract OCR api 的封装。
    很久之前需要做一个自动登陆并对网页上的未处理的数据进行按钮点击,其中需要登陆的验证码校验,因此用了一下Tess4J,能识别一些简单的文字和数字等,识别率好像一般,但出错了就重新换一个验证码再试,多试几次也能成功。现将之前的简单使用过程记录,备查。

    Tess4J是对Tesseract OCR APIJava JNA 封装。使java能够通过调用Tess4J的API来使用Tesseract OCR。支持的格式包括TIFF、JPEG、GIF、PNG、BMP、JPEG、pdf。这个开始接触的时候,我对这两个东西还搞混淆了。明确说一下,Tess4J是java直接可使用的jar包,而Tesseract OCR是支持Tess4J进文件文字识别的基础,Tess4J可直接使用Maven方式引入。

    二、使用过程

    1.maven依赖引入pom.xml

    <!-- tess4j start --><dependency>    <groupId>net.sourceforge.tess4j</groupId>    <artifactId>tess4j</artifactId>    <version>5.6.0</version></dependency><!-- tess4j end -->

    2.准备好tessdata目录下的语言库文件

    需要提前下载好相关的语言库文件,这里我下了chi_sim.traineddata和eng.traineddata两个
    下载地址:https://codechina.csdn.net/mirrors/tesseract-ocr/tessdata
    下载好后放在代码里面的目录下

    java怎么使用tess4j进行图片文字识别功能

    3.写测试代码进行测试

    准备好两张图片放置在代码的资源目录下,方便程序读取,

    图片1

    java怎么使用tess4j进行图片文字识别功能

    图片2

    java怎么使用tess4j进行图片文字识别功能

    两张图片放在资源目录下

    java怎么使用tess4j进行图片文字识别功能

    代码如下:

    package cn.ljhua;import java.awt.image.BufferedImage;import java.io.File;import java.io.IOException;import java.io.InputStream;import javax.imageio.ImageIO;import lombok.extern.slf4j.Slf4j;import net.sourceforge.tess4j.ITesseract;import net.sourceforge.tess4j.Tesseract;import net.sourceforge.tess4j.TesseractException;@Slf4jpublic class Tess4jOcrTest {public static void main(String[] args) {Tess4jOcrTest test = new Tess4jOcrTest();test.ocrTest();}public void ocrTest() {log.info("ocrTest start....");long startMs = System.currentTimeMillis(); //Tesseract的代码开始---------------------->>>>ITesseract instance = new Tesseract();String filePathPre = System.getProperty("user.dir");    String dataPath = filePathPre + File.separator + "tessdata";            instance.setDatapath(dataPath);    //instance.setLanguage("eng");//默认,可以不写    instance.setLanguage("chi_sim");//设置中文识别    String imageName = "verifyCode.png";        try (InputStream inStream = this.getClass().getResourceAsStream("/" + imageName)) {                    BufferedImage bImage = ImageIO.read(inStream);        //doOCR也可以传参为File,我这里传的BufferedImage        String result = instance.doOCR(bImage);        //识别的结果回来可能会带回车,处理掉        result = result.replaceAll("\n", "");        log.info("图片名:" + imageName +" 识别结果:"+ result);                } catch (IOException e) {            log.error(e.getMessage(),e);        } catch (TesseractException e) {        log.error(e.getMessage(),e);}                imageName = "vCode2.jpg";        try (InputStream inStream = this.getClass().getResourceAsStream("/" + imageName)) {                    BufferedImage bImage = ImageIO.read(inStream);        //doOCR也可以传参为File,我这里传的BufferedImage        String result = instance.doOCR(bImage);        //识别的结果回来可能会带回车,处理掉        result = result.replaceAll("\n", "");        log.info("图片名:" + imageName +" 识别结果:"+ result);                } catch (IOException e) {            log.error(e.getMessage(),e);        } catch (TesseractException e) {        log.error(e.getMessage(),e);}//Tesseract的代码结束--------------------->>>>        log.info("ocrTest success. spend time :{} ms.", (System.currentTimeMillis() - startMs));}}

    测试结果截图如:

    java怎么使用tess4j进行图片文字识别功能

    英文识别出来比较正常,中文识别出来带了空格,如果需要可以通过代码进一步去掉空格,至此,tess4j的简单使用测试完成。

    到此,关于“java怎么使用tess4j进行图片文字识别功能”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注编程网网站,小编会继续努力为大家带来更多实用的文章!

    --结束END--

    本文标题: java怎么使用tess4j进行图片文字识别功能

    本文链接: https://lsjlt.com/news/355404.html(转载时请注明来源链接)

    有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

    猜你喜欢
    • java使用tess4j进行图片文字识别功能
      目录java使用tess4j进行图片文字识别一、简介二、使用过程1.maven依赖引入pom.xml2.准备好tessdata目录下的语言库文件3.写测试代码进行测试三、源码下载地址...
      99+
      2023-05-14
      java图片文字识别 java图片文字识别 java tess4j识别图片文字
    • java怎么使用tess4j进行图片文字识别功能
      这篇文章主要介绍“java怎么使用tess4j进行图片文字识别功能”,在日常操作中,相信很多人在java怎么使用tess4j进行图片文字识别功能问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”java怎么使用t...
      99+
      2023-07-05
    • 使用python进行图片的文字识别
      使用python进行图片的文字识别 文章目录 使用python进行图片的文字识别安装 Tesseract OCR安装过程配置系统的环境变量 安装python的第三方库Pytesserac...
      99+
      2023-09-08
      python windows pytesseract Tesseract ORC
    • java使用tesseract-ocr进行文字识别
      提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、tesseract-ocr是什么?二、使用步骤1.下载exe安装包2.安装3.使用3.设置全局path...
      99+
      2023-09-11
      java 开发语言
    • Android中怎么实现一个图片文字识别功能
      Android中怎么实现一个图片文字识别功能,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。添加依赖implementation 'com.rmtheis:...
      99+
      2023-06-20
    • Java如何使用Tessdata做OCR图片文字识别
      这篇文章主要介绍“Java如何使用Tessdata做OCR图片文字识别”,在日常操作中,相信很多人在Java如何使用Tessdata做OCR图片文字识别问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Java如...
      99+
      2023-06-20
    • java怎么实现识别二维码图片功能
      本篇内容介绍了“java怎么实现识别二维码图片功能”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!所需maven依赖<dependenc...
      99+
      2023-06-30
    • 如何使用PHP进行OCR识别和文字识别?
      随着数字化时代的不断发展,有大量的纸质文件需要进行数字化,以方便存储和检索。为了能够有效地进行数据转换,很多公司和个人选择了OCR技术(Optical Character Recognition,光学字符识别),它可以将扫描的纸质文档中的文...
      99+
      2023-05-21
      PHP OCR识别 文字识别
    • Android中怎么实现图片识别功能
      本篇文章为大家展示了Android中怎么实现图片识别功能,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。1、界面我采用了一个SurfaceView用来显示摄像头的预览画面,重写了一个SurfaceVi...
      99+
      2023-05-30
      android
    • java图片文字提取功能怎么实现
      要实现Java的图片文字提取功能,可以使用OCR(Optical Character Recognition,光学字符识别)技术。O...
      99+
      2023-10-25
      java
    • 如何在java项目中利用ocr实现一个图片文字识别功能
      这期内容当中小编将会给大家带来有关如何在java项目中利用ocr实现一个图片文字识别功能,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。最近在开发的时候需要识别图片中的一些文字,网上找了相关资料之后,发现g...
      99+
      2023-05-31
      java ocr ava
    • Java使用Tessdata做OCR图片文字识别的详细思路
      说到文字识别,目前除了用一些现成的api,大概就是 tessdata、canvas或者 ocrad等。 1、百度接口用过(可以自己去百度开发者申请,免费的),识别率吧,还可以,但也不...
      99+
      2024-04-02
    • Python调用百度AI实现图片上文字识别功能实例
      目录简介步骤安装百度AI库注册百度AI开放平台调用glob库调用AipOcr库识别文字可能会遇到的问题批量操作总结简介 Python免费调用百度AI实现图片上面的文字识别 步骤 安装...
      99+
      2024-04-02
    • Java离线中文语音文字识别功能怎么实现
      这篇文章主要讲解了“Java离线中文语音文字识别功能怎么实现”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Java离线中文语音文字识别功能怎么实现”吧!1、pom文件如下:<xml&n...
      99+
      2023-07-02
    • Unity怎么实现OCR文字识别功能
      今天就跟大家聊聊有关Unity怎么实现OCR文字识别功能,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。首先登陆百度开发者中心,搜索文字识别服务:创建一个应用,获取AppID、APIK...
      99+
      2023-06-22
    • 怎么用Python代码实现文字识别功能
      今天小编给大家分享一下怎么用Python代码实现文字识别功能的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。1.环境和配置要求...
      99+
      2023-06-30
    • 怎么java中使用Thumbnails对图片进行处理
      这篇文章给大家介绍怎么java中使用Thumbnails对图片进行处理,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。Thumbnails支持:指定大小进行缩放按照比例进行缩放不按照比例,指定大小进行缩放旋转水印裁剪转化...
      99+
      2023-06-08
    • 怎么使用Python+OpenCV实现图像识别替换功能
      本文小编为大家详细介绍“怎么使用Python+OpenCV实现图像识别替换功能”,内容详细,步骤清晰,细节处理妥当,希望这篇“怎么使用Python+OpenCV实现图像识别替换功能”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来...
      99+
      2023-07-02
    • node.js(express)中使用Jcrop进行图片剪切上传功能
      需求说明 简单来说就是要实现用户上传头像,并且要保存用户裁切后的部分作为用户头像。 第一步,选择图片: 第二步,在弹窗页面中展现并进行裁切: 第三步,点击“保存”,上传服务器。 实现过程 说来有点坎...
      99+
      2022-06-04
      上传 功能 图片
    • Python怎么使用opencv进行手势识别
      这篇文章将为大家详细讲解有关Python怎么使用opencv进行手势识别,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。原理首先先进行手部的检测,找到之后会做Hand Landmarks。将手掌的21个点找...
      99+
      2023-06-26
    软考高级职称资格查询
    编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
    • 官方手机版

    • 微信公众号

    • 商务合作