返回顶部
首页 > 资讯 > 操作系统 >apache tika检测文件是否损坏的方法
  • 423
分享到

apache tika检测文件是否损坏的方法

apachetika检测文件 2022-06-04 23:06:50 423人浏览 安东尼
摘要

Apache Tika用于文件类型检测和从各种格式的文件内容提取的库。 将上传文件至服务器,进行解析文件时,经常需要判断文件是否损坏。我们可以使用tika来检测文件是否损坏 Maven引入如下: <depend

Apache Tika用于文件类型检测和从各种格式的文件内容提取的库。

将上传文件至服务器,进行解析文件时,经常需要判断文件是否损坏。我们可以使用tika来检测文件是否损坏

Maven引入如下:


&lt;dependency>
  <groupId>org.apache.tika</groupId>
  <artifactId>tika-app</artifactId>
  <version>1.18</version>
</dependency>
<dependency>
  <groupId>xerces</groupId>
  <artifactId>xercesImpl</artifactId>
  <version>2.11.0</version>
</dependency>

  如果jar包冲突时可以引入如下:


<dependency>
  <groupId>org.apache.tika</groupId>
  <artifactId>tika-core</artifactId>
  <version>1.18</version>
</dependency>
<dependency>
  <groupId>org.apache.tika</groupId>
  <artifactId>tika-parsers</artifactId>
  <version>1.18</version>
</dependency>
<dependency>
  <groupId>xerces</groupId>
  <artifactId>xercesImpl</artifactId>
  <version>2.11.0</version>
</dependency>

使用tika检测文件是否损坏: 

  如果从输入流读取失败,则parse方法抛出IOException异常,从流中获取的文档不能被解析抛TikaExceptQXRvwyOion异常,处理器不能处理事件则抛SAXException异常

  当文档不能被解析时,说明文档损坏

执行过程:


public static void main(String[] args) {
    try {
      //Assume sample.txt is in your current directory
      File file = new File("D:\\测试.txt");
      boolean result = isParseFile(file);
    } catch (Exception e) {
      e.printStackTrace();
    }
  }
 
  
  private static boolean isParseFile(File file) throws Exception {
    try {
      Tika tika = new Tika();
      String filecontent = tika.parseToString(file);
      System.out.println(filecontent);
      return true;
    } catch (TikaException e) {
      return false;
    }
  }

  输出结果:

测试数据---读取文本内容

总结

以上所述是小编给大家介绍的apache tika检测文件是否损坏的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对我们网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

--结束END--

本文标题: apache tika检测文件是否损坏的方法

本文链接: https://lsjlt.com/news/20588.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • apache tika检测文件是否损坏的方法
    Apache Tika用于文件类型检测和从各种格式的文件内容提取的库。 将上传文件至服务器,进行解析文件时,经常需要判断文件是否损坏。我们可以使用tika来检测文件是否损坏 maven引入如下: <depend...
    99+
    2022-06-04
    apache tika检测文件
  • Oracle数据库文件坏块损坏的恢复方法
    数据恢复故障描述:打开oracle数据库报错 “system01.dbf需要更多的恢复来保持一致性,数据库无法打开”。工程师检测数据库文件发现sysaux01.dbf有坏块,sysaux01.dbf文件损坏...
    99+
    2024-04-02
  • oracle检查数据文件是否有坏块
    通过dbv命令查看oracle数据文件是否有坏块, [oracle@jw PROD]$ **dbv file=users01.dbf** DBVERIFY: Release 11.2.0.4.0 - Pro...
    99+
    2024-04-02
  • mac提示文件已损坏的处理方法
      用户在使用mac系统安装或下载一些软件应用时,偶尔会出现“XXX软件已损坏”的情况,下面就来教大家遇到这种情况怎么解决:       1、MacOS 10.15及以上新系统出现应用提示损坏打不开的解决方法:       打开终端(屏...
    99+
    2023-09-03
    macos
  • nodejs如何检测文件是否存在
    这篇文章将为大家详细讲解有关nodejs如何检测文件是否存在,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。 检测方法:1、使用“fs.exis...
    99+
    2024-04-02
  • Win8系统文件损坏或丢失怎么办? Win8系统文件损坏或丢失的解决方法
      解决思路:出现这种问题就需要找到所损坏的文件并对其进行修复。 解决方法:   一、先看看命令文件检查器工具使用方法   1、在win8中使用组合键“CTRL+F”打开搜索,或...
    99+
    2022-06-04
    文件 系统 解决方法
  • Win8.1如何检测屏幕坏点?Win8.1系统检测屏幕坏点的方法
      电脑屏幕用久了之后,很可能会出现坏点,如果你想知道自己的电脑屏幕是否存在坏点,可以进行检测。那么Win8.1如何检测屏幕坏点?下面小编就给大家带来Win8.1系统检测屏幕坏点的方法,一起来看看吧。  ...
    99+
    2022-06-04
    坏点 屏幕 方法
  • shell检测某个文件/文件夹是否存在
    1、shell检测某一文件是否存在 当你在shell中需要检查一个文件是否存在时,通常需要使用到文件操作符-e和-f。第一个-e用来检查文件是否存在,而不管文件类型。第二个-f仅仅用来检查文件是常规文件(不是目录或设备)时返回true。 F...
    99+
    2023-08-31
    linux 运维 服务器
  • ppt文件损坏修复无法读取的解决方法
    这篇文章将为大家详细讲解有关ppt文件损坏修复无法读取的解决方法,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。解决方法:首先点击顶部导航栏的“文件”选项卡,在下拉列表里选择“选项”;然后找到“信任中心”,...
    99+
    2023-06-14
  • gzip压缩文件底层结构及文件损坏的修复方法是什么
    本文小编为大家详细介绍“gzip压缩文件底层结构及文件损坏的修复方法是什么”,内容详细,步骤清晰,细节处理妥当,希望这篇“gzip压缩文件底层结构及文件损坏的修复方法是什么”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知...
    99+
    2023-06-04
  • Linux文件系统损坏原因及修复方法
    本篇内容主要讲解“Linux文件系统损坏原因及修复方法”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Linux文件系统损坏原因及修复方法”吧!有时候维护Linux服务器时会面临这样一种错误,即显...
    99+
    2023-06-13
  • android 检测耳机是否插入方法
    AudioManager就有这个方法: isWiredHeadsetOn(); 如果插入了耳机,就返回true,否则false; 当然,要加个权限,不然一直是返回false。 ...
    99+
    2022-06-06
    耳机 方法 Android
  • ORACLE检查找出损坏索引(Corrupt Indexes)的方法详解
    索引 索引与表一样,也属于段(segment)的一种。里面存放了用户的数据,跟表一样需要占用磁盘空间。索引是一种允许直接访问数据表中某一数据行的树型结构,为了提高查询效率而引入,是一个独立于表的对象,可以存...
    99+
    2024-04-02
  • 修复损坏的Word文档的三种方法
    修复损坏的Word文档的三种方法包括:1. 使用Microsoft Office内置的修复工具:打开损坏的Word文档时,Micro...
    99+
    2023-09-16
    Word
  • JavaScript 检测文件的类型的方法
    目录一、如何查看图片的二进制数据二、如何区分图片的类型三、如何检测图片的类型3.1 定义 readBuffer 函数3.2 定义 check 函数3.3 检测 PNG 图片类型我们会...
    99+
    2024-04-02
  • 检测ip和port是否可连接的方法
    windows cmd telnet format: telnet ip port case: telnet 191.1.1.1 8080 telnet不能加http:// telnet不支持域名 telne...
    99+
    2022-06-04
    检测 ip port 可连接
  • Win8文件损坏无法自动修复的尝试解决方法
    一、检查映像是否可修复 1.扫描映像来检查损坏。在管理员命令提示符下键入以下命令: Dism /Online /Cleanup-Image /ScanHealth 这条命令将扫描全部系统文件并和官方系统文件对比,扫描计算...
    99+
    2023-06-04
    Win8 文件损坏 自动修复 解决 尝试 文件 方法
  • php检测变量是否为空的方法是什么
    在 PHP 中,可以使用以下方法来检测变量是否为空: 使用 empty() 函数:empty() 函数可以检测变量是否为空,如果变...
    99+
    2024-03-06
    php
  • 使用Bash Shell检查文件是否存在的方法
    前言 大家在工作的时候可能经常会遇到这样的需求,在类Unix系统的Bash环境下,怎样检查文件是否存在呢?既然有需求,当然就有解决的办法了,Shell中的test命令,可以用来检测文件的类型或者比较数值是否...
    99+
    2022-06-04
    是否存在 文件 方法
  • SpringBoot下载Excel文件时,报错文件损坏的解决方案
    SpringBoot下载Excel文件文件损坏 我把模板文件放在了resources目录下 maven插件打包项目的时候,默认会压缩resources目录下的文件。 服务器读取的文...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作