百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

收藏|Java获取文件类型的5种方法(java获取文件下所有文件)

wptr33 2025-03-19 17:23 10 浏览

工作中经常会用到,判断一个文件的文件类型,这里总结一把,一般判断文件类型的原理有2种方式:

1. 根据文件扩展名判断

优点:速度快,代码简单

缺点:无法判断出真实的文件类型,例如一些伪造的文件或者没有后缀名称的文件

2. 根据文件流中前几个字符判断

优点:可以判断出真实的文件类型

缺点:速度慢,代码复杂

下面我会针对每个方法,去测试验证,测试文件如下:

test.png: 创建一个正常的png文件,其扩展名为test.png

test.doc: 复制一份上面的test.png文件,修改其文件名称为test.doc

1. 使用Files.probeContentType

Java1.7开始,提供了用于解决MIME类型的方法 Files.probeContentType:

publicstaticvoidtest()throws IOException{Path path =newFile("d:/test.png").toPath(); String mimeType = Files.probeContentType(path); System.out.println(mimeType);}

结果:

此方法利用已安装的FileTypeDetector实现来探查MIME类型。它调用每个实现的 probeContentType来解析类型。

但是,其默认实现是特定于操作系统的,并且可能会失败,具体取决于我们使用的操作系统。

结论:根据文件扩展名判断。

2. 使用URLConnection

URLConnection提供了几种用于检测文件的MIME类型的API。

2.1 使用getContentType

publicvoidtest(){File file =newFile("d:/test.png"); URLConnection connection = file.toURL().openConnection(); String mimeType = connection.getContentType();}

结果:

结论:根据文件流中前几个字符判断。能够判断真实的文件类型,但是,这种方法的主要缺点是速度非常慢。

2.2 使用guessContentTypeFromName

publicvoidtest(){File file =newFile("d:/test.png"); String mimeType = URLConnection.guessContentTypeFromName(file.getName());}

结果:

该方法利用内部的FileNameMap来判断MIME类型。

结论:根据文件扩展名判断。

2.3 使用
guessContentTypeFromStream

publicstaticvoidtest()throws Exception{FileInputStream inputFile =newFileInputStream("d:/test.doc");String mimeType = URLConnection.guessContentTypeFromStream(newBufferedInputStream(inputFile)); System.out.println(mimeType);}

结果:

结论:根据文件流中前几个字符判断。

2.4 使用getFileNameMap

使用URLConnection获得MIME类型的更快方法是使用getFileNameMap()方法:

publicvoidtest(){File file =newFile("d:/test.png"); FileNameMap fileNameMap = URLConnection.getFileNameMap(); String mimeType = fileNameMap.getContentTypeFor(file.getName());}

结果:

该方法返回URLConnection的所有实例使用的MIME类型表。然后,该表用于解析输入文件类型。

当涉及URLConnection时,MIME类型的内置表非常有限。

默认情况下,该类使用content-types.properties文件,其所在目录为JRE_HOME/lib。但是,我们可以通过使用content.types.user.table属性指定用户特定的表来扩展它 :

System.setProperty("content.types.user.table","");

结论:根据文件扩展名判断。

3. 使用MimeTypesFileTypeMap

该类是Java 6附带的,因此在使用JDK 1.6时非常方便。

publicvoidtest(){File file =newFile("product.png");MimetypesFileTypeMap fileTypeMap =newMimetypesFileTypeMap(); String mimeType = fileTypeMap.getContentType(file.getName());}

结果:

在这里,我们可以将文件名或File实例本身作为参数传递给函数。但是,以File实例为参数的函数在内部调用重载方法,该方法接受文件名作为参数。

在内部,此方法查找名为mime.types的文件以进行类型解析。请务必注意,该方法以特定顺序搜索文件:

以编程方式将条目添加到MimetypesFileTypeMap实例

用户主目录中的mime.types

/lib/mime.types

名为META-INF / mime.types的资源

名为META-INF / mimetypes.default的资源(通常仅在activation.jar文件中找到)

但是,如果找不到文件,它将返回application/octet-stream作为响应。

结论:根据文件扩展名判断。

4. 使用jmimemagicjMimeMagic

是一个受限制许可的库,我们可以使用它来获取文件的MIME类型。

配置Maven依赖:

net.sf.jmimemagic jmimemagic0.1.5

接下来,我们将探讨如何使用该库:

publicvoidtest(){File file =newFile("d:/test.doc");MagicMatch match = Magic.getMagicMatch(file,false); System.out.println(match.getMimeType());}

该库可以处理数据流,因此不需要文件存在于文件系统中。

结果:

结论:根据文件流中前几个字符判断。

5. 使用Apache TikaApache Tika

是一个工具集,可检测并从各种文件中提取元数据和文本。它具有丰富而强大的API,并带有[tika-core],我们可以利用它来检测文件的MIME类型。

配置Maven依赖:

org.apache.tika tika-core1.18

接下来,我们将使用detect()方法来解析类型:

publicvoidwhenUsingTika_thenSuccess(){File file =newFile("d:/test.doc");Tika tika =newTika(); String mimeType = tika.detect(file);}

结果:

结论:根据文件流中前几个字符判断。

总结

根据判断原理总结分类如下:

具体如何选择,依据需求而定

相关推荐

搭建Oracle数据库服务器(oracle数据库服务器安装教程)

【十一】搭建Oracle数据库服务器...

Oracle 删除大量表记录操作总结(oracle删除表记录数据)

删除表数据操作清空所有表记录TRUNCATETABLEyour_table_name;...

专访搜狗DBA负责人王林平:为何从Oracle转向MySQL?

王林平CSDN:首先,请做个自我介绍,目前所负责的领域以及所在公司。王林平:大家好,我是王林平,目前在搜狗商业平台研发部工作。主要负责商业广告数据库的维护、优化、架构设计、流程体系建设、自动化运维平台...

Oracle数据库知识 day01 Oracle介绍和增删改查

一、oracle介绍ORACLE数据库系统是美国ORACLE公司(甲骨文)提供的以分布式数据库为核心的一组软件产品,是目前最流行的客户/服务器(CLIENT/SERVER)或B/S体系结构...

深入探索Oracle 回表原理、影响与优化技巧

什么是回表当对一个列创建索引之后,索引会包含该列的键值以及键值对应行所在的rowid。通过索引中记录的rowid访问表中的数据就叫回表。执行计划中的TABLEACCESSBYINDEXROW...

那些年我们踩过的语句创建oracle 12c cdb实例的坑

现在大多数客户使用oracle还是11g版本的,很多小伙伴可能还没接触过12c,所以今天小编要为大家科普下12c版本的oracle的安装过程中会出现的错误。前面步骤其实都是一样的,我们就直接从建好1...

Oracle高级数据库特性揭秘:存储过程、触发器与权限管理

当谈论Oracle高级数据库特性时,存储过程和函数、触发器、权限管理和安全性以及数据库连接和远程访问是关键概念。下面我将为每个主题提供详细的解释,并附上高质量示例。...

ORACLE内核解密之表空间管理(oracle表空间大小是由什么决定)

一、ORACLE表空间管理1、本地表空间管理tablespace(LMT)...

Oracle 创建磁盘组报错ORA-15137的问题分析与解决思路

ASM扩容本来是件很简单的事,当ASM磁盘准备好之后,直接一条命令就会添加上。但是也会有异常情况,最近就碰到Oracle19c在扩容时报错的故障,供大家参考。...

DBA日记之Oracle数据库索引一(oracle数据库索引有哪几种)

什么是索引在oracle数据库中,索引是数据库中一种可选的数据结构,通常与表或簇相关。用户可以在表的一列或数列上建立索引,以提高在此表上执行SQL语句的性能。就像本文档的索引可以帮助读者快速定位所...

利用Oracle触发器实现不同数据库之间的数据同步

首先在两个数据库之间创建链接(DBLink),然后对要同步地表做一个同义(synonym),最后建一个触发器实现同步。实现步骤如下:1)为保证连接到另一台远程服务器的数据库,需要建立一个DBLin...

oracle已有表的分表分区优化操作步骤(单表过大)

第一章、步骤总览0、获取创建表空间DDL、创建表空间(该步骤在将分区放入不同的表空间时采用)...

Oracle 表分区在线重定义(oracle表分区后查询语句改变吗)

表分区有以下优点:a、改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索速度。b、增强可用性:如果表的某个分区出现故障,表在其他分区的数据仍然可用;c、维护方便:如果表的某个分区出现故障...

ORACLE 体系 - 14(oracle 11g的体系结构有几种)

【十四】数据移动...

Oracle-架构、原理、进程(oracle进程结构)

详解:首先看张图:对于一个数据库系统来说,假设这个系统没有运行,我们所能看到的和这个数据库相关的无非就是几个基于操作系统的物理文件,这是从静态的角度来看,如果从动态的角度来看呢,也就是说这个数据库系统...