运维开发网

java如何实现判断文件的真实类型

运维开发网 https://www.qedev.com 2020-05-29 10:21 出处:网络 作者: forget_over_life
在文件传输过程中,为了安全验证,对于手工改动文件后缀名产生的伪造文件进行判断过滤。

在文件传输过程中,为了安全验证,对于手工改动文件后缀名产生的伪造文件进行判断过滤。

比如,我们需要的是excel文件,如果不加验证内容,将一些可执行的文件通过更改后缀传输给你,就是一个很大的漏洞了。

Java判断文件真实类型依靠的是文件的头部编码信息,具体代码如下:

package com.zhuifeng.util.excel; 
 
import java.io.FileInputStream; 
import java.io.IOException; 
import java.util.HashMap; 
 
/** 
 * @author guoxk 
 * 
 * 类描述:获取和判断文件头信息 
 *  |--文件头是位于文件开头的一段承担一定任务的数据,一般都在开头的部分。 
 *  |--头文件作为一种包含功能函数、数据接口声明的载体文件,用于保存程序的声明(declaration),而定义文件用于保存程序的实现(implementation)。 
 *  |--为了解决在用户上传文件的时候在服务器端判断文件类型的问题,故用获取文件头的方式,直接读取文件的前几个字节,来判断上传文件是否符合格式。 
 * 
 */ 
public class CheckExcelFileTypeUtil { 
  // 缓存文件头信息-文件头信息 
  public static final HashMap<String, String> mFileTypes = new HashMap<String, String>(); 
  static { 
    // images 
    mFileTypes.put("FFD8FF", "jpg"); 
    mFileTypes.put("89504E47", "png"); 
    mFileTypes.put("47494638", "gif"); 
    mFileTypes.put("49492A00", "tif"); 
    mFileTypes.put("424D", "bmp"); 
    // 
    mFileTypes.put("41433130", "dwg"); // CAD 
    mFileTypes.put("38425053", "psd"); 
    mFileTypes.put("7B5C727466", "rtf"); // 日记本 
    mFileTypes.put("3C3F786D6C", "xml"); 
    mFileTypes.put("68746D6C3E", "html"); 
    mFileTypes.put("44656C69766572792D646174653A", "eml"); // 邮件 
    mFileTypes.put("D0CF11E0", "doc"); 
    mFileTypes.put("D0CF11E0", "xls");//excel2003版本文件 
    mFileTypes.put("5374616E64617264204A", "mdb"); 
    mFileTypes.put("252150532D41646F6265", "ps"); 
    mFileTypes.put("255044462D312E", "pdf"); 
    mFileTypes.put("504B0304", "docx"); 
    mFileTypes.put("504B0304", "xlsx");//excel2007以上版本文件 
    mFileTypes.put("52617221", "rar"); 
    mFileTypes.put("57415645", "wav"); 
    mFileTypes.put("41564920", "avi"); 
    mFileTypes.put("2E524D46", "rm"); 
    mFileTypes.put("000001BA", "mpg"); 
    mFileTypes.put("000001B3", "mpg"); 
    mFileTypes.put("6D6F6F76", "mov"); 
    mFileTypes.put("3026B2758E66CF11", "asf"); 
    mFileTypes.put("4D546864", "mid"); 
    mFileTypes.put("1F8B08", "gz"); 
  } 
 
  /** 
   * @author guoxk 
   * 
   * 方法描述:根据文件路径获取文件头信息 
   * @param filePath 文件路径 
   * @return 文件头信息 
   */ 
  public static String getFileType(String filePath) { 
//   System.out.println(getFileHeader(filePath)); 
//   System.out.println(mFileTypes.get(getFileHeader(filePath))); 
    return mFileTypes.get(getFileHeader(filePath)); 
  } 
 
  /** 
   * @author guoxk 
   * 
   * 方法描述:根据文件路径获取文件头信息 
   * @param filePath 文件路径 
   * @return 文件头信息 
   */ 
  public static String getFileHeader(String filePath) { 
    FileInputStream is = null; 
    String value = null; 
    try { 
      is = new FileInputStream(filePath); 
      byte[] b = new byte[4]; 
      /* 
       * int read() 从此输入流中读取一个数据字节。int read(byte[] b) 从此输入流中将最多 b.length 
       * 个字节的数据读入一个 byte 数组中。 int read(byte[] b, int off, int len) 
       * 从此输入流中将最多 len 个字节的数据读入一个 byte 数组中。 
       */ 
      is.read(b, 0, b.length); 
      value = bytesToHexString(b); 
    } catch (Exception e) { 
    } finally { 
      if (null != is) { 
        try { 
          is.close(); 
        } catch (IOException e) { 
        } 
      } 
    } 
    return value; 
  } 
 
  /** 
   * @author guoxk 
   * 
   * 方法描述:将要读取文件头信息的文件的byte数组转换成string类型表示 
   * @param src 要读取文件头信息的文件的byte数组 
   * @return  文件头信息 
   */ 
  private static String bytesToHexString(byte[] src) { 
    StringBuilder builder = new StringBuilder(); 
    if (src == null || src.length <= 0) { 
      return null; 
    } 
    String hv; 
    for (int i = 0; i < src.length; i++) { 
      // 以十六进制(基数 16)无符号整数形式返回一个整数参数的字符串表示形式,并转换为大写 
      hv = Integer.toHexString(src[i] & 0xFF).toUpperCase(); 
      if (hv.length() < 2) { 
        builder.append(0); 
      } 
      builder.append(hv); 
    } 
//   System.out.println(builder.toString()); 
    return builder.toString(); 
  } 
  /** 
   * @author guoxk 
   * 
   * 方法描述:测试 
   * @param args 
   * @throws Exception 
   */ 
  public static void main(String[] args) throws Exception { 
    final String fileType = getFileType("E:\\补贴名单.xls"); 
    System.out.println(fileType); 
  }}

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我们。

0

精彩评论

暂无评论...
验证码 换一张
取 消