用C#实现pdf文件的完整性验证

简介:
现在对文件的完整性验证,防止文件被篡改的技术已经比较成熟,一般使用数字签名,数字水印等,最近我在一个项目中也遇到了防篡改的需求。该项目要求用户将原始发票用专门的扫描程序扫描成pdf文件,然后将该pdf文件传到服务器上,在上传的同时必须要验证这个pdf是没有被手工修改过的。我刚一接触到这个需求想到的就是使用数字水印,要不然就直接使用PDF的数字签名功能,不过这些方法都感觉比较比较复杂,一大堆的英文文档也没有心思去研究,于是琢磨了半天,写了一个简化版的数字水印程序,实现了pdf文件完整性验证。
        验证的基本思路是:
            对文件全部内容计算其MD5值,这样无论用户修改了文件的任何一个地方,那么生成的MD5的是完全不一样的,我们可以将这个MD5写到文件的一个隐藏区,一般二进制文件格式都有文件头和文件体部分,而文件头是用户看不到的,一般也会预留一部分字节用于以后扩展,或可以在文件头写入特殊标记的数据。于是研究了一下pdf文件的格式,试着往其第10个字节插入了MD5值,结果文件虽然可以使用,但是每次打开的时候都会提示“文件修复”。原来是写在头上面的内容将pdf文件的字节数和文件中对象的地址改变了,导致了文件错误,原因找到了那么解决办法也就有了,为了不改变pdf文件中对象的地址,那么我们将这个md5写在文件尾不就可以了嘛!于是在客户端(扫描程序)将扫描出的pdf文件流计算MD5值,然后将该文件流和MD5值一起写到硬盘上,形成一个添加了MD5值的pdf文件。文件可以正常打开和使用,而且用户也不会看到我们添加的这个MD5值。
            在服务器端,我们将上传上来的文件流除了最后32个字节以为的部分计算MD5值(这儿取32个字节是因为最后这32字节是我们写的MD5),将前面部分算出的MD5和最后32个字节的MD5进行比较,如果一样那么说明这个文件从扫描程序生成以后没有被人为篡改过,否则说明该文件要么不是用我们这个扫描程序生成的要么就是被篡改了。这样验证通过以后我们才将该文件流写到服务器硬盘上。
ExpandedBlockStart.gif
 1None.gif public class MD5
 2ExpandedBlockStart.gif    {
 3ExpandedSubBlockStart.gif       /// <summary>
 4InBlock.gif       /// 对给定文件路径的文件加上标签
 5InBlock.gif       /// </summary>
 6InBlock.gif       /// <param name="path">要加密的文件的路径</param>
 7ExpandedSubBlockEnd.gif       /// <returns>标签的值</returns>

 8InBlock.gif       public static string MD5pdf(string path,string key)
 9ExpandedSubBlockStart.gif       {
10InBlock.gif
11InBlock.gif           try
12ExpandedSubBlockStart.gif           {
13InBlock.gif               FileStream get_file = new FileStream(path, FileMode.Open, FileAccess.Read, FileShare.Read);
14InBlock.gif               byte[] pdfFile = new byte[get_file.Length];
15InBlock.gif               get_file.Read(pdfFile, 0, (int)get_file.Length);//将文件流读取到Buffer中
16InBlock.gif               get_file.Close();
17InBlock.gif
18InBlock.gif               string result = MD5Buffer(pdfFile, 0, pdfFile.Length );//对Buffer中的字节内容算MD5
19InBlock.gif               result = MD5String(result +key);//这儿点的key相当于一个密钥,这样一般人就是知道使用MD5算法,但是若不知道这个字符串还是无法计算出正确的MD5
20InBlock.gif
21InBlock.gif               byte[] md5 = System.Text.Encoding.ASCII.GetBytes(result);//将字符串转换成字节数组以便写人到文件中
22InBlock.gif
23InBlock.gif               FileStream fsWrite = new FileStream(path, FileMode.Open, FileAccess.ReadWrite);
24InBlock.gif               fsWrite.Write(pdfFile, 0, pdfFile.Length);//将pdf文件,MD5值 重新写入到文件中。
25InBlock.gif               fsWrite.Write(md5, 0, md5.Length);
26InBlock.gif               //fsWrite.Write(pdfFile, 10, pdfFile.Length - 10);
27InBlock.gif               fsWrite.Close();
28InBlock.gif
29InBlock.gif               return result;
30ExpandedSubBlockEnd.gif           }

31InBlock.gif           catch (Exception e)
32ExpandedSubBlockStart.gif           {
33InBlock.gif               return e.ToString();
34ExpandedSubBlockEnd.gif           }

35ExpandedSubBlockEnd.gif       }

36ExpandedSubBlockStart.gif       /// <summary>
37InBlock.gif       /// 对给定路径的文件进行验证
38InBlock.gif       /// </summary>
39InBlock.gif       /// <param name="path"></param>
40ExpandedSubBlockEnd.gif       /// <returns>是否加了标签或是否标签值与内容值一致</returns>

41InBlock.gif       public static bool Check(string path,string key)
42ExpandedSubBlockStart.gif       {
43InBlock.gif           try
44ExpandedSubBlockStart.gif           {
45InBlock.gif               FileStream get_file = new FileStream(path, FileMode.Open, FileAccess.Read, FileShare.Read);
46InBlock.gif
47InBlock.gif              
48InBlock.gif               byte[] pdfFile = new byte[get_file.Length];
49InBlock.gif               get_file.Read(pdfFile, 0, (int)get_file.Length);
50InBlock.gif               get_file.Close();
51InBlock.gif               string result = MD5Buffer(pdfFile, 0, pdfFile.Length - 32);//对pdf文件除最后32位以外的字节计算MD5,这个32是因为标签位为32位。
52InBlock.gif               result = MD5String(result + key);
53InBlock.gif
54InBlock.gif               string md5 = System.Text.Encoding.ASCII.GetString(pdfFile, pdfFile.Length - 3232);//读取pdf文件最后32位,其中保存的就是MD5值
55InBlock.gif               return result == md5;
56ExpandedSubBlockEnd.gif           }

57InBlock.gif           catch
58ExpandedSubBlockStart.gif           {
59InBlock.gif
60InBlock.gif               return false;
61InBlock.gif
62ExpandedSubBlockEnd.gif           }

63ExpandedSubBlockEnd.gif       }

64InBlock.gif       private static string MD5Buffer(byte[] pdfFile, int index, int count)
65ExpandedSubBlockStart.gif       {
66InBlock.gif           System.Security.Cryptography.MD5CryptoServiceProvider get_md5 = new System.Security.Cryptography.MD5CryptoServiceProvider();
67InBlock.gif           byte[] hash_byte = get_md5.ComputeHash(pdfFile, index, count);
68InBlock.gif
69InBlock.gif           string result = System.BitConverter.ToString(hash_byte);
70InBlock.gif           result = result.Replace("-""");
71InBlock.gif           return result;
72ExpandedSubBlockEnd.gif       }

73InBlock.gif       private static string MD5String(string str)
74ExpandedSubBlockStart.gif       {
75InBlock.gif           byte[] MD5Source = System.Text.Encoding.ASCII.GetBytes(str);
76InBlock.gif           return MD5Buffer(MD5Source, 0, MD5Source.Length);
77InBlock.gif
78ExpandedSubBlockEnd.gif       }

79ExpandedBlockEnd.gif   }

以上代码不仅仅只适用于PDF文件,对于其他一些格式也可以用,这主要是取决于文件的格式规范。关于PDF,官方有相关文档,不过大家觉得麻烦可以看看这篇文章: http://blog.csdn.net/pdfMaker/archive/2006/01/09/573990.aspx
目录
相关文章
|
1月前
|
XML C# 数据格式
使用C#操作XML文件
使用C#操作XML文件
11 0
|
1月前
|
C#
C# 文件操作(全部) 追加、拷贝、删除、移动文件、创建目录
C# 文件操作(全部) 追加、拷贝、删除、移动文件、创建目录
22 0
|
1月前
|
数据挖掘 数据安全/隐私保护 开发者
使用Spire.PDF for Python插件从PDF文件提取文字和图片信息
使用Spire.PDF for Python插件从PDF文件提取文字和图片信息
72 0
|
1月前
|
存储 缓存 Python
如何使用Python抓取PDF文件并自动下载到本地
如何使用Python抓取PDF文件并自动下载到本地
34 0
|
2月前
|
编解码 数据可视化 数据挖掘
【办公自动化】用Python将PDF文件转存为图片
【办公自动化】用Python将PDF文件转存为图片
63 1
|
5天前
|
XML C# 数据格式
C# 解析XML文件
C# 解析XML文件
14 1
|
30天前
|
安全 数据处理 C#
C# Post数据或文件到指定的服务器进行接收
C# Post数据或文件到指定的服务器进行接收
|
30天前
|
C# 开发工具 数据安全/隐私保护
C#实现基于Word保护性模板文件的修改
C#实现基于Word保护性模板文件的修改
|
1月前
|
JSON JavaScript 前端开发
vue项目使用Print.js插件实现PDF文件打印
vue项目使用Print.js插件实现PDF文件打印
43 0
|
1月前
|
Shell Python
Python生成PDF文件
Python生成PDF文件
23 0