TIF格式图像文件初探
2009-10-27 20:31:22 来源:WEB开发网本文配套源码
一、前言
因工作需要,本人经常接触一些图像方面的编程工作。目前图像领域中的格式很多且大部分官方说明都是英文文档,实在令人头疼,我想受此困扰的程序员朋友不在少数吧。这里本人不揣浅陋,写了一个将TIF格式转换成BMP格式图像的程序,供大家参考。请不吝赐教。
注:TIF是可扩充标记的文件,所以理论上是不可能编写一个能识别所有类别TIF格式的读写程序,这里只是给大家提供一个思路, 将TIF图像转换成BMP图像后就可以使用Windows提供的API函数对其进行编辑并方便直观地显示出来,测试代码中包含 了一个用于测试的TIF图。本代码也只能针对这一种类别的TIF图进行操作,如何对其他类别的TIF图进行编码,读完本例子自然就能融会 贯通了。
二、TIF图像格式概览
TIF图由四个部分组成:
1、图像文件头(Image File Header简称IFH):
图一 IFH结构描述
IFH数据结构包含3个成员共计8个字节,Byte order成员可能是“MM”(0x4d4d)或“II”(0x4949),0x4d4d表示该TIFF图是摩托罗拉整数格式 0x4949表示该图是Intel整数格式;Version成员总是包含十进制42(0x2a),它用于进一步校验该文件是否为TIF格式,42这个数并不是一般人 想象中的那样认为是tif软件的版本,实际上,42这个数大概永远不会变化;第三个成员是IFD(接下来要说的第二个数据结构)相对文件开始 处的偏移量。
2、图像文件目录(Image File Directory简称IFD):
图二 IFD及DE结构描述
IFD是TIF图中最重要的数据结构,它包含了一个TIF文件中最重要的信息,一个TIF图可能有多个IFD,这说明文件中有多个图像,每个IFD标识1个图像的基本属性。 IFD结构中包含了三类成员,Directory Entry Count指出该结构里面有多少个目录入口;接下来就是N个线性排列的DE序列,数量不定(这就是 为什么称TIF格式文件为可扩充标记的文件,甚至用户可以添加自定义的标记属性),每个DE标识了图像的某一个属性;最后就是一个偏移量, 标识下一个文件目录相对于文件开始处的位置,当然,如果该TIF文件只包含了一幅图像,那么就只有一个IFD,显然,这个偏移量就等于0;
3、目录入口(Directory Entry简称DE):
共12个字节,见图二。简单说,一个DE就是一幅图像的某一个属性。例如图像的大小、分辨率、是否压缩、像素的行列数、一个像素由几位 表示(1位代表黑白两色,8位代表256色等等)等。其中:tag成员是该属性的编号,在图像文件目录中,它是按照升序排列的。我们可以通过读 这些编号,然后到TIF格式官方白皮书中查找相应的含义。属性是用数据来表示的,那么type就是代表着该数据的类型,TIF官方指定的有5种数据类型。 type=1就是BYTE类型(8位无标记整数)、type=2是ASCII类型(7位ASCII码加1位二进制0)、type=3是SHORT类型(16位无标记整数)、type=4是LONG 类型(32位无标记整数)、type=5是RATIONAL类型(2个LONG,第一个是分子,第二个是分母)。length成员是数据的数量而不是数据类型的长度。 第4个成员valueOffset很重要,它是tag标识的属性代表的变量值相对文件开始处的偏移量。如果变量值占用的空间小于4个字节,那么该值就存放在 valueOffset中即可,没必要再另外指向一个地方了。
4、图像数据 本例提供的图像是基于256灰度级的,即一个字节代表一个像素点,它是0x00~0xff区间中256个灰度级的任意一个整数。通过使用UltraEdit工具观察, 我们发现该图像文件的组织形式是:IFH--数据--IFD。以下的示例说明遵循了这一观察结果。
更多精彩
赞助商链接