理解Word 2007的 .docx格式
2008-10-15 20:15:56 来源:WEB开发网前所述,Word2007的新.docx格式本身并不使用XML格式,相反地,文档的主要内容保存为XML格式,但文件并非直接保存于磁盘中,它改为保存在一个ZIP文件中。取扩展名为.docx、.docm、.dotm或.dotx。
要验证上面所述,创建一个简单的Word2007文件,保存并关闭它,接着,重命名加入.zip扩展名。最后,用Windows Explorer来显示该ZIP文件的内容,如图1所示。
图1 作为ZIP文件查看时,大多数的.docx文件包含三个主要文件夹和一个“内容类型XML”文档
Word2007的.docx文件还能包含额外的文件夹,如有一个叫customXml。使用该文件夹,文档通常包含连接到文档属性、外部数据库或窗体服务器的内容控制功能。
Word2007文档的大部分位于一个名为Word的文件夹中,一个简单文档的典型的Word文件夹如图2所示。
图2 .docx文件中Word文档的主要部分保存在名为Word的文件夹内
文档的主要文本保存在document.xml中。利用XML编辑器,的确可以修改document.xml中的文本,用修改过的文件替换原始文件,用.docx扩展名替换.zip来重命名文件,接着在Word中打开文件,修改内容就会显示出来。
快速问答
问:什么是XML编辑器?当我双击一个XML文件时,它会打开Internet Explorer,不允许我编辑。
答:有专门的XML编辑器,也可以直接用FrontPage或SharePoint Designer,还可以使用任何能编辑纯文本文件的工具,如“记事本”。
许多复杂的Word文件会包含其他的元素,图3所示的是一个.docx文件展开的文件夹视图,该文件包含剪贴画、一个嵌入的Excel图表、几张图片和一些SmartArt,还有与文档属性连接的自定义XML。
图3 .docx文件中的图像保存在wordmedia文件夹内
提示:在Word2007中可以不用编辑文件就可替换.docx文件中的图像,重新命名.docx文件使其具有.zip扩展名,提取保存在wordmedia文件夹内的图像查看内容,对要替换的图像分别取与现有文件险工的名称。用新的图像替换wordmedia文件夹中内容。最后,将.zip扩展名替换回原来的扩展名,说变就变!而且不用打开Word,如果图像少还可能没什么人机工程学的感觉,但是如果数量很多时它能节省大量的时间。
更多精彩
赞助商链接