VC对大型数据文件的读取&读取二进制文件
2008-11-13 19:33:03 来源:WEB开发网笔者前不久曾遇到一个问题,解决之后的经验愿与大家分享。问题是这样的,有一批数据文件,数据格式如下:
日期,开盘,最高,最低,收盘,成交量,成交金额
1996年5月13日,636.96,636.96,636.96,636.96,0,0,
1996年5月14日,641.61,641.61,641.61,641.61,0,0,
1996年5月15日,637.83,637.83,637.83,637.83,0,0,
.............
要求将数据填写到四张表中,以便作相应的分析。笔者开始用CFile和CStdioFile类的方法读取件。Cfile类提供了基于二进制流的文件操作,功能类似于C语言中的fread()和fwrite()函数。CStdioFile提供了基于字符串流的文件操作,功能类似于C语言中fgets()和fputs()函数。但是笔者发现,使用这两个类进行文件操作时,对于一次文件读写的数据量的大小必须限制在65535字节以内。究其原因是在VC中访问大于65535字节的缓冲区需要Huge型指针,而在CFile和CStdioFile类中,使用的是Far型的指针。由于Far型指针不具有跨段寻址的能力,因此限制了一次文件读写的长度小于65535字节。如果传递给CFile和CStdioFile两个类的成员函数的数据缓冲区的大小大于65535字节的时候,VC就会产生ASSERT错误。
针对文件格式特点,笔者改用CArchive类进行读取如下:
CFileSourceFile;//数据文件
CStringSourceData;//定义一临时变量保存一条记录
SourceFile.Open(.......);
CArchivear(&SourceFile,CArchive::load);
while(NULL!=ar.ReadString(SourceData))//循环读取文件,直到文件结束
{
if(SourceData=="日期,开盘,最高,最低,收盘,成交量,成交金额"||SourceData=="")
continue;//跳过文件头部的提示信息
//分析并填充//
}
在进行分析时,笔者采取了逐步分析并修改的办法,过程如下:
intnYear;
CStringYear=SourceData.Left(SourceData.Find("年"));//截取年前面的字符串
nYear=atoi(Year);//类型转换
SourceData=SourceData.Righ(SourceData.GetLength()-SourceData.Find("年")-2);//将年以及前面的字符删除。
重复上面分析过程,直到记录末尾。
通过上述方法,笔者成功地将文件读取并分析填充。
在VC6.0中读取二进制文件
周志杰··计算机世界日报
各位需要用VC++读写二进制文件的朋友(尤其是需要与DOS共享二进制文件的朋友),VC6.0的推出无疑给大家带来的一个惊喜.你还没发现吗?那让我来给您提个醒把:
二进制文件的读写通常而且很实用的方法是使用结构(体)先构造文件中一条记录的结构,再逐条读/写.在VC5.0中,一直存在一个小小的弊病---如果你使用MFC则它要求结构(体)成员比特位对齐为8位,而且你无法方便的通过选中"Project-$#@62;Setting-$#@62;C/C++"选项卡中的"CodeGeneration"再修改"Structmemberalignment"来使其变为1位(即使改变了,在你编译时该改变也会被忽略).
当然如果你的二进制文件是在WINDOWS下创建的,并且只在WINDOWS下读写,这种影响并不明显.但如果很不巧,你需要与DOS共同读写一个在DOS下创建的二进制文件时,它带来的麻烦会让你哭笑不得,尤其是你的结构中各个成员的数据类型不同时(就更别提为节省空间使用"位域"后的文件了),结构的长度不再是你所期望的值,原本的数据在读出时变的乱七八糟,而你写进去的记录,在DOS下读取时同样只能让你盯着屏幕发呆.
为了能将结构成员的对齐位降至1位,你可能已经做了很多努力,比如将二进制文件的读写全部转移到一个基于API的DLL中,而只要求DLL返回执行结果,或者干脆使用VC5.0编写一个基于API的WINDOWS的程序,也许你已经成功了,但是付出的代价也是令同行钦佩的.
现在好了,VC6.0的推出让苦日子成为过去了.在VC6.0中,结构成员的对齐位可以方便的降至1位!!读写二进制文件的灰暗时代终于过去了!!!
更多精彩
赞助商链接