宽字符标量L"xx"在VC6.0/7.0和GNU g++中的不同实现
2007-03-15 21:55:05 来源:WEB开发网关于上述结论可以有下面这个程序来验证://author: smileonce
呵呵,问题已经明了,总结一下:
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>
#include <windows.h>
void prt( const void* padd, size_t n )
{
const unsigned char* p = static_cast<const unsigned char*>( padd );
const unsigned char* pe = p + n;
for( ; p<pe; ++p ) printf( " %02X", *p ); printf( "
" );
}
int main()
{
char a[] = "VC知识库";
wchar_t b[] = L"VC知识库";
prt( a, sizeof(a) );
prt( b, sizeof(b) );
PSTR pMultiByteStr = (PSTR)a;
PWSTR pWideCharStr;
int nLenOfWideCharStr;
// 利用API函数MultiByteToWideChar()来把a转化成unicode字符
nLenOfWideCharStr = MultiByteToWideChar( CP_ACP, 0, pMultiByteStr, -1, NULL, 0);
pWideCharStr = (PWSTR)HeapAlloc( GetProcessHeap(), 0, nLenOfWideCharStr * sizeof(WCHAR) );
assert( pWideCharStr );
MultiByteToWideChar( CP_ACP, 0, pMultiByteStr, -1, pWideCharStr, nLenOfWideCharStr );
prt( pWideCharStr, nLenOfWideCharStr * sizeof(WCHAR) );
system( "Pause" );
// // 说明:
// 56 43 D6 AA CA B6 BF E2 00 //char a[] = "VC知识库";
// 56 00 43 00 E5 77 C6 8B 93 5E 00 00 //wchar_t b[] = L"VC知识库";
// 56 00 43 00 E5 77 C6 8B 93 5E 00 00 //用MultiByteToWideChar()把a转换为unicode
// // 可见,b[]的字符代码就是unicode代码
return 0;
}
为什么 C/C++ 语言把 L"xx" 定义为由实现决定的呢?这显然是为了 C/C++ 的普适性、可移植性。Bjarne 的观点认为,C++ 的方式是允许程序员使用任何字符集作为串的字符类型。另外,unicode 编码已经发展了若干版本了,是否能永久适合下去也不得而知。有关 unicode 的详细论述以及和其它字符集的比较,我推荐你看《无废话xml》。
更多精彩
赞助商链接