WEB开发网      濠电姷鏁告繛鈧繛浣冲洤纾瑰┑鐘宠壘閻ょ偓銇勯幇鍫曟闁稿鍠愰妵鍕冀閵娧佲偓鎺楁⒒閸曨偄顏柡宀嬬畱铻e〒姘煎灡绗戦梻浣筋嚙濮橈箓顢氳濠€浣糕攽閻樿宸ュΔ鐘叉啞缁傚秹宕滆绾惧ジ寮堕崼娑樺缂佹宀搁弻鐔风暋閻楀牆娈楅梺璇″枓閺呯姴鐣疯ぐ鎺濇晝闁靛牆妫欓蹇旂節閻㈤潧浠﹂柛銊ョ埣楠炴劙骞橀鑲╋紱闂佽宕樼粔顔裤亹閹烘挸浜归梺缁樺灦閿曗晛螞閸曨垱鈷戦柟鑲╁仜婵″ジ鎮楀☉鎺撴珖缂侇喖顑呴鍏煎緞濡粯娅囬梻浣瑰缁诲倿寮绘繝鍥ㄦ櫇闁稿本绋撻崢鐢告煟鎼淬垻鈯曢柨姘舵煟韫囥儳绋荤紒缁樼箖缁绘繈宕橀妸褌绱濋梻浣筋嚃閸ㄤ即宕弶鎴犳殾闁绘梻鈷堥弫鍌炴煕閳锯偓閺呮瑧妲愬Ο琛℃斀闁绘劕妯婇崵鐔封攽椤旇棄鍔ら摶鐐烘煕閺囥劌澧柛娆忕箻閺屽秹宕崟顒€娅g紓浣插亾濠㈣泛顑囩粻楣冩煙鐎涙ḿ绠橀柨娑樼У椤ㄣ儵鎮欓鍕紙闂佽鍠栫紞濠傜暦閹偊妲诲┑鈩冨絻椤兘寮诲☉銏犖╅柕澶堝労閸斿绱撴担绋库偓鍝ョ矓瑜版帒鏋侀柟鍓х帛閺呮悂鏌ㄩ悤鍌涘 ---闂傚倸鍊烽悞锔锯偓绗涘厾娲煛閸涱厾顔嗛梺璺ㄥ櫐閹凤拷
开发学院WEB开发综合 Unicode与Ansi 阅读

Unicode与Ansi

 2006-02-27 11:41:38 来源:WEB开发网 闂傚倸鍊风欢姘缚瑜嶈灋闁圭虎鍠栫粻顖炴煥閻曞倹瀚�闂傚倸鍊风粈渚€骞夐敓鐘插瀭闁汇垹鐏氬畷鏌ユ煙閹殿喖顣奸柛搴$У閵囧嫰骞掗幋婵冨亾閻㈢ǹ纾婚柟鐐灱濡插牊绻涢崱妤冃℃繛宀婁簽缁辨捇宕掑鎵佹瀸闂佺懓鍤栭幏锟�濠电姷鏁告慨顓㈠箯閸愵喖宸濇い鎾寸箘閹规洟姊绘笟鈧ḿ褍煤閵堝悿娲Ω閳轰胶鍔﹀銈嗗笂閼冲爼鍩婇弴銏$厪闁搞儮鏅涙禒褏绱掓潏鈺佷槐闁轰焦鎹囬弫鎾绘晸閿燂拷闂傚倸鍊风欢姘缚瑜嶈灋闁圭虎鍠栫粻顖炴煥閻曞倹瀚�  闂傚倸鍊烽懗鑸电仚缂備胶绮〃鍛村煝瀹ュ鍗抽柕蹇曞У閻庮剟姊虹紒妯哄闁诲繑姘ㄩ埀顒佸嚬閸撶喎顫忓ú顏勫瀭妞ゆ洖鎳庨崜浼存⒑闁偛鑻晶顔剧磼婢跺﹦绉虹€殿喖顭锋俊姝岊槷闁稿鎹囧Λ鍐ㄢ槈濞嗗繑娈橀梻浣风串缂嶁偓濞存粠鍓熼崺鈧い鎺戝€归弳顒勬煕鐎n亷韬€规洑鍗冲鍊燁槾闁哄棴绠撻弻銊╂偆閸屾稑顏�
核心提示:VisualBasic32-bit版本的字串处理采用Unicode,也就是说字串在VB内部是以Unicode的格式来存放,Unicode与Ansi,何谓Unicode?简单的说,就是每一个字元都是以2-byte的型式表示,[●]使用ByteArray除了上面必须使用byte精确定位的例子之外,纯文字的处理基本上是用不到
VisualBasic32-bit版本的字串处理采用Unicode,也就是说字串在VB内部是以Unicode的格式来存放。

何谓Unicode?简单的说,就是每一个字元都是以2-byte的型式表示,而每个「实体字元」就是一个「字元」。因此,

Len("大家好")
Len("abc")

所传回的值都是3,因为「大」和「a」都是一个字元。

但是这对一些中文字串处理,例如纯文字的资料档,却是一个大灾难,因为你必须以byte来定位每个字元,可是Unicode却把一切的处理全搞砸了。例如:

Len("GoodMorning")传回12,而
Len("今天天气很好")传回6

对初学者而言,好不容易能使用VB来写程式已经是件了不起的事了,却马上在中文处理上挨了一记闷棍,所受到的打击实在不小。但是不要怕,事实上只要再多了解一些指令,就可以把中文处理的问题解决了。

是什麽指令呢?最重要的莫过於StrConv了。StrConv函式的语法为:

StrConv(待转换字串,转换格式)

其中转换格式在这里用到的是:

vbUnicode将Ansi字串转换为Unicode
vbFromUnicode将Unicode字串转换为Ansi

将字串转成Ansi之後,所有的字串处理指令都要加个B,例如:LeftB,RightB,MidB,ChrB,InstrB,LenB,InputB等。例用这些指令来处理就行了。

当你处理完毕之後,你可以再将它再转回Unicode,这样就可以使用一般的字串处理指令了。

这样讲看得懂吗?如果还是不了解,看看下面的实例说明:

[●]简易使用范例

看看下面的基本范例您应该就会对VB的字串处理方式有些概念。

PRivateSubCommand1_Click()
DimsUnicodeAsString
DimsAnsiAsString

'Unicode运算
sUnicode="王小明,A123456789,651023,台北市中山路100号,(02)2345678"
Debug.PrintLen(sUnicode)'传回44
Debug.PrintMid$(sUnicode,5,10)'传回A123456789
Debug.PrintInstr(sUnicode,"台北市")'传回23

'将Unicode字串转成Ansi
sAnsi=StrConv(sUnicode,vbFromUnicode)
'Ansi运算
Debug.PrintLenB(sAnsi)'传回54
Debug.PrintMidB$(sAnsi,8,10)'传回?????,因为忘了转回Unicode
Debug.PrintStrConv(MidB$(sAnsi,8,10),vbUnicode)'传回A123456789,请注意转回Unicode的动作一定要做
Debug.PrintInStrB(sAnsi,StrConv("台北市",vbFromUnicode))'传回23,不要忘了要把"台北市"也转成Ansi,否则会找不到
EndSub

[●]读入文字档

在VB的小技巧中,有一个是快速读档法:

PrivateSubCommand1_Click()
DimsFileAsString

Open"C:\filename.txt"ForInputAs#1
sFile=Input$(LOF(1),#1)
Close#1
EndSub

但是很不幸地,如果你读取的档案内含中文字,那上面这段程式会出现Inputpastendoffile的错误。因为LOF传回的是档案的byte数,而Input函式读取的是字元数,由於档案内含中文,因此档案中的字元数将会小於byte数,於是就发生错误了。

要解决这个问题,我们就要用到StrConv和InputB这两个函式了:

PrivateSubCommand1_Click()
DimsFileAsString

Open"C:\filename.txt"ForInputAs#1
sFile=StrConv(InputB$(LOF(1),#1),vbUnicode)
Close#1
EndSub

上面修正程式先用InputB将档案读进来,不过使用InputB所读入的档案是Ansi格式的,所以要再用StrConv转成Unicode才行。

[●]随机资料档

许多文字资料档是以固定位元组的位置来加以区格,例如下面的资料格式:

王小民650110台北市中山路100号(02)1234567
张大呆660824花莲县大甲镇广东街23号(03)9876543
......

像这种类型的档案要如何处理呢?这是就必须用到Type以及bytearray了。

PrivateTypetagRecord
Username(5)AsByte'姓名6bytes
Birthday(5)AsByte'生日6bytes
Address(21)AsByte'地址22bytes
TEL(11)AsByte'电话12bytes
CrLf(1)AsByte'换列字元2bytes
EndType

PrivateSubCommand1_Click()
DimuRecordAstagRecord

Open"C:\filename.dat"ForRandomAs#1Len=LenB(uRecord)
Get#1,2,uRecord'取第二笔资料

WithuRecord'With...EndWith应该会用吧
Debug.Print.Username'传回???
Debug.PrintStrConv(.Username,vbUnicode)'传回"张大呆"
EndWith

Close#1
EndSub

在这个例子中,一定要用到bytearray,因为只有bytearray才能正确地定位到每个byte的位置。以前使用字串来定位的方法已经不适用了,千万要记住!但是使用bytearray所读入的资料是Ansi格式,若要处理或是做运算的话,记得还要转成Unicode格式才行。

[●]使用ByteArray

除了上面必须使用byte精确定位的例子之外,纯文字的处理基本上是用不到bytearray的。bytearray通常是用在处理binary资料。->

Tags:Unicode Ansi

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接