JAVA与C++::关于JNI中文字符串操作问题总结
2008-03-08 12:53:36 来源:WEB开发网 闂傚倸鍊搁崐鎼佸磹閹间礁纾归柟闂寸绾惧綊鏌熼梻瀵割槮缁炬儳缍婇弻鐔兼⒒鐎靛壊妲紒鐐劤缂嶅﹪寮婚悢鍏尖拻閻庨潧澹婂Σ顔剧磼閻愵剙鍔ょ紓宥咃躬瀵鎮㈤崗灏栨嫽闁诲酣娼ф竟濠偽i鍓х<闁诡垎鍐f寖闂佺娅曢幑鍥灳閺冨牆绀冩い蹇庣娴滈箖鏌ㄥ┑鍡欏嚬缂併劎绮妵鍕箳鐎n亞浠鹃梺闈涙搐鐎氫即鐛崶顒夋晬婵絾瀵ч幑鍥蓟閻斿摜鐟归柛顭戝枛椤牆顪冮妶搴′簼缂侇喗鎸搁悾鐑藉础閻愬秵妫冮崺鈧い鎺戝瀹撲礁鈹戦悩鎻掝伀缁惧彞绮欓弻娑氫沪閹规劕顥濋梺閫炲苯澧伴柟铏崌閿濈偛鈹戠€n€晠鏌嶆潪鎷屽厡闁汇倕鎳愮槐鎾存媴閸撴彃鍓卞銈嗗灦閻熲晛鐣烽妷褉鍋撻敐搴℃灍闁绘挻娲橀妵鍕箛闂堟稐绨肩紓浣藉煐濮樸劎妲愰幘璇茬闁冲搫鍊婚ˇ鏉库攽椤旂》宸ユい顓炲槻閻g兘骞掗幋鏃€鐎婚梺瑙勬儗閸樺€熲叺婵犵數濮烽弫鍛婃叏椤撱垹纾婚柟鍓х帛閳锋垶銇勯幒鍡椾壕缂備礁顦遍弫濠氱嵁閸℃稒鍊烽柛婵嗗椤旀劕鈹戦悜鍥╃У闁告挻鐟︽穱濠囨嚃閳哄啰锛滈梺褰掑亰閸欏骸鈻撳⿰鍫熺厸閻忕偟纭堕崑鎾诲箛娴e憡鍊梺纭呭亹鐞涖儵鍩€椤掑啫鐨洪柡浣圭墪閳规垿鎮欓弶鎴犱桓闂佸湱枪閹芥粎鍒掗弮鍫熷仺缂佸顕抽敃鍌涚厱闁哄洢鍔岄悘鐘绘煕閹般劌浜惧┑锛勫亼閸婃牠宕濋敃鈧…鍧楀焵椤掍胶绠剧€光偓婵犱線鍋楀┑顔硷龚濞咃絿妲愰幒鎳崇喓鎷犻懠鑸垫毐闂傚倷鑳舵灙婵炲鍏樺顐ゆ嫚瀹割喖娈ㄦ繝鐢靛У绾板秹寮查幓鎺濈唵閻犺櫣灏ㄥ銉р偓瑙勬尭濡繂顫忛搹鍦<婵☆垰鎼~宥囩磽娴i鍔嶉柟绋垮暱閻g兘骞嬮敃鈧粻濠氭偣閸パ冪骇鐎规挸绉撮—鍐Χ閸℃ê闉嶇紓浣割儐閸ㄥ墎绮嬪澶嬪€锋い鎺嶇瀵灝鈹戦埥鍡楃仯闁告鍕洸濡わ絽鍟崐鍨叏濡厧浜鹃悗姘炬嫹

核心提示:[问题简单背景]使用java编程有时候需要使用JNI来实现效率方面或者是其他方面的问题,在JNI使用中不得不面临的问题就是中文问题(假如你是老外,并且不关心中国建设,那就不用看了;或者你已经知道如何解决 的话,你也不用看了),JAVA采用UNICODE来支持运行时,当然类文件的保存格
[问题简单背景]
使用java编程有时候需要使用JNI来实现效率方面或者是其他方面的问题。在JNI使用中不得不面临
的问题就是中文问题(假如你是老外,并且不关心中国建设,那就不用看了;或者你已经知道如何解决
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
的话,你也不用看了),JAVA采用UNICODE来支持运行时,当然类文件的保存格式是UTF-8。
~~~~~~~~~~~~~~~~~
当然了你用pure JAVA也不会出现问题的,其他出现的问题也不包含在今天的论题中(比如文件保存的字符集
或者是WEB开发中的中文问题)。当我们需要使用JAVA和本地环境混合编程时候,问题就来了:
(1)JAVA如何传递UNICODE字符串到本地环境
(2)本地环境如何传递UNICODE字符到JAVA环境
当然了,中国人我只关心中文在之间的转化,英文很好办,因为没有问题的,其他语言偶不关心。
[测试环境说明]
下面说明一下本人使用的环境。
(1)WINDOWS2000 PRofessional/512M DDR RAM/P4 2.0G
(2)SUN JDK1.4.0
(3)VC++ 6.0 /SP5
[测试过程说明]
============================
编写JAVA程序,得到接口文件
============================
//jni.java
public class jni
{
static
{
System.loadLibrary("jni");
}
public native String getChinese(String str);
public static void main(String args[])
{
jni j=new jni();
System.err.println("[从NATIVE环境返回字符]"+j.getChinese("测"));
char ch='测';
System.err.println("[在JAVA环境中]'测'的UNICODE="+(int)ch);
}
}
编译JAVA程序
%JAVA_HOME%\bin\javac jni.java
得到接口文件
%JAVA_HOME%\bin\javah jni
//jni.h
/* DO NOT EDIT THIS FILE - it is machine generated */
#include <jni.h>
/* Header for class jni */
#ifndef _Included_jni
#define _Included_jni
#ifdef __cplusplus
extern "C" {
#endif
/*
* Class: jni
* Method: getChinese
* Signature: (Ljava/lang/String;)Ljava/lang/String;
*/
JNIEXPORT jstring JNICALL Java_jni_getChinese
(JNIEnv *, jobject, jstring);
#ifdef __cplusplus
}
#endif
#endif
============================
编写本地实现
============================
具体怎么写DLL等,我看我就不用讲了,所以我只是简单
摘写相关的代码。
//#include "jni.h"
JNIEXPORT jstring JNICALL Java_jni_getChinese
(JNIEnv *env, jobject obj, jstring s)
{
jchar * newstring;
jstring ret=0;
/*
//-- 测试第三部分 --
newstring=new jchar[1];
newstring[0]=27979;//中文'测'的unicode
ret=env->NewString(newstring,1);
delete []newstring;
*/
//-- 测试第一部分 --
wchar_t* p=L"测";
printf("\n[在NATIVE环境中]'测'的UNICODE=%d",*p);
newstring=(jchar*)p;
ret=env->NewString(newstring,1);
//-- 测试第二部分 --
const jchar * jstr;
jboolean copy='1';
jstr=env->GetStringChars(s,©);
wprintf(L"\n[从JAVA环境传入字符]%s\n",jstr);
env->ReleaseStringChars(s,jstr);
return ret;
}
============================
运行测试程序
============================
把编译后的DLL文件放在恰当的位置(不会不知道什么是恰当的位置吧)。
假如你真的不知道的话,告诉你一个最简单的方式,看看
java.library.path属性就知道了。
程序运行结果。
%JAVA_HOME%\bin\java jni
[在NATIVE环境中]'测'的UNICODE=27979
[[从NATIVE环境返回字符]测
[在JAVA环境中]'测'的UNICODE=27979
============================
解释测试过程
============================
由于JAVA是UNICODE运行时的,我很懒,自己不可能写字节码与UNICODE之间的转码程序。
网上有的,实际上很多TELNET客户端程序都是自己带有的。但是我们就运行在WINDOWS环境下
当然就直接使用他的UNICODE支持了(UNIX环境当然也有相应的支持)。
(1)确认我们使用UNICODE支持。请仔细阅读TCHAR.h文件,不管你是为了本次测试还是为了提高你WINDOWS编程的熟悉
。
类型使用wchar_t作为本地字符UNICODE支持。
(2)自己熟悉一下JNI接口关于UTF和UNICODE操作的相关函数。
(3)自己仔细看看上面的代码就可以了.
赞助商链接