JNI中文处理问题小结
2007-03-15 21:53:28 来源:WEB开发网核心提示:由于工作关系,需要利用JNI在C++与Java程序之间进行方法调用和数据传递,JNI中文处理问题小结,但以前总是在英文环境下工作,对中文(其他语言编码同理)问题反倒没有太关注,则可能造成编/解码错误,这个问题在编译一个从别的环境传过来的文件时可能发生; 2、虽然在Java内部(即运行期间,最近抽了点时间研究了一下,将自
由于工作关系,需要利用JNI在C++与Java程序之间进行方法调用和数据传递,但以前总是在英文环境下工作,对中文(其他语言编码同理)问题反倒没有太关注,最近抽了点时间研究了一下,将自己的体会整理如下,供大家讨论或参考。
在进一步讨论之前,有几点基础知识需要说明:
由于UCS-2/UCS-4编码定长的原因,编码产生的字符串会包含一些特殊的字符,如(即0x0,所有0~256的字符Unicode编码的第一个字节),这在有些情况下(如传输或解析时)会给我们带来一些麻烦,而且对于一般的英文字母浪费了太多的空间,此外,据说UTF-8还有Unicode所没有的纠错能力(不懂!),因此,Unicode往往只是被用作一种中间码,用于逻辑表示。关于Unicode/UTF-8的更多信息,见参考1;
Java中文乱码问题在很多情况下都可能发生:不同应用间,不同平台间等等,但以上问题已有大量优秀的文章讨论过,这里不作深入探讨,详见参考2、3、4、5。下面简要总结一下:
public class Encoding {
public static void main(String[] args) {
System.out.println(System.getProperty("file.encoding"));
}
}
javac在不指定encoding参数时,如果区域设定不正确,则可能造成编/解码错误,这个问题在编译一个从别的环境传过来的文件时可能发生; 更多精彩
赞助商链接