JNI中文处理问题小结

　2007-03-15 21:53:28　来源：WEB开发网　　　

核心提示：由于工作关系，需要利用JNI在C++与Java程序之间进行方法调用和数据传递，JNI中文处理问题小结，但以前总是在英文环境下工作，对中文（其他语言编码同理）问题反倒没有太关注，则可能造成编/解码错误，这个问题在编译一个从别的环境传过来的文件时可能发生； 2、虽然在Java内部（即运行期间，最近抽了点时间研究了一下，将自

由于工作关系，需要利用JNI在C++与Java程序之间进行方法调用和数据传递，但以前总是在英文环境下工作，对中文（其他语言编码同理）问题反倒没有太关注，最近抽了点时间研究了一下，将自己的体会整理如下，供大家讨论或参考。

在进一步讨论之前，有几点基础知识需要说明：

在Java内部，所有的字符串编码采用的是Unicode即UCS-2。Unicode是用两个字节表示每个字符的字符编码方案。Unicode有一个特性：它包括了世界上所有的字符字形。所以，各个地区的语言都可以建立与Unicode的映射关系，而Java正是利用了这一点以达到异种语言之间的转换；

UTF-8是另一种不同于UCS-2/UCS-4的编码方案，其中UTF代表UCS Transformation Format，它采用变长的方式进行编码，编码长度可以是1~3（据说理论上最长可以到6，不懂）。

由于UCS-2/UCS-4编码定长的原因，编码产生的字符串会包含一些特殊的字符，如（即0x0，所有0~256的字符Unicode编码的第一个字节），这在有些情况下（如传输或解析时）会给我们带来一些麻烦，而且对于一般的英文字母浪费了太多的空间，此外，据说UTF-8还有Unicode所没有的纠错能力（不懂！），因此，Unicode往往只是被用作一种中间码，用于逻辑表示。关于Unicode/UTF-8的更多信息，见参考1；

Java中文乱码问题在很多情况下都可能发生：不同应用间，不同平台间等等，但以上问题已有大量优秀的文章讨论过，这里不作深入探讨，详见参考2、3、4、5。下面简要总结一下：

当我们使用默认编码方式保存源文件时，文件内容实际上是按照我们的系统设定进行编码保存的，这个设定值即file.encoding可以通过下面的程序获得：

public class Encoding {
　　public static void main(String[] args) {
　　　　System.out.println(System.getProperty("file.encoding"));
　　}
}

javac在不指定encoding参数时，如果区域设定不正确，则可能造成编/解码错误，这个问题在编译一个从别的环境传过来的文件时可能发生；

2、虽然在Java内部（即运行期间，Runtime）字符串是以Unicode形式存在的，但在class文件中信息是以UTF-8形式存储的（Unicode仅被用作逻辑表示中间码）；

1 2 3 4 下一页

Tags：JNI处理 问题

编辑录入：爽爽　[复制链接] [打印]

赞助商链接

热点阅读

焦点图片

精彩阅读

JNI中文处理问题小结

Tags：JNI处理 问题

更多精彩

驱动人生2009新版助推升级wind7

玩转Windows Vista用户头像更改

ps抽出滤镜的使用

photoshop校色: 调出猫咪中性灰

两种方法解决Windows 7不识别DVD光驱问题

赞助商链接

热点阅读

焦点图片

Android获取SD卡总容量...

Photoshop调出内衣美女...

Windows7系统下有线网...

解决FF浏览器和IE下载...

最新推荐

精彩阅读

JNI中文处理问题小结

Tags：JNI处理 问题

更多精彩

赞助商链接

热点阅读

焦点图片

最新推荐

精彩阅读

Tags：JNI处理问题