短信发送接收时的UCS2编码转换处理

陈振阳

已于 2022-09-27 19:28:16 修改

阅读量9.4k

点赞数 2

分类专栏： CMPP30 文章标签： java servlet 开发语言

于 2016-03-10 20:57:35 首次发布

本文链接：https://blog.csdn.net/xichenguan/article/details/50850039

版权

CMPP30 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

其实UCS2这种编码不像GB2312、UTF-8等，它并不属于任何语系的语言编码，实际上是一种编码格式的世界语。在这个世界上所有可以在计算机中使用的语言都有对应的UCS2编码。
正是因为Java采用了UCS2，因此，在Java中可以使用世界上任何国家的语言来为变量名、方法名、类起名，如下面代码如下：

public class 中国
{
    public String 雄起()
    {
         return "中国雄起";
    }
}
中国 祖国 = new 中国();
System.out.println(祖国.雄起());

实际上，也可以使用其他的语言来编程，如下面用韩文和日文来定义个类：

class 수퍼맨
{
    public void スーパーマン() { ... }
}

由于Java内部使用的是UCS2编码格式，因为，Java并不关心所使用的是哪种语言，而只要这种语言在UCS2中有定义就可以。
在UCS2编码中为不同国家的语言进行了分页，这个分页也叫“代码页”或“编码页”。中文根据包含中文字符的多少，分了很多代码页，如cp935、cp936等，然而，这些都是在UCS2中的代码页名，而对于操作系统来说，如微软的windows，一开始的中文编码为GB2312，后来扩展成了GBK。其实GBK和cp936是完全等效的，用它们哪个都行。

=华丽丽的分隔符===
上面都是废话了，这里关键想说的是，怎么从UCS2转为GBK?以及怎么从GBK转为UCS2?
网上有人提供了个方法：

 public static String decodeUCS2(String src) {
  byte[] bytes = new byte[src.length() / 2];

  for (int i = 0; i < src.length(); i += 2) {
   bytes[i / 2] = (byte) (Integer.parseInt(src.substring(i, i + 2), 16));
  }
  String reValue;
  try {
   reValue = new String(bytes, "UTF-16BE");
  } catch (UnsupportedEncodingException e) {
   throw new RuntimeException(e);
  }
  return reValue;
 }

但这个并不好使，其实你拿到UCS2字节数组时（首先肯定是字节数组，编码都不确定，谁会去给它转成String?），直接：

 String reValue = new String(bytes, "UTF-16BE");

就行了。
至于把中文转成UCS2，则可以用：

content.getBytes("UnicodeBigUnmarked")

陈振阳

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
短信发送接收时的UCS2编码转换处理

其实UCS2这种编码不像GB2312、UTF-8等，它并不属于任何语系的语言编码，实际上是一种编码格式的世界语。在这个世界上所有可以在计算机中使用的语言都有对应的UCS2编码。正是因为Java采用了UCS2，因此，在Java中可以使用世界上任何国家的语言来为变量名、方法名、类起名，如下面代码如下：public class 中国{ public String 雄起() {
复制链接

扫一扫