为什么这个 utf8 编码后面会多个 0？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 2647 天前的主题，其中的信息可能已经有所发展或是发生改变。

        Charset utf8 = Charset.forName("utf8");
        String ss = "I love you";
        ByteBuffer buffer = utf8.encode(ss);

        byte[] bytes = buffer.array();
        for (byte b : bytes){
            System.out.println(b);
        }

打印结果： 73 32 108 111 118 101 32 121 111 117 0 把"I love you"的'u'去掉得到： 73 32 108 111 118 101 32 121 111 没 0 啊？

8 条回复 • 2018-07-04 15:55:35 +08:00

ThirdFlame

2018-07-03 09:41:47 +08:00

00 代表结束？

codechaser

2018-07-03 09:43:47 +08:00

@ThirdFlame 你好，我刚刚把'u'去掉了也没有 0 啊？

Finest

2018-07-03 09:45:17 +08:00

C 里的结束字符\0?

codechaser

2018-07-03 09:51:24 +08:00

@hand515 这是 java，java 有结束字符吗？

sagaxu

2018-07-03 09:55:59 +08:00 via Android

https://stackoverflow.com/questions/11319499/java-bug-why-extra-zero-byte-in-utf8-encoding

codechaser

2018-07-03 09:57:39 +08:00

@sagaxu Thanks!

joyme

2018-07-03 10:32:08 +08:00

ByteBuffer 有 limit 和 capacity 成员变量，limit 是结束位，capacity 是实际的容量。应该根据 limit 去读实际的内容。

lcdxiangzi

2018-07-04 15:55:35 +08:00

没有看懂为什么 ByteBuffer 要这样设计呢？有人可以指点一下吗？