V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ben548
V2EX  ›  PHP

关于 mb_convert_encoding 的转码问题

  •  
  •   ben548 · 2015-12-30 19:56:23 +08:00 · 3766 次点击
    这是一个创建于 3012 天前的主题,其中的信息可能已经有所发展或是发生改变。

    代码如下:
    echo mb_convert_encoding('小春子', 'UTF-8', 'GB18030');
    echo mb_convert_encoding('灏忔槬瀛', 'GB18030', 'UTF-8');

    此时运行时看到:
    灏忔槬瀛小春��

    问题是:为什么小春子没有正常显示而是出现了乱码呢?
    注:文件编码和浏览器编码都是 utf-8

    5 条回复    2016-01-07 15:33:20 +08:00
    lynnworld
        1
    lynnworld  
       2015-12-30 20:29:43 +08:00
    那`echo mb_convert_encoding(mb_convert_encoding('小春子', 'UTF-8', 'GB18030'), 'GB18030', 'UTF-8');` 是啥?乱码输出不一定是全部的内容。
    ben548
        2
    ben548  
    OP
       2015-12-31 10:21:18 +08:00
    @lynnworld 试了下,结果如下:
    echo mb_convert_encoding('小春子', 'UTF-8', 'GB18030');
    echo mb_convert_encoding('灏忔槬瀛', 'GB18030', 'UTF-8');
    echo mb_convert_encoding(mb_convert_encoding('小春子', 'UTF-8', 'GB18030'), 'GB18030', 'UTF-8');

    运行结果是:
    灏忔槬瀛小春��小春��

    真是太奇怪了
    pine
        3
    pine  
       2016-01-05 09:02:25 +08:00
    小春子!=灏忔槬瀛,你的编码用的 utf8 ,一个字 3 个字节 3*3=9 , gb2312 ,一个字 2 个字节,所以小春子变成灏忔槬瀛的时候,还有一个字节没法正常显示被 php 忽略掉,在转为 utf8 的时候,只能显示两个字,另外两个字节无法正常显示,所以浏览器显示为��。
    还有就是 mb_convert_encoding 的用法不是你这么用的吧??
    ben548
        4
    ben548  
    OP
       2016-01-05 14:02:36 +08:00
    @pine 哦,总算是理解了,你说 mb_convert_encoding 不是这么用的是什么意思啊?
    pine
        5
    pine  
       2016-01-07 15:33:20 +08:00
    比如, mb_convert_encoding('小春子', 'UTF-8', 'GB18030');这个函数是把 gb18030 转成 utf8 的,而不是相反,这个和 iconv 不一样。其次,转码是因为有两个编码环境才需要转码,你这里只有 utf8 ,没见到用 gb18030 的环境啊
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2443 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 15:52 · PVG 23:52 · LAX 08:52 · JFK 11:52
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.