V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
larkifly
V2EX  ›  Python

python mysql 插入数据问题:Warning: Incorrect string value: '\xF0\x9F\x9A\xB6\xE7\x81...' for column 'nickname' at row 1

  •  1
     
  •   larkifly · 2014-10-14 10:47:16 +08:00 · 8484 次点击
    这是一个创建于 3475 天前的主题,其中的信息可能已经有所发展或是发生改变。
    插入的数据是 \U0001f6b6\u7070\u5154\u5b50\U0001f430 \U0001f37c

    数据库已经设置为utf8编码了
    10 条回复    2014-10-14 20:36:16 +08:00
    larkifly
        1
    larkifly  
    OP
       2014-10-14 11:00:47 +08:00
    发现了,平时是3位utf8代表一个unicode字符,现在是4位utf8,表示一个unicode字符,请问如何统一成三位的了
    dorentus
        2
    dorentus  
       2014-10-14 11:07:59 +08:00
    UTF-8 并不是最长就是 3 字节的。

    解决方法可以参见: https://www.v2ex.com/t/137724#reply23
    Azone
        3
    Azone  
       2014-10-14 11:21:01 +08:00
    我记得 UTF-8 编码应该是 1-4 位变长的吧
    timonwong
        4
    timonwong  
       2014-10-14 11:27:14 +08:00
    @Azone
    就目前的Unicode范围来说,是1-6字节

    unicode codepoint range: 0x00000000 ~ 0x7FFFFFFF
    larkifly
        5
    larkifly  
    OP
       2014-10-14 11:39:58 +08:00
    @dorentus
    @Azone
    @timonwong

    我现在有个unicode对象:\U0001f6b6,如何把它变成字符串'0001f6b6',或者我只想要f6b6,该怎么做了
    timonwong
        6
    timonwong  
       2014-10-14 11:46:16 +08:00
    @larkifly
    你确定是 f6b6 而不是 1f6b6?
    Azone
        7
    Azone  
       2014-10-14 11:50:19 +08:00
    timonwong
        8
    timonwong  
       2014-10-14 12:40:38 +08:00
    @Azone
    嗯,你是对的,0~10FFFF 已包含目前全部定义的 code point
    jjliangxueyan
        9
    jjliangxueyan  
       2014-10-14 15:07:35 +08:00
    在插入的数据 的py文件里加入:
    import sys
    reload(sys)
    setdefaultecoding("utf-8")

    在连接数据库时候跟上 charset='utf8' 参数
    一般这样问题就解决了。
    larkifly
        10
    larkifly  
    OP
       2014-10-14 20:36:16 +08:00
    谢谢楼上各位,问题已经解决了,还是编码问题,emoji表情在mysql存储时应该用utf8mb4编码
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1019 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 22:59 · PVG 06:59 · LAX 15:59 · JFK 18:59
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.