V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
jss
V2EX  ›  程序员

请教一下,最近在研究练字本,想通过拍照识别文字书写是否工整并给出评分

  •  
  •   jss · 245 天前 · 1505 次点击
    这是一个创建于 245 天前的主题,其中的信息可能已经有所发展或是发生改变。
    有什么思路指点一下
    20 条回复    2021-03-30 11:37:42 +08:00
    Kinnice
        1
    Kinnice   245 天前   ❤️ 1
    根据 ocr 识别的速度来评分,写的越规整,(理论上)识别就越快(猜的)
    crackhopper
        2
    crackhopper   245 天前
    乱说的哈
    1. 偏旁部首拆分,和标准的偏旁部首的占比,等等进行对照。
    2. 对偏旁部首本身的扭曲程度,手动标准打分,做模型进行训练。
    3. 对多个字体大小和位置,作为评估指标。
    4. 尝试拆解笔画,对笔画进行评估。
    当然,最简单暴力的就是直接找出一堆手写样本,标定分数,训练模型。后续从上面的几个角度扩展,以及从模型的 bad case 里找思路。
    crackhopper
        3
    crackhopper   245 天前
    数据预处理也是需要的,对齐,拉伸等等的。另外如果到笔画程度,可能需要用点几何特征。但我感觉针对特殊风格的手写体还是麻烦,比如行书。可以先限定楷体。
    PeakFish
        4
    PeakFish   245 天前
    你测试测试 颜真卿 王羲之的 能测试通过? 机器能懂得人类的美吗
    crackhopper
        5
    crackhopper   245 天前
    @PeakFish 做过才知道行不行。我觉得机器也是能理解美的。
    yaphets666
        6
    yaphets666   245 天前
    @crackhopper 应该拿颜真卿 王羲之的去训练就行了... 理解肯定是不能理解的
    rayhy
        7
    rayhy   245 天前
    直接检测每个字,然后看看每个字的 bounding box 足不足够对齐?
    wxw752
        8
    wxw752   245 天前
    工整这个概念很模糊,因为字体太多了。
    我觉得可以做到判断写的字和训练集所用字体的相似程度。
    crackhopper
        9
    crackhopper   245 天前
    @yaphets666 如果理解指的是合理打分,不一定,我觉得大概率能;如果理解指的是表达机器本身的情感,目前是不行。目前机器缺乏自我认知的建立的机制,我觉得是前馈网络本身的缺陷,但目前也就前馈网络容易训练和改进。
    PeakFish
        10
    PeakFish   245 天前
    @rayhy 开玩笑, 你看看 字帖 那字可是 , 有的大有的小
    pkookp8
        11
    pkookp8   245 天前 via Android
    @PeakFish 正楷的训练集输入一个草书,必然 0 分呀
    反过来,草书训练集输入一个正楷也一样

    而且草书也有不同风格
    PeakFish
        12
    PeakFish   245 天前
    @pkookp8 美是没有标准的
    namelosw
        13
    namelosw   245 天前 via iPad
    @PeakFish 美颜相机都能存在,书法为什么不行?很显然机器是可以很好地复现人的审美的。
    ch2
        14
    ch2   245 天前 via iPhone
    工整的评分标准由谁来定?这个并不是代码的问题,但是是最重要的,这个没有人解决你就什么也办不到,也会是你产品的核心竞争力,但是很遗憾,它并不在你的代码上
    flankechen
        15
    flankechen   245 天前
    请先定义什么是工整,cost function,然后扔进网络学习就可以拉
    cheneydog
        16
    cheneydog   245 天前
    “标准版” 和 “手写版” 二值化后异或,1 面积 /总面积 为评分
    raaaaaar
        17
    raaaaaar   245 天前 via Android
    找 20 个人,手动打分(狗头
    shuxiaokai
        18
    shuxiaokai   245 天前
    看你指定的标准是哪种字体了
    kergee
        19
    kergee   244 天前
    用过象辞 AI 智能练字笔套装
    q149072205
        20
    q149072205   244 天前
    你这要有一个字体做为参照字体,不然你这识别就不标准了。。
    关于   ·   帮助文档   ·   API   ·   FAQ   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   2784 人在线   最高记录 5497   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 11:37 · PVG 19:37 · LAX 03:37 · JFK 06:37
    ♥ Do have faith in what you're doing.