1
leezii 2013-10-15 15:49:02 +08:00
opencc
|
2
hustlzp 2013-10-15 16:02:17 +08:00
我有一个js转换函数,网上找的,原理很傻很粗暴:2个字符串,一个存繁体字,一个存对应的简体字,然后全局遍历,找到简体字的index,然后根据此index在繁体字符串中找即可...
https://gist.github.com/hustlzp/5334819 |
4
dorentus 2013-10-15 18:38:35 +08:00
opencc 有命令行或者 python、ruby 什么的库的吧,那么自己写个脚本转就好了……
不过你确定自动转出来的质量能接受么? |
5
alexrezit 2013-10-15 21:08:04 +08:00
纯字符替换是不可以的, 因为有很多词汇上的差异, 不同地区的繁体也是不一样的.
|
6
vibbow 2013-10-16 18:58:28 +08:00 1
微软有API,个人觉得简繁转换的准确率比Google的高(google的基本就是按字转换,微软的是按词组转换)。
之前实习的时候写过一个类似的东西: 扫描一个目录下所有的语言文件(xml文件,然后判断是不是语言文件),用正则提取出语言字符串,然后调用微软的接口,翻译,然后保存成新文件(会自动修改语言类型标记) 用PHP写的,花了大约2天的时间(碰到了微软的一个不科学的BUG,给Azure MarketPlace客服提交Ticket后才解决的...) |
7
vibbow 2013-10-16 19:02:27 +08:00
擦,没写完呢,不小心点回复了。
悲剧的是,我之前那个程序在硬盘挂了后就丢了。 微软的接口在这里申请: https://datamarket.azure.com/dataset/bing/microsofttranslator 接口API在这里:http://www.microsofttranslator.com/dev/ 总体来看微软的API比Google的厚道。 |
8
vibbow 2013-10-16 19:06:20 +08:00
微软这个API也有很多的坑,比如说每次提交请求的字数千万不能超,否则就直接报错。
XML请求里的特殊字符也要专门转义,否则也可能什么都不返回(连错误都不报!) |