V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  xuanwu  ›  全部回复第 27 页 / 共 35 页
回复总数  681
1 ... 19  20  21  22  23  24  25  26  27  28 ... 35  
2018-10-31 14:40:17 +08:00
回复了 xuanwu 创建的主题 程序员 各位都在什么源码站上在线看代码?
@micean
@ray1888 并非在线浏览代码, 而是对网页中的代码段进行命名和少数文本常量的翻译.

@babedoll 请见 #11 和 #64, 长句翻译还远.

@loshine1992 多谢. 也许可以作为批量翻译功能的参考.
2018-10-31 14:33:41 +08:00
回复了 xuanwu 创建的主题 程序员 各位都在什么源码站上在线看代码?
@jay4497 多数语言的编译器已经支持中文命名了吧, 为何还要"翻译成实际代码"?
2018-10-31 13:13:59 +08:00
回复了 xuanwu 创建的主题 程序员 各位都在什么源码站上在线看代码?
@misaka19000 关键词的翻译确实很值得商榷. 之前有相关讨论: https://github.com/program-in-chinese/overview/issues/40
欢迎推荐更合适的翻译.
2018-10-31 12:56:10 +08:00
回复了 xuanwu 创建的主题 程序员 各位都在什么源码站上在线看代码?
@Admstor 嗯, 其实设想中的一个目标是"让用户可以选择是否中文化关键词": https://github.com/program-in-chinese/webextension_github_code_translator/issues/3
如果关键词不汉化, 理想情况下翻译出的结果应该可以编译(假设该语言支持 Unicode 命名, 大多数排行靠前的应该都有支持的编译器)
2018-10-31 12:52:49 +08:00
回复了 xuanwu 创建的主题 程序员 各位都在什么源码站上在线看代码?
@janus77 多谢提醒. 已为重名检验添加 issue: https://github.com/program-in-chinese/webextension_github_code_translator/issues/16

刚实测:
`SelectItem` -> `选定项`
`chooseItem` -> `选取项`
现在这个英汉词典数据还蛮给力的, 实测中暂时没有发现重名情况.
2018-10-31 12:45:34 +08:00
回复了 xuanwu 创建的主题 程序员 各位都在什么源码站上在线看代码?
@flyingghost 多谢宝贵建议!

关于 0, 基本同意. 个人估计用户群还是很大的, 应该在万级以上.

> 按层级翻译(比如类名 > 方法名 > 变量名)。细节实现就放着好了。层级设置可控就更好了。

很同意. 其实之前还做了一个 Java 实现的对 Java 源码进行层级翻译的服务: https://zhuanlan.zhihu.com/p/45236358 主要难点是源码分析. 那个服务基于 Roaster, 它支持类 /方法 /变量的分析(实现细节除外), 这已经可以做到层级可控, 但问题是扩展到其他语言工作量较大(即使用 antlr4)

> 对于命名的翻译,一定别忘了借鉴下划线、驼峰等天然分词符。人家都帮你分好了不用白不用。

应该已经实现了, 如`loadData`->`加载数据`, `gtk_window_set_default_size`-> `gtk_窗口_设置_默认_大小`

> 仅针对快速阅读理解来说,注释的重要性远大于源码实现细节。

嗯, 但这个插件项目现在是很简单的直译, 暂未发现 JS 的机翻库, 与第四点一同恐怕要慢慢积累技术(命名本身也存在上下文问题, 如 #29 指出的)才能接近句级别翻译.

> 一定要做语法解析,至少做到词法解析吧。源码这种东西,千万不能按文本处理。

上面那个 Java 源码翻译服务做了. 这个插件暂时倚靠的是在线代码网站本身的解析(直接挖它 HTML 中的代码段, 进行直接的词级替换. 所有高亮都用的相同 CSS 规则). 除了关键词之外, 命名部分和自然语言的机翻有何区别呢? 能想到的就是方法名更倾向于动词短语, 类 /变量名更倾向于名词短语, 还有吗?
2018-10-31 11:21:36 +08:00
回复了 xuanwu 创建的主题 程序员 各位都在什么源码站上在线看代码?
@beny2mor 做过调研, 发现在线翻译服务的代码翻译结果不大好:
https://zhuanlan.zhihu.com/p/44169542
2018-10-31 11:20:16 +08:00
回复了 xuanwu 创建的主题 程序员 各位都在什么源码站上在线看代码?
@HeiXiaoBai 不好意思 #50 那句话是对 @bbbai #44 的回应
2018-10-31 10:50:58 +08:00
回复了 xuanwu 创建的主题 程序员 各位都在什么源码站上在线看代码?
@no1xsyzy
翻译质量肯定有很大改进空间 #11
没有使用任何在线翻译服务, 用的是另一个离线英汉词典插件: https://chrome.google.com/webstore/detail/%E7%A6%BB%E7%BA%BF%E8%8B%B1%E6%B1%89%E8%AF%8D%E5%85%B8/ndifefelacmidghjaehmhicbchbidhpe
2018-10-31 10:47:49 +08:00
回复了 xuanwu 创建的主题 程序员 各位都在什么源码站上在线看代码?
@HeiXiaoBai
@bbbai
0.0.5 版已经改进了, 现在大多数关键词都已经手动翻译. 此段代码效果如下(无权限贴图):
imgur /8hBA6y2
2018-10-31 07:51:31 +08:00
回复了 xuanwu 创建的主题 程序员 各位都在什么源码站上在线看代码?
@mohoumk2 是的.

@yuanfnadi 欢迎分享经验. 组里有些关于命名风格的讨论, 不知是否在实践中使用什么命名规范, 如前缀 /后缀等?

刚初步实现码云代码段翻译. 草率更新了版本 0.0.8, 如爆低级问题请海涵指点.
2018-10-31 07:21:55 +08:00
回复了 xuanwu 创建的主题 程序员 各位都在什么源码站上在线看代码?
@HeiXiaoBai 见#3, 注释和长语句没有翻译.
在那之前要积累一些机器翻译的技术(JS 实现).
当前仅命名部分也需很多改进, 比如最简单的单复数: https://github.com/program-in-chinese/webextension_github_code_translator/issues/12
如有对 NLP 中文处理有兴趣和经验的欢迎参与.
2018-10-31 06:53:43 +08:00
回复了 xuanwu 创建的主题 程序员 各位都在什么源码站上在线看代码?
@msg7086 插件主要是为了快速了解代码大概内容. 注释部分和文本常量中的长语句暂未翻译.
nobodxbodon 多谢
2018-10-26 14:29:15 +08:00
回复了 xuanwu 创建的主题 推广 浏览器(Chrome&火狐)插件 - 离线英汉词典 v0.0.5
0.0.6
1. 修正: https://github.com/program-in-chinese/webextension_english_chinese_dictionary/issues/5#issuecomment-433296484
2. 续 0.0.5 的#2, 弹窗中显示处理后的英文, 比如, 查询"Task", 弹窗中会显示"task".
2018-10-25 14:17:21 +08:00
回复了 xuanwu 创建的主题 程序员 有哪些开源的知识库(数据, 非软件)?
不成熟的想法, 用代码编写数据而不是借助数据库工具. 用简单的历史数据+Python 做了个原型: https://github.com/program-in-chinese/overview/issues/97#issuecomment-432862303
现在觉得也许 JS 实现也不错, 可以直接用在浏览器插件里.

数据结构设计还需要改进, 可能参考这个历史人物数据库:
https://www.zhihu.com/question/61607216/answer/190251150
2018-10-25 13:35:32 +08:00
回复了 xuanwu 创建的主题 程序员 有哪些开源的知识库(数据, 非软件)?
@googlefans gg 家的, 数据不开源吧?
2018-10-25 09:06:27 +08:00
回复了 xuanwu 创建的主题 程序员 有哪些开源的知识库(数据, 非软件)?
@Cbdy 这个是软件不是数据吧?
2018-10-25 02:18:55 +08:00
回复了 xuanwu 创建的主题 程序员 有哪些开源的知识库(数据, 非软件)?
找到一篇文章有些资源: https://zhuanlan.zhihu.com/p/41118663
http://openkg.cn/ 汇聚了一些数据, 一部分可下载, 好像更多的是提供了 API. 暂时没有发现大规模的开放数据集.
2018-10-23 23:01:40 +08:00
回复了 ccnccy 创建的主题 程序员 国内程序员那么多, envato BAT 居然没仿
感觉实名+信用体系建起来之后慢慢各种恶意行为都会减少, 这种类型的站应该会多起来.
1 ... 19  20  21  22  23  24  25  26  27  28 ... 35  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1044 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 19ms · UTC 18:19 · PVG 02:19 · LAX 10:19 · JFK 13:19
Developed with CodeLauncher
♥ Do have faith in what you're doing.