V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  xuanwu  ›  全部回复第 30 页 / 共 35 页
回复总数  681
1 ... 22  23  24  25  26  27  28  29  30  31 ... 35  
2018-10-13 11:26:50 +08:00
回复了 xuanwu 创建的主题 推广 火狐浏览器插件 - 离线英汉词典
@Mijjj 有的. 刚本地测试过 Chrome 下可以运行, 但界面需要改进. 如发布在 chrome web/extension store, 会更新此贴告知.
2018-10-09 01:34:01 +08:00
回复了 heamon7 创建的主题 程序员 一个入坑传统行业的码农之感悟
赞 和前几年开发西部类似
2018-10-08 15:05:54 +08:00
回复了 xuanwu 创建的主题 奇思妙想 有没有针对源代码的在线翻译服务?
Java 源码英翻中进展-内测上线: https://zhuanlan.zhihu.com/p/46207832
2018-10-01 05:00:46 +08:00
回复了 v2register 创建的主题 程序员 感谢 xuanwu 制作五笔编码编校软件 Python 版
个人力量有限. 感觉各种非 IT 领域的业余项目对于编程的需求挺大的, 而有空的程序员资源也不少(如果恰好是对该领域有兴趣的相信会尽量挤时间参与). 如果都能通过某个公开渠道共享此类需求, 并且将开发的工具开源, 应该可以共享资源, 也减少重复劳动.
比如说在 github 上开个 repo, 有需求的就开 issue 详述, 有兴趣的就参与. 或者其他有更合适的平台?
2018-09-24 07:42:09 +08:00
回复了 xuanwu 创建的主题 奇思妙想 有没有针对源代码的在线翻译服务?
前端:
添加了语法高亮 (基于 CodeMirror).
考虑设置为根据内容自动调节编辑器高度, 以便通过浏览器滚动条同时滚动两个浏览器 (类似谷歌翻译等).
还需调整字体大小, 现在翻译后带中文的行宽一些, 两边代码并不同样长度.

语法分析部分:
支持了数组类型的翻译.
#35 的 QueenBee 项目, 据了解, 系统设计已完成. 会有一系列论文发表. 预计三个月后开源在 github. 有兴趣的可以持续关注.
2018-09-21 04:21:40 +08:00
回复了 nowcoder 创建的主题 程序员 创业四年了,好快啦
请教一下前端问题, 在线编程编辑器好像是基于 CodeMirror 的? 不知支持每种语言的定制开发工作量大概是多少? 这个想法( https://www.v2ex.com/t/484895 应该没有竞争关系哈)里也需要语法高亮, 不过其他功能(自动补全等等)应该不大用. 如果仅是作高亮, 不知有没有更轻量的库可以实现?
多谢.
2018-09-20 19:14:56 +08:00
回复了 yidinghe 创建的主题 程序员 什么样的代码一看就知道是新手?
第二点. 中文命名是无论新老手都适用的, 越是与非 IT 业务相关越可显出优势: https://www.v2ex.com/t/477109#reply0
@nicoljiang
是否值得也许要靠后人评判, 不过肯定是有其他人在关注的. 在论文库里搜搜也可以看到 p2p search engine 一直都在研究. 比如这篇最近的"Decentralized Search on Decentralized Web": https://arxiv.org/pdf/1809.00939.pdf

"QueenBee aims to revolutionize the search engine business model by offering incentives to both content providers and peers that participate in QueenBee ’ s page indexing and ranking operations. "

示意图中也有广告收入由计算节点和网站内容提供者分享的商业模式构想.
2018-09-19 07:53:14 +08:00
回复了 xuanwu 创建的主题 奇思妙想 有没有针对源代码的在线翻译服务?
很简陋的网页界面用于演示上面的封装服务. 在线演示地址: http://74.91.17.250:9000/

测试用例:

https://gist.github.com/nobodxbodon/25fd1d59027181ed317d7ca17ac5f153

点击"翻译"即可
@nicoljiang 从商业运营和推广的角度说 Yacy 当然不算"成功". 但它的存活证明, 即使是如此理想化并且不掺杂任何商业因素的搜索引擎项目也有相当的用户群和社区.
个人认为加上合理透明的商业模式, 在现有 P2P 的技术和架构上继续改进, 并不是没有可能实现可与集中式搜索引擎并肩的产品.
另外, 个人重心并不在此. 请勿误会. 此帖仅为有类似想法的提供一个讨论的去处. 比如 https://www.zhihu.com/question/46622280
2018-09-18 07:30:02 +08:00
回复了 v2register 创建的主题 程序员 求有空的程序员朋友写一个五笔编码查询与编辑软件
写了个原型: https://github.com/CNMan/UnicodeCJK-WuBi06/issues/20 很丑而且缺功能. 不知是否楼主还需要.
@nicoljiang 嗯, 本身是个开放问题. 要是已经有明确的思路 /技术 /具体路线图的话, 也不至于这么问.

刚看到这个: http://www.michaelnielsen.org/ddi/how-to-crawl-a-quarter-billion-webpages-in-40-hours/

如果有一个比较公平透明的基于计算贡献获取回报的模式(比如现在由搜索引擎获得的广告收入的一部分由计算节点获取的话), 也许会吸引大计算资源(TB 级别存储, 大带宽)的服务器作为骨干节点.
@nicoljiang 多谢. 下面是另一些谷歌搜索服务器的估计: https://www.quora.com/How-many-servers-does-Google-have-to-run-for-providing-the-search
仅作参考. 关于这个估算问题就止于此吧.

关于爬虫问题, 参考 Yacy, 觉得一般使用它的用户都会了解它的背景. 而且它并不主动抓取, 而是由用户指定网站进行抓取. 不过个人觉得在资源允许的情况下进行低频和小量的主动(后台)抓取也是可行的, 比如设定 100MB 的硬盘限额(用户可调), 以及最低优先级的网络使用. 另外, 可以允许有计算资源的用户从其他用户那里搜集抓取结果(类似骨干节点), 而主站肯定是个骨干节点.
@nicoljiang 嗯. 之前以为 Web Server 还会起一部分缓存搜索结果的作用, 但看起来没有.
还是对#23 的三个问题有些疑虑.
不过这个想象中项目的开始肯定不会指望达到任何现有搜索引擎的性能, 更多的优势在于公开算法和数据吧.
2018-09-16 03:09:44 +08:00
回复了 xuanwu 创建的主题 奇思妙想 有没有针对源代码的在线翻译服务?
Java 源码英翻中库以及服务原型 https://zhuanlan.zhihu.com/p/44644112
在前文代码翻译尝试-使用 Roaster 解析和生成 Java 源码的基础上, 作了一些改进. 主要有:

- 对一般词汇使用普通英汉词典进行直译(优先选取计算机领域词义或者第一个词义)
- 支持术语词典, 比如'instance', 上面的英汉词典中的第一个词义是'建议', 于是在术语词典中添加此项, 暂时译为'个例
- 支持驼峰命名和下划线分隔法命名
- 各种忽略. 详见命名翻译.java:
- 一些歧义太多的词, 如 to for of
- 单字符字段如 M
对释义进行清理, 如括号中的内容, 特殊符号等等
@nicoljiang 主要觉得把 web 服务器和后端的储存检索这么直接联系起来有点问题
这里谷歌工程师提到负责 query 的是 web 服务器
https://www.quora.com/Google-processes-40k-searches-per-second-On-average-a-web-server-can-handle-1000-requests-per-second-Does-that-mean-Google-can-run-using-only-40-web-servers
看各种回答感觉这些直接负责 qps 的机器可能在千 /万台级别 当然配置都很高。
@nicoljiang 多谢详细分析. 几个问题:

- "单台服务器能顶 5KW 条记录". 这是按照硬盘存储限制得出的吗?

- 第二点的 60 万台服务器提供 5000QPS 是如何得出的?

- 处理 60k 的 QPS 需要 12 个处理 5 千 QPS 的完整实例吗?

关于 qps 的一些资料:
https://www.csdn.net/article/2013-12-30/2817959-look-at-12306
在只采用 10 几台 X86 服务器实现了以前数十台小型机的余票计算和查询能力,单次查询的最长时间从之前的 15 秒左右下降到 0.2 秒以下,缩短了 75 倍以上。2012 年春运的极端高流量并发情况下,支持每秒上万次的并发查询,高峰期间达到 2.6 万 QPS 吞吐量,整个系统效率显著提高。

https://www.jianshu.com/p/608da9336acb
单台实例连接 redis,能达到 2 万的 QPS,四台实例的时候,每台 1 万 5 的 QPS
2018-09-14 16:31:42 +08:00
回复了 nilrust 创建的主题 程序员 国内有存在代码质量审计公司吗
国外有吗?
1 ... 22  23  24  25  26  27  28  29  30  31 ... 35  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1062 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 27ms · UTC 18:07 · PVG 02:07 · LAX 10:07 · JFK 13:07
Developed with CodeLauncher
♥ Do have faith in what you're doing.