V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  jamiesun  ›  全部回复第 45 页 / 共 46 页
回复总数  905
1 ... 37  38  39  40  41  42  43  44  45  46  
你不可能像招聘java人员这样轻易招到python开发人员,想想吧,招聘10个java开发人员多简单,大学的,北大青鸟等机构的,批发价,要多少有多少。

但是你想组一个10人的python团队,即使是初级班的都难,中高级班简直是奢侈。如果python开发人员好找,傻瓜才去批发Java开发人员。

效率,性能从来不是核心问题。

java发展这么多年,自然有她的本钱,很多现成的资源,方案,利于厂商更好忽悠骗钱。真正飞上java不可的项目没那么多,很多企业跟不就是稀里糊涂的上了船,没有自己的判断和没有选择的能力,自然也没的选择。

另外是长期以来的观念问题,根深蒂固,一个杯子盛满水,就再装不下了,接受新的东西是很难的。
谭好强,不怎么的说,体制下的东西
2012-09-24 16:06:38 +08:00
回复了 Livid 创建的主题 编程 最近遇到的一个架构问题
我做过的一个系统和这个很相似,就是一个dns日志分析系统,一台DNS服务器,8核cpu8G内存1T硬盘,每日解析量4000W,大概每天8G-10G的数据文件,最多保存2个月日志,

需求:

1,需要提供详细日志查询,根据客户IP或域名查询,这个查询压力很大,在单台服务器上,我只能做到按小时查询(几百万的量过得去),当然这个查询其实做到小时查询已经足够,相关管理员也就是想查查某个ip在某个时间点的活动情况。

2,需要单日ip在24小时的解析量趋势图
3,需要单日活跃ip top 10 -- 100统计图
4,需要单日单个域名在24小时的解析量趋势图
5,需要单日活跃域名top10 -- 100统计图


资源有限,只有两台服务器(主/备),所以神马分布式就别想了。服务器日志每小时统计一次,统计方法很简单,python+awk,统计后生成文本,每天的日志文件也切割重命名,对所有文件生成索引文件。

索引文件也不小,通过mmap映射后提供查询,实时统计表生成,cherrypy做的管理界面,目前运行还算稳定,不过我也不是很满意,在文件索引上耗费了大量功夫。感觉就是在设计一个数据库。

别提mysql了,超过200G后怎么优化都不顶用。别用啥数据库了,用的话也就是存储汇总数据。


如果有充足的服务器资源的话,我倒是建议对数据按特征切分然后分发处理,也就是map/reduce了

不过单机牛B我觉得没什么干不了的,我用过24核64G的机器处理几千万的数据,眼睛眨巴下就完成了。
2012-09-22 13:40:41 +08:00
回复了 youthcould 创建的主题 Sublime Text 直接在sublime text中发送转换好的markdown到evernote?
如何判断当前格式是markdown呢,根据文件扩展名?
2012-09-21 14:34:08 +08:00
回复了 liuhang0077 创建的主题 云计算 华为云计算 好像开始试运营了 [免费]
华为也要做互联网公司了
2012-09-12 20:48:05 +08:00
回复了 paulguo 创建的主题 程序员 求一些技术创业成功的案例。
感觉在ios领域创业的较多,但是要说成功的,还真难说,能活着已经是奇迹。
2012-09-12 20:46:31 +08:00
回复了 sivacohan 创建的主题 Java 响应群众号召,我来吐一吐JAVA
难道是用的ide自动生成的代码,那可能还不止5次哦,用eclipse生成webservice stub代码就是如此吧。
我用Java掉过webservice,直接用http发xml消息就好了,中间也就封装一次。一个来回也就是编解码两次吧
2012-09-02 21:42:52 +08:00
回复了 paloalto 创建的主题 Python web.py得到页面浏览数的办法
根据ip。或者cookie来计算
2012-08-07 21:21:53 +08:00
回复了 pigletfly 创建的主题 分享发现 Google Drive解封了?
真的可以了,铁通
2012-07-31 21:33:36 +08:00
回复了 zyyzj 创建的主题 程序员 大家觉得最能体现程序员特质的签名是什么?
return
2012-07-26 21:20:59 +08:00
回复了 sharpblade 创建的主题 Python 想用脚本做个GUI,用什么方案最好?
qt是个大家伙,不是比较大的软件不要用了,直接tk
2012-07-26 21:13:05 +08:00
回复了 wangkangluo1 创建的主题 程序员 来来来 调试重于开发 摆摆大家常用的的调试技巧
对于有异常处理支持的语言,尽可能的利用异常是比较好的,举个python的例子吧,比如string.index 找不到就抛异常,比如大多数时候字典 dict[key]就比dict.get(key)更有用,让异常更早的把问题暴露出来,而不是隐藏掉,使用断言 assert 这些远比GDB有用,gdb会造成强迫症,一点小小的东西就gdb。

print,logging,assert使用多了,你甚至直接猜到问题所在了。

c比较特殊,缺少一些流行高级语言的特性,比较痛苦。

尽可能的做到更严谨,减少不必要的调试。
2012-07-24 20:41:21 +08:00
回复了 bigporker 创建的主题 程序员 想买个Windows Phone 做开发用,求推荐个性价比高的
这个国外都是送的,唉
2012-07-24 20:40:22 +08:00
回复了 wangkangluo1 创建的主题 程序员 来来来 调试重于开发 摆摆大家常用的的调试技巧
print
2012-07-24 20:39:18 +08:00
回复了 jamiesun 创建的主题 程序员 发毒誓,以后再不通宵赶活了。
是为了重构一个系统,本来是打算3-5天干的活,因为思路一下子停不下来,从晚上8点开始,不知不觉天就亮了,一看时间过8点了,吃了半个西瓜倒头就睡,醒来的时候一看时间,日,又是8点多。不是因为周末的话,班都不想去上了,梦游一般。
@sampeng 不大的话确实不必要用得到bind,dnsmasq看介绍说适应50客户端以内。能折腾的话可以做个bind9的管理应用啊。上月正好做了一个bind9的web管理控制台的,直接解析修改bind9的配置文件,并不是很难,同时做了一个日志统计,客户有在线10000用户,每日解析量2000万--3000万。这个产品是给公司做的。不过我打算以个人名义另外做一个开源版本出来。
解析量大不大
2012-07-23 17:30:05 +08:00
回复了 jamiesun 创建的主题 程序员 发毒誓,以后再不通宵赶活了。
身体好,要珍惜啊,我现在熬夜后头就疼的厉害
俺在做程序之前就搞过3年的设计工作,还包括影视剪辑,电视广告制作,但是从不对面试及领导提起自己会这些。
2012-07-23 15:59:43 +08:00
回复了 normal 创建的主题 PHP 独立IP+CDN+IPV6+SSL的免费主机,你信吗?
@stackpop 讨论技术还是邮件列表比较好,论坛的话休闲话题多
1 ... 37  38  39  40  41  42  43  44  45  46  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2479 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 40ms · UTC 13:42 · PVG 21:42 · LAX 06:42 · JFK 09:42
Developed with CodeLauncher
♥ Do have faith in what you're doing.