V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  laiwei  ›  全部回复第 8 页 / 共 13 页
回复总数  251
1  2  3  4  5  6  7  8  9  10 ... 13  
2012-04-02 19:30:13 +08:00
回复了 laiwei 创建的主题 分享创造 个人关键字抽取,都来贴一下自己的关键字
使用mongodb的一个小坑,导致昨天出现了一些问题

thepast.me使用mongodb来存储文本数据
使用的是linode的vps,装系统的时候,选择了32位的debian
结果在32位下,mongodb的数据文件size有2G的限制
64位没有这个限制。

http://blog.mongodb.org/post/137788967/32-bit-limitations
2012-04-01 13:46:07 +08:00
回复了 laiwei 创建的主题 分享创造 个人关键字抽取,都来贴一下自己的关键字
@Link 第一次 很有深意啊,哈哈
2012-03-31 23:43:27 +08:00
回复了 yutify 创建的主题 Android Android 4.0.4 成功 OTA 的来签个到好吗,说说你的机型信息神马的
xoom 已收到
2012-03-27 23:51:52 +08:00
回复了 skydiver 创建的主题 Markdown 不知道 Markdown 最近为什么火了
因为github的缘故 +1
2012-03-25 16:37:22 +08:00
回复了 sNullp 创建的主题 中国科学技术大学 南七技校生前来报道
@flyingfox 哈,你好呀^^
2012-03-21 11:30:21 +08:00
回复了 sNullp 创建的主题 中国科学技术大学 南七技校生前来报道
报道贴 + 10086
2012-03-20 17:08:38 +08:00
回复了 bjshdq 创建的主题 Kindle 有没有 "打包博客全部文章为一本书并发送到 Kindle" 的服务?
@linsk 看看http://thepast.me, 目前只完成了聚合自己的新浪微博,豆瓣,twitter,腾讯微博,并生成PDF,可下载。

wordpress的聚合暂时还没开始,https://github.com/laiwei/thepast/issues/3

会优先做“个人关键字提取” 功能 https://github.com/laiwei/thepast/issues/5


不过,因为最近工作很忙,所以会在周末做。
2012-03-07 19:18:36 +08:00
回复了 sutar 创建的主题 问与答 请教一个抓取tweets的问题
哈,你采集的是什么tweets呢?是自己的?其他用户的?
@paloalto 是这个道理,我就是这么做的…………
2012-03-07 18:46:25 +08:00
回复了 sutar 创建的主题 问与答 请教一个抓取tweets的问题
嗯,twitter的消息,都是要经过用户授权的。

你可以申请一个appkey,然后做一个应用,让用户授权,然后你访问数据。

就是这么个过程,没有捷径^^
2012-03-04 21:04:25 +08:00
回复了 Livid 创建的主题 Flask 有没有用 Flask 做的比较大的开源项目?
http://thepast.me 就是用flask写的。

flask真心不错
2012-03-01 16:11:52 +08:00
回复了 flyphy 创建的主题 程序员 解析html,如何获取无标签文本
pastebin.com/q0FZ1bNJ

请看看我写的这段代码
2012-02-28 13:48:17 +08:00
回复了 dongbeta 创建的主题 问与答 你们都有什么坑没填?
@laiwei 可以去下载了,总共1.4M, 80多页
2012-02-28 13:38:01 +08:00
回复了 dongbeta 创建的主题 问与答 你们都有什么坑没填?
@liuers hi 因为是部署在vps上,考虑到性能的问题,现在只生成前250条数据。
我去手动给你生成一份全的吧
2012-02-27 16:19:47 +08:00
回复了 dongbeta 创建的主题 问与答 你们都有什么坑没填?
@sun019 嗯,谢谢鼓励,希望你分享给更多需要的人呀
2012-02-27 16:19:13 +08:00
回复了 dongbeta 创建的主题 问与答 你们都有什么坑没填?
@liuers 哈,感谢你分享了这么多。我很早之前也是滔滔的用户,并且一度对taotao类的域名超感兴趣。

另外,你的1026条推 已经全部同步过来了,明天你可以下载到整个1000条推的pdf文档了。
1  2  3  4  5  6  7  8  9  10 ... 13  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2330 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 27ms · UTC 15:58 · PVG 23:58 · LAX 07:58 · JFK 10:58
Developed with CodeLauncher
♥ Do have faith in what you're doing.