这是一个创建于 2551 天前的主题,其中的信息可能已经有所发展或是发生改变。
假如我要从上市公司的财报里采集他们公司的贷款情况,但是这些公司财报风格各不相同,根本无法标记采集开始和结束,这种情况还能采集吗?
理想情况是把所有可能出现的“开始”词汇收集起来,比如“信用借贷”、“银行贷款”等等,然后收集这些词汇后面的数字,结束设定为出现非数字的就结束,没有数字就跳过,这样能做到吗?如果能,大概要多少钱?
2 条回复 • 2017-07-03 23:59:16 +08:00
|
|
1
qwjhb 2017-07-03 23:43:16 +08:00
能 不过上市公司财报风格不同但基本不太会变的吧 准确起见 还不如搭好框架 一家公司一家公司做模板
|
|
|
2
herozhang 2017-07-03 23:59:16 +08:00
有商业数据库,可以直接买这些数据啊,算是市场情报费用。
|