首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
Kamitora
V2EX  ›  问与答

需要对万行级别的 Excel 进行关键字 ETL,哪种方向靠谱?

  •  
  •   Kamitora · 77 天前 · 719 次点击
    这是一个创建于 77 天前的主题,其中的信息可能已经有所发展或是发生改变。

    看上去很简单的需求

    给我的数据源是几个万行级的 Excel 和一个 Word ( Spotfire )导出的 CSV,从中提取出有用的关键字,并判断每一行的第一个单元格内是否存在这些关键字。

    我觉得不行..

    上级给我的建议是通过一些 Excel 公式去解析

    • 首先我不会 Excel 公式
    • 其次上个人留下的公式我看了下完全没有想去学这个的欲望。

    我的几个想法

    • C# 方向
    • Python 方向
    • VB 方向

    然而以上三个在这方面都没有经验,哪个上手比较快且靠谱?我盲猜一个 C#,还有其他方法的话请各位指教,谢谢。

    13 回复  |  直到 2019-11-08 10:41:09 +08:00
    qsnow6
        1
    qsnow6   77 天前
    VBA 方向
    benjix
        2
    benjix   77 天前 via iPhone
    感觉这需求 excel 公式几分钟就算完了
    TimePPT
        3
    TimePPT   77 天前
    Python + Pandas 干这事不要太爽
    Pho3nix
        4
    Pho3nix   77 天前
    Python + Pandas+1
    Dabaicong
        5
    Dabaicong   77 天前
    万行。。。。excel 公式就足够了。
    yesterdaysun
        6
    yesterdaysun   77 天前   ♥ 1
    python 比较合适, 听你的意思是要分词统计, 筛选关键词, 再做过滤统计分析啥的, python 直接全套 numpy, pandas, dataframe, sklearn 啥的, excel/csv 读取保存方便的很.

    虽然万行级听上去很多, 其实这个数量级还没到瓶颈, 瓶颈是你的需求, 如果只是直接指定关键词的筛选, 或者统计, 关联查找, Excel 公式就能搞定, 就怕要做分词, 复杂的统计等一类公式很难做的部分.

    c#,vba 感觉数据处理方面不如 python, 一步到位, 上 python 吧
    Vegetable
        7
    Vegetable   77 天前
    excel 公式。
    fanzheng
        8
    fanzheng   77 天前
    去学一下公式吧……
    PinkLadyMage
        9
    PinkLadyMage   77 天前
    kettle
    wangkun025
        10
    wangkun025   77 天前   ♥ 1
    原则是:能用 excel 处理的,尽量用 excel 处理。

    你这个明显是能用 excel 处理的。
    别的办法都是浪费时间
    qwingmix
        11
    qwingmix   77 天前   ♥ 1
    杀鸡焉用牛刀,我们 pandas 都是用来出来百万行级别以上数据的。
    你这个就 excel。
    没有学的欲望我教你,就去淘宝或者 excelhome 外包出去,几十块钱买个公式。
    exip
        12
    exip   77 天前 via Android   ♥ 1
    excel 公式都不想学,你选这三个方向哪个都比 excel 公式复杂
    lollxxox
        13
    lollxxox   76 天前
    在 windows 下,65536 行内,excel 是最低成本解决方案.....除非是每日程式化工作统计(其实 vba 也足够了),另外 3 个方向都是大炮打蚊子。。。
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   1480 人在线   最高记录 5168   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.3 · 27ms · UTC 16:36 · PVG 00:36 · LAX 08:36 · JFK 11:36
    ♥ Do have faith in what you're doing.