V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
syaoranex
V2EX  ›  分享发现

使用大模型翻译的成本居然比传统机器翻译便宜 25 倍

  •  
  •   syaoranex · 2023-11-25 04:54:24 +08:00 · 2228 次点击
    这是一个创建于 392 天前的主题,其中的信息可能已经有所发展或是发生改变。

    先说完整的结论:

    当前使用 [ API 定价为 0.005 元/千 Token ] 的 [国内某大模型] 进行 [英译中] 方向的翻译,其成本约是使用 [国内的几家大厂例如 XX 云] 的机器翻译 API 的 1/20~1/30.

    不敢相信!大家也可以看看下面的计算过程是否有纰漏。

    附上测试(随便)选用的英语文本、大模型翻译结果、传统机器翻译结果

    本次测试:

    翻译 Prompt 是很简单的一句话:"将下面的英文文章翻译成准确流畅的中文给我,不要遗漏原文信息:..."

    • 英语原文:字符数 6500 ,Token 数 1500 ,机器翻译输入字符计费 0.325 元(按 50 元/百万字符计算),大模型输入 Token 成本 0.0075 元。
    • 大模型中文译文:字符数 1750 ,Token 数 1100 ,大模型输出成本 0.0055 元;机器翻译输出字符不计费。
    • 合计:Token 数 2600 ,机器翻译成本 0.325 元,大模型翻译成本 0.013 元,机器翻译的成本约是大模型翻译的 25 倍。

    附 1:使用 gpt-3.5-turbo-1106 翻译上述例子的成本:

    • 输入 1300token ,输出 1900token ,合计费用 0.0051 美元,按照最新的汇率来算是 0.0362 元。约合 5.57 元/百万字符。机器翻译的成本约是 gpt-3.5-turbo-1106 翻译的 9 倍。

    (这里输入输出与上文的模型不同是因为两个模型采用了不同的分词方法)

    附 2:国内主要厂商机器翻译 API 定价:

    • 40 元左右/百万字符档位:彩云小译、搜狗翻译(已下线)
    • 50 元左右/百万字符档位:字节火山翻译、阿里翻译(通用版)、百度翻译、有道翻译、小牛翻译、讯飞翻译
    • 60 元左右/百万字符档位:腾讯翻译

    可以看到主要厂商的机器翻译 API 定价都在 50 元/百万字符左右,尽管使用量大的话肯定是会更便宜的,但应该是做不到大模型约 2 元/百万字符的成本档位。

    大模型翻译缺点:可能会遗漏少数原文信息,生成速度慢,存在审查机制可能拒绝翻译;机器翻译缺点:相较大模型不够流畅准确、贵。

    以前我以为使用大模型翻译英文很贵,但是在经过一番计算后,发现两者的成本有量级的差别,即使是使用 GPT-3.5 来翻译也是如此。

    试问如果上述计算准确,传统机器翻译产品如今还有什么意义呢?

    6 条回复    2023-11-25 10:03:25 +08:00
    F798
        1
    F798  
       2023-11-25 06:11:51 +08:00 via iPhone
    没意义。。
    terence4444
        2
    terence4444  
       2023-11-25 06:14:56 +08:00 via iPhone
    不说价格,就是翻译质量还高一个档次。
    codehz
        3
    codehz  
       2023-11-25 08:38:25 +08:00 via iPhone
    你说的这一点正是大模型取代传统模型/软件的原因
    guotie
        4
    guotie  
       2023-11-25 08:45:24 +08:00
    能拿现成的大模型自己套个接口吗?我看好像有接口
    koto
        5
    koto  
       2023-11-25 09:56:04 +08:00
    是的。甚至可以让传统 MT 做第一次翻译,AI 再处理
    gam2046
        6
    gam2046  
       2023-11-25 10:03:25 +08:00
    作为只有二流子英语水平的我。

    现在,一般小段落的英文自己直接看。

    大篇幅的英文,直接 Edge Copilot ,“请你根据当前网页内容,使用中文总结,并尽可能详尽告诉我,当前网页里写了什么”,然后喝口咖啡,静静的等待结果。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2863 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 07:23 · PVG 15:23 · LAX 23:23 · JFK 02:23
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.