1
makejohn2015 279 天前 1
不用从零开始找数据训练,可以找网上现有的法律对话、问答的东西,写个脚本疯狂问,用来训练你的“机器人”,知识蒸馏。
|
2
sentinelK 279 天前 2
有几个问题需要先明确。
1 、是从 0 开始模型训练?还是模型微调?还是只是注入上下文信息? 2 、对信息的准确度要求如何? 3 、你想付出多少成本? |
3
imes 279 天前 via Android 1
1. 不管什么方法,弄到至少 100G 的法律资料。
2. 找 3-5 个 5 年以上经验,不同方向的律师,让他们把上述内容分类整理。 3. 买至少 4 张 H100 以上的卡,初期可以在 llama2 的基础上,使用 LoRA 进行微调。后期至少需要 3 台英伟达 DGX 服务器。 4. 找至少 20 位律师(不要求经验),对输出进行 ground truth 核对。 |
4
vivisidea 279 天前 1
|
5
fulajickhz 279 天前 1
现在的 AI ,无论中外,只要能搜互联网的,都可以满足你的要求
你自己试试就知道了 官方的,税务总局的机器人客服有类似的功能,通过关键词会触发对应的条例和具体条款 其他部门的没碰到过 |
6
Alias4ck 279 天前 2
阿里有一个法律的 通义法睿 https://tongyi.aliyun.com/farui/chat
|
7
cookgo OP @makejohn2015 这种方式是指的《模型微调》吗?
|