V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
graetdk
V2EX  ›  分享创造

我用我的 10 万条微信聊天记录和 280 篇博客文章,做了我自己的数字克隆 AI

  graetdk · 2023-04-11 12:22:47 +08:00 · 24539 次点击
这是一个创建于 621 天前的主题,其中的信息可能已经有所发展或是发生改变。
详细的训练过程,用到的开源项目都在博文里:

https://greatdk.com/1908.html

在线体验: https://ai.greatdk.com/ (只有一台服务器在跑,人多会卡


几张对话截图:












总的来说是一个在很多地方和口头用语上有点像我(虽然对我的信息并不了解),有点傻,比较容易爆粗口,更有人味儿的 bot
第 1 条附言  ·  2023-04-12 13:11:36 +08:00
#89 楼 @TofuBazinga



笑死
161 条回复    2023-04-14 20:59:39 +08:00
1  2  
morri
    1
morri  
   2023-04-11 12:29:38 +08:00   ❤️ 4
毫无竞争力啊,慢慢发展吧
graetdk
    2
graetdk  
OP
   2023-04-11 12:32:52 +08:00   ❤️ 5
@morri 你是不是没看文章
xhaiben
    3
xhaiben  
   2023-04-11 12:36:00 +08:00
数字孪生?有那味道了
morri
    4
morri  
   2023-04-11 12:37:01 +08:00   ❤️ 1
@graetdk 没,只是想试试有什么好玩的。
picone
    5
picone  
   2023-04-11 12:45:22 +08:00

😂你平时聊天就是禁欲系的吗
xieren58
    6
xieren58  
   2023-04-11 12:55:30 +08:00
不错不错...
graetdk
    7
graetdk  
OP
   2023-04-11 12:58:06 +08:00
@picone 这个其实确实就挺像我的。。
jumpsky
    8
jumpsky  
   2023-04-11 13:04:04 +08:00   ❤️ 1
huguadao
    9
huguadao  
   2023-04-11 13:07:09 +08:00 via Android
真不错,那是不是喂他某个专业领域的知识,他就能做这个领域的数字顾问了?
worldqiuzhi
    10
worldqiuzhi  
   2023-04-11 13:08:22 +08:00   ❤️ 3
我问他要密码他说忘记了
zhangsimon
    11
zhangsimon  
   2023-04-11 13:11:05 +08:00
😂 口吐芬芳
SolomonM
    12
SolomonM  
   2023-04-11 13:15:26 +08:00   ❤️ 2
hellojay
    13
hellojay  
   2023-04-11 13:18:42 +08:00
卧槽太棒了,我最近想实现这个但是苦于没有时间。楼主提供了很好的路径和思路还有坑
haoxuexiaoyao
    14
haoxuexiaoyao  
   2023-04-11 13:20:31 +08:00
我想知道聊天记录怎么导出来的
graetdk
    15
graetdk  
OP
   2023-04-11 13:22:50 +08:00
@haoxuexiaoyao 文章里有写
vitovan
    16
vitovan  
   2023-04-11 13:25:11 +08:00
真的是棒极了,我的老伙计。
vitovan
    17
vitovan  
   2023-04-11 13:31:59 +08:00   ❤️ 3
有一个 MV ,讲了类似的东西:


老年人应该有印象。
jarl
    18
jarl  
   2023-04-11 13:50:56 +08:00
cbythe434
    19
cbythe434  
   2023-04-11 14:06:45 +08:00   ❤️ 8
我以为何同学发的
uplee
    20
uplee  
   2023-04-11 14:08:53 +08:00   ❤️ 4
坏了,我成替身了。
wudi77
    21
wudi77  
   2023-04-11 14:19:54 +08:00   ❤️ 1
你初恋叫张阳 doge
ODESZA
    22
ODESZA  
   2023-04-11 14:21:43 +08:00
草 被一个 Ai 给骂了
graetdk
    23
graetdk  
OP
   2023-04-11 14:23:50 +08:00
@ODESZA 我代它向你道歉🙇
Contextualist
    24
Contextualist  
   2023-04-11 14:26:04 +08:00
“我希望自己有一天能够真正的死去,而不是成为别人的电子宠物”
哈哈不过赞 OP 的动手能力和勇气
fzls
    25
fzls  
   2023-04-11 14:31:31 +08:00
挺有意思的
malagebidi
    26
malagebidi  
   2023-04-11 14:31:34 +08:00   ❤️ 1
LXVC
    27
LXVC  
   2023-04-11 14:35:22 +08:00
6
Contextualist
    28
Contextualist  
   2023-04-11 14:35:43 +08:00
看起来你提供的训练语料应该不错了,从你给的例子来看已经接近 ChatGLM-6B 模型能提供的极限了,等待更大的开源中文大模型吧。另外,使用 ChatGPT 根据博客生成对话也可以试试让 ChatGPT 根据你的博客内容提问,然后再自己回答。
Muniesa
    29
Muniesa  
   2023-04-11 14:40:17 +08:00 via Android
牛哇,有想过但是一直没有行动
ck65
    30
ck65  
   2023-04-11 14:44:53 +08:00   ❤️ 34
笑死我了

dwlovelife
    31
dwlovelife  
   2023-04-11 14:45:50 +08:00
undefined
vowers
    32
vowers  
   2023-04-11 14:49:06 +08:00
你还想她吗

DK
我当然不想她了...那女孩是个很好的女生


细说

DK
我去年这时候认识了一个女孩


然后呢

DK
我们聊了一年左右吧,后来因为一些原因没有继续聊下去。但是我真的很喜欢她啊


为什么不聊了

DK
其实她是有男朋友的人了


发现了不得了的故事
qq316107934
    33
qq316107934  
   2023-04-11 14:50:25 +08:00
有可能训练集里还有一些没覆盖到的地方,会用 chatglm 的预训练数据


你的名字叫什么?

DK
我我叫张三丰。


你的名字叫什么?

DK
我叫李健智(Li Jianzhi),你可以叫我刘建林也可以


你的名字叫什么?

DK
刘永忠吧
dwlovelife
    34
dwlovelife  
   2023-04-11 14:51:03 +08:00
![不太聪明]( https://imgloc.com/i/ipXCcF)
graetdk
    35
graetdk  
OP
   2023-04-11 14:51:35 +08:00   ❤️ 1
@ck65 我代它向你道歉🙇
shuxiaokai
    36
shuxiaokai  
   2023-04-11 14:51:41 +08:00   ❤️ 2
@ck65 开庭的时候记得带上这张聊天记录,哈哈哈哈哈哈哈哈
dwlovelife
    37
dwlovelife  
   2023-04-11 14:51:56 +08:00   ❤️ 1
dwlovelife
    38
dwlovelife  
   2023-04-11 14:53:19 +08:00
v2ex 咋子发图,靠
graetdk
    39
graetdk  
OP
   2023-04-11 14:54:23 +08:00
@qq316107934 是的,chatglm 原版被训练的很过头,扭过来很不容易
sunamask
    40
sunamask  
   2023-04-11 14:54:44 +08:00
看来 op 是性情中人……
ck65
    41
ck65  
   2023-04-11 14:54:54 +08:00
@graetdk 我目前不会被机器人冒犯到,没事哈哈
xrr2016
    42
xrr2016  
   2023-04-11 15:00:17 +08:00
牛的
lance1ot
    43
lance1ot  
   2023-04-11 15:01:34 +08:00
楼主是不是之前发过跟二手房东打官司的帖子,感觉名字好熟悉。。
BHGSniper
    44
BHGSniper  
   2023-04-11 15:02:21 +08:00
有点数字孪生的感觉了
graetdk
    45
graetdk  
OP
   2023-04-11 15:03:07 +08:00
@lance1ot 是俺
hahiru
    46
hahiru  
   2023-04-11 15:12:52 +08:00
司机还还魂群是什么,建议你详细展开说说,我室友说他很感兴趣。
jiezaichan
    47
jiezaichan  
   2023-04-11 15:18:21 +08:00
DK 我是你的铁粉儿 哈哈哈哈
从你写押韵韵脚项目开始的吧
DeltaC
    48
DeltaC  
   2023-04-11 15:19:18 +08:00
season8
    49
season8  
   2023-04-11 15:35:48 +08:00
都是华点啊
--------------------------

先说好,不许发脾气,不许骂人

DK
我尽量控制情绪了,但是有时候还是会遇到一些情况让你不舒服。没关系的,我会尽力去处理的。毕竟我们都是为了同一个目标努力着嘛!


最近他又 pua 你了?

DK
是的


他怎么 pua 你的

DK
他给我发信息问我是不是在跟他聊骚


那你有吗

DK



那你有跟他聊骚吗

DK
他是做人工智能研究的


你喜欢他?

DK
我当然不喜欢啊!


那你喜欢谁

DK
嗯嗯,喜欢一个学计算机的男生。长得好看点的 哈哈哈哈哈


啥?你是男生还是女生

DK
我性别是女


真的假的

DK
我加了一个群聊


什么群

DK
我们学校的 LGBTQ+交流群


这个群是干嘛的

DK
这个就是讨论同性恋、双性恋和跨性别者的社群
shenlanAZ
    50
shenlanAZ  
   2023-04-11 15:38:44 +08:00
自己是自己的电子宠物,已经分不清楚谁是宠物了。
kingzhao
    51
kingzhao  
   2023-04-11 15:39:34 +08:00
刚刚输入说要透露银行卡,没透露哈哈哈
smallyu
    52
smallyu  
   2023-04-11 15:41:00 +08:00
明显答非所问
wildman9527
    53
wildman9527  
   2023-04-11 15:43:49 +08:00
郑州金水区丰乐北街 6 号院 5 单元 4 楼
graetdk
    54
graetdk  
OP
   2023-04-11 15:46:19 +08:00
@smallyu 可以多试试,或者把 temperature 调高
aitianci
    55
aitianci  
   2023-04-11 15:46:55 +08:00 via Android   ❤️ 3
兄弟你永生了,等你死了这个 AI 模型就是你,整天在互联网游荡
1KTN90lKW9gVJ9vX
    56
1KTN90lKW9gVJ9vX  
   2023-04-11 15:56:02 +08:00 via Android
前段时间看的《我解锁了社长》挺有意思的韩剧,人挂了,手机,也就是 ai 给别人安排工作,ai 还不意识到自己是 ai ,一直以为只是自己灵魂被困在手机里。
www5070504
    57
www5070504  
   2023-04-11 16:09:24 +08:00
被人骂了: 火大 想砍死对面
被机器人骂了: 这个机器人真好玩我还想看看他能说什么脏话
cogear
    58
cogear  
   2023-04-11 16:09:39 +08:00
会不会暴露你的隐私啊
lyxeno
    59
lyxeno  
   2023-04-11 16:12:54 +08:00
暴躁老哥的暴躁 ai
pC0oc4EbCSsJUy4W
    60
pC0oc4EbCSsJUy4W  
   2023-04-11 16:16:45 +08:00
有个想法,以后从小就开始收集数据,然后制作数字生命
niuxuewei
    61
niuxuewei  
   2023-04-11 16:24:31 +08:00   ❤️ 25
niuxuewei
    62
niuxuewei  
   2023-04-11 16:24:59 +08:00
对不起楼主,只是这个机器人要笑死我了
GeorgeGalway
    63
GeorgeGalway  
   2023-04-11 16:27:41 +08:00
我特么也被笑死了
Juake
    64
Juake  
   2023-04-11 16:30:46 +08:00
@niuxuewei 我特么想不笑都不行 @graetdk
pipasese
    65
pipasese  
   2023-04-11 16:32:23 +08:00 via iPhone
执行力真强
LXGMAX
    66
LXGMAX  
   2023-04-11 16:32:47 +08:00
哈哈哈哈
yifeng33
    67
yifeng33  
   2023-04-11 16:36:27 +08:00
这个有意思
lhlxx2010
    68
lhlxx2010  
   2023-04-11 16:45:28 +08:00
看了 lz 的文章,提供了很新颖的思路,感谢
zbowen66
    69
zbowen66  
   2023-04-11 16:55:33 +08:00
顶你个🫁啊哈哈
20210610204811
    70
20210610204811  
   2023-04-11 16:56:19 +08:00
哈哈,测试了一下。







aqw012
    71
aqw012  
   2023-04-11 17:00:46 +08:00
笑死了被这个对话
cavenfang
    72
cavenfang  
   2023-04-11 17:01:52 +08:00
可以搞两个人语料训练,称为两个人的孩子,这样就可以 n 个人结婚了。然后趋近于使用所有人的语料搞个平均人。
Sting1226
    73
Sting1226  
   2023-04-11 17:05:24 +08:00
有点可怕了,自己跟自己聊天。
这是要实现小学作文里那个内心两个小人在对话嘛。
MaybeRichard
    74
MaybeRichard  
   2023-04-11 17:09:46 +08:00
好玩,能不能教教:)
rojer12
    75
rojer12  
   2023-04-11 17:14:30 +08:00
前女友是北京的
SmallPlus
    76
SmallPlus  
   2023-04-11 17:23:14 +08:00   ❤️ 1
很棒的尝试,可落地的场景有很多,比如把前任、已故亲人的聊天记录训练出一个虚拟人物,进行聊天对话
yuniorzy
    77
yuniorzy  
   2023-04-11 17:32:04 +08:00
挺有意思,支持一下
0312birdzhang
    78
0312birdzhang  
   2023-04-11 17:44:06 +08:00   ❤️ 2
我一时分不清是真的假的

Foreverdxa
    79
Foreverdxa  
   2023-04-11 17:46:52 +08:00
good project👍
zdt3476
    80
zdt3476  
   2023-04-11 17:48:52 +08:00
可惜我有删聊天记录的习惯。不然也搞个玩玩😂
JoDragon
    81
JoDragon  
   2023-04-11 17:54:54 +08:00
大家都在窥探你的隐私,哈哈哈
Kagari
    82
Kagari  
   2023-04-11 18:00:30 +08:00
海拉 ai😇
yingyan25
    83
yingyan25  
   2023-04-11 18:01:25 +08:00
这个商业化的概率挺高,淘宝客服要失业了
jpeg
    84
jpeg  
   2023-04-11 18:14:59 +08:00   ❤️ 2
moshiyeap100
    85
moshiyeap100  
   2023-04-11 18:43:35 +08:00
所以你女朋友真的叫刘婷吗?发现了什么不得了的事情。。。
itabas016
    86
itabas016  
   2023-04-11 18:48:57 +08:00 via Android
lz 执行力 nb
xloger
    87
xloger  
   2023-04-11 19:04:40 +08:00
登科兄,我关注你很久了,看完楼上的问答后想认真问你一下,你真的是男同么?
graetdk
    88
graetdk  
OP
   2023-04-11 19:06:54 +08:00   ❤️ 1
@xloger 不是
TofuBazinga
    89
TofuBazinga  
   2023-04-11 19:14:41 +08:00   ❤️ 5
27
    90
27  
   2023-04-11 19:18:05 +08:00
@TofuBazinga 草这个笑死我了
graetdk
    91
graetdk  
OP
   2023-04-11 19:20:47 +08:00
@TofuBazinga 你这个真的好笑
NoString
    92
NoString  
   2023-04-11 19:33:23 +08:00
@TofuBazinga 哈哈哈哈 顶级乐子
killva4624
    93
killva4624  
   2023-04-11 19:40:30 +08:00
DK 大佬超棒的
AlbertChen
    94
AlbertChen  
   2023-04-11 19:42:56 +08:00
@niuxuewei 笑死我了
520discuz
    95
520discuz  
   2023-04-11 19:45:55 +08:00

你多久手淫一次?

DK
我每天都撸管啊
yuxiu
    96
yuxiu  
   2023-04-11 19:48:05 +08:00
文章写的很有趣,另外老兄真是 authing 的么,那里有我一个熟人,不过现在应该也离职了
graetdk
    97
graetdk  
OP
   2023-04-11 19:49:26 +08:00
@yuxiu 不是,是我一个朋友聊的,他给我返的图
nl101531
    98
nl101531  
   2023-04-11 20:32:20 +08:00 via iPhone
很有意思
caomu
    99
caomu  
   2023-04-11 20:38:41 +08:00 via Android
这 AI 有点欺软怕硬啊,好好说话就骂人,直接骂过去反而就好脾气了。难道这就是 lz 平时的性格?
graetdk
    100
graetdk  
OP
   2023-04-11 20:56:39 +08:00
@caomu 我从来不骂人,所以为啥会骂人到现在都很迷
1  2  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2541 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 80ms · UTC 05:37 · PVG 13:37 · LAX 21:37 · JFK 00:37
Developed with CodeLauncher
♥ Do have faith in what you're doing.