统计语言模型好理解,根据语料库计算整句话的概率,即可根据进行判断
那么神经网络语言模型如何对整句话的类别进行判断?这个想不清楚啊。
我已理解单个词 的 词向量,但是不知道词向量怎么运用到整句话的类别判断上
1
glennq 2016-03-03 12:03:11 +08:00
类别判断?语言模型的目的本来就只是给句子一个概率啊
|
2
chlx 2016-03-03 12:13:01 +08:00
|
3
mikezhang0515 OP |
4
mikezhang0515 OP @chlx 谢谢,这个看过,但还是不太理解,可能在自然语言模型上的惯性太大了。。老想着概率该如何计算
|
5
snnn 2016-03-03 13:09:28 +08:00 via Android
好专业!!!!
|
6
glennq 2016-03-04 10:47:48 +08:00
@mikezhang0515 首先“语言模型(Language Model)”是一个专有名词,主要目的是给定一个句子,能估算出其在这门语言中的出现概率。传统做法一般是 n-gram ,而神经网络一般是用 RNN+LSTM 。
文本分类又是另一个自然语言处理中的问题,一般做法是从每个文本中提取特征,然后就可以用任何有监督学习的方法来做了。至于词向量,你可以认为是给每个词的特征,想办法把这些组合起来变成整个文本的特征,之后就是同一个套路了 |
7
mikezhang0515 OP @glennq 对于词向量间,通过夹角能够得出同义词,那么通过什么可以得到相关性呢?看了很多文章,没有人这么提。
|
8
mikezhang0515 OP @glennq 可能相关性不是很明确,固定短语间,词向量会存在什么联系呢?
|