一种基于字向量和LSTM的句子相似度计算方法 |
| |
引用本文: | 何颖刚,王宇.一种基于字向量和LSTM的句子相似度计算方法[J].长江大学学报,2019,16(1). |
| |
作者姓名: | 何颖刚 王宇 |
| |
作者单位: | 集美大学诚毅学院,福建厦门,361000;集美大学诚毅学院,福建厦门,361000 |
| |
基金项目: | 福建省中青年教师教育科研项目;福建省高等学校创新创业教育改革项目;集美大学诚毅学院青年科研基金项目 |
| |
摘 要: | 句子相似度度量在自然语言处理领域中有着广泛的应用。针对现有的句子相似度计算方法不能充分捕捉句子的语义结构特征信息的问题,提出一种基于字向量和LSTM (long-short term memory,长短期记忆)网络的句子相度计算方法。首先,通过Word2Vec模型对中文维基百科语料进行训练,得到中文字向量词典;然后根据字向量词典将句子映射为句向量,并输入LSTM网络,获得句子的特征向量;最后,通过相似度算法计算2个句子特征向量之间的相似度。通过在2个数据集上的试验结果表明,该方法能够提高句子相似度计算的准确性,效果好于传统的语句相似度计算方法和基于词向量的相似度计算方法。
|
关 键 词: | 句子相似度 字向量 Word2Vec LSTM神经网络 |
本文献已被 CNKI 万方数据 等数据库收录! |
|