融合Albert模型的珍稀濒危植物知识图谱的构建 |
| |
引用本文: | 田梦晖,陈明,席晓桃.融合Albert模型的珍稀濒危植物知识图谱的构建[J].湖南农业大学学报(自然科学版),2023,49(5). |
| |
作者姓名: | 田梦晖 陈明 席晓桃 |
| |
作者单位: | 1.上海海洋大学信息学院,上海 201306;2.农业农村部渔业信息重点实验室,上海 201306 |
| |
基金项目: | 上海市科学技术委员会项目(20dz1203800) |
| |
摘 要: | 针对珍稀濒危植物形态特征、分类等级、濒危系数、保护措施等知识不明确的问题,设计了文本融合轻量级双向转换编码表示模型(Albert)的知识抽取模型框架,实现批量抽取珍稀濒危植物知识,从而构建珍稀濒危植物知识图谱:1) 在现存一般性植物本体的基础上,采用自顶向下的方式构建珍稀濒危植物本体,得到5个体系,即物种分类体系、生长形态特征体系、命名体系、保护现状体系和生态习性体系;2) 采取Albert预训练模型来增强下游任务模型输入向量的珍稀濒危植物属性描述文本语义的表征能力;3) 利用BiLSTM–CRF模型和BiGRU–Attention模型分别实现命名实体识别和关系抽取。在珍稀濒危植物数据测试集上对模型的有效性进行验证,结果表明,命名实体识别模型和关系抽取模型的召回率和准确率的调和平均值(F1)值分别达到98.07%和93.76%,将得到的大量的实体和关系所形成的三元组存储在图数据库Neo4j中,完成珍稀濒危植物知识图谱的可视化展示。
|
关 键 词: | 珍稀濒危植物 Albert模型 知识图谱 本体 命名实体识别 关系抽取 |
|
| 点击此处可从《湖南农业大学学报(自然科学版)》浏览原始摘要信息 |
| 点击此处可从《湖南农业大学学报(自然科学版)》下载免费的PDF全文 |