Scidown文献预览系统!
基于双选择半监督学习策略的中文EMR命名实体识别研究( Research on Named Entity Recognition in Chinese EMR Based on Semi-Supervised Learning with Dual Selected Strategy )
J Yan Y Geng H Xu Y Yu S Tan D He
随着电子病历系统的建设,病历数据开始积累,如何从这些资源中提取必要的信息成为人们关注的问题。而命名实体识别(NER)是第一步。在医生的帮助下,我们搭建了一个小型的中文电子病历标注语料库。但NER监督方法需要大量的人工标注语料。因此,为了降低成本,更好地利用未标注语料,本文在ALBERT-BiLSTM-CRF的基础上,提出了一种半监督的中国电子病历NER模型CEMRNER。该模型采用双向长短时记忆网络(BiLSTM)和条件随机场模型(CRF)对数据进行训练,并引入预训练语言模型ALBERT解决汉语表示问题。同时,我们提出了一种双选择策略来选择高置信度样本并扩展训练集。双重策略可以保证自动标注数据的准确性,减少半监督学习中的错误迭代。实验和分析表明,与其它模型相比,该方法更准确、更全面。查准率、召回率和F1评分分别为85.45%、87.81%和86.61%。论文证明了在标注数据较少的情况下,采用一种半监督的方法,并对ALBERT进行预训练,可以提高识别的准确率。
『Sci-Hub|Scidown』怎么用?来看看教程吧!

支持模式 1.支持DOI号 2.支持英文文献全名搜索 3.支持参考文献搜索 4.知网文献(暂时关闭)


安卓手机、电脑用户,您可以在QQ浏览器里输入 www.scidown.cn 打开scidown解析,就可以解析、下载了!(注意是文献的DOI号)


苹果手机用户,您需要先在App Store里搜索并下载 Documents by Readdle 这个APP,在APP首页,左划右下角的指南针图标打开APP内置浏览器,在浏览器里输入 www.scidown.cn 打开scidown解析,就可以解析、下载了!


如出现BUG?赶快加入【Scidown互助交流群】反馈吧:729083885【点击一键加群】