基于网络百科全书的中文关联语义知识获取

基于网络百科全书的中文关联语义知识获取

ID:33496794

大小:417.83 KB

页数:8页

时间:2019-02-26

基于网络百科全书的中文关联语义知识获取_第1页
基于网络百科全书的中文关联语义知识获取_第2页
基于网络百科全书的中文关联语义知识获取_第3页
基于网络百科全书的中文关联语义知识获取_第4页
基于网络百科全书的中文关联语义知识获取_第5页
资源描述:

《基于网络百科全书的中文关联语义知识获取》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、基于网络百科全书的中文关联语义知识获取奉杨柳12,何婷婷”,涂新辉31华中师范大学计算机科学系武汉4300492国家语言资源监测与研究中心网络媒体分中心武汉4300493国家数字化学习工程技术研究中心武汉430079yangliu721@yahoo.com.cntthe@mail.ccnLLeducntuxinhui@163.com摘要:本文提出了—种用语义标签、语义指纹来表示关联语义知识的形式化方法,其中语义标签指代语义中的一个知识单元(也即概念),语义指纹是对语义标签所指代概念的描述,由语义标签的相

2、关词语及其关联度共同组成。本文提出了—种从网络百科全书获取中文关联语义知识的方法,通过该方法获得语义标签的相关词群,利用网络百科全书中的内部链接和开放分类信息计算每个相关词语与语义标签的关联度。通过与入的判断进行比较,说明了本文提出的计算语义标签与相关词语关联度的方法的有效性。关键字:百科全书,语义知识,语义关联度i语义标签,语义指纹ObtainingReIatedSemantiCKnowIedgefromOnIiReEncycIopediaLiuYan91’2TmgtingHel’2XinhuiTu3

3、1DepartmentofComputerScienceandTechnology,HuazhongNormalUniversity,Wuhan,China2NetworkMediaBranchofNationa/LanguageResourcesMonitoringandResearchCenter,Wuhan,China3Engineering&ResearchCenterforInformationTechnologyOilEducation,HuazhongNormalUniversity,Wu

4、han,Chinayangliu721@yahoo.com.elltthe@mail.CCnu.edu.cntuxinhui@163.comAbstract:Thispaperusessemanticlabelandsemanticfingerprinttorepresenttherelatedsemanticknowledgeandproposesamethodtoobtainrelatedsemanticknowledgefromanonlineencyclopedia.Semanticlabelr

5、epresentsaconcept,whichcanbeawordorphrase,andisabasicsemanticunitinnatLl/吐language.SemandcfingerprintisconsistedofⅡ1efollowingpairs:semanticrelatedterm,itssemanticrelatedness.Weobtainthesemanticrelatedtermsofeachsemanticlabelandcomputethesemanticrelatedn

6、essbyanaly五ngtheinnerhyperlinksandoperlcategoryinformationintheencyclopedia.Bycomparingourremitswithhumanjudgments,weprovethatourrelatednesscomptaingmethodiseffective.Keywords:encyclopedia;semanticknowledge;semanticrelatedness;semanticlabel;semanticfinge

7、rprintl引言万维网的发展使得人类拥有的文本信息资源越来越多,人们迫切需要机器能自动地从海量文本中获取目标信息。自然语言处理领域的一些子任务,诸如文本分类、信息检索、自动文摘和自动问答等都足通过计算机来解决人们对特定文本信息的需求。由于互联网上文本信息大都足以人类的自然语言出现,而人类的语言中蕴含着丰富的语义知识,因此,为了增加机器理解自然语言’基金项只:国家自然科学基金重人研究计划(No.90920005),国家自然科学基金(No.60773167),国家十一五科技支撑计划i屎-N(No.2006

8、BAK11803),973国家重点基础研究发展计划mo.2007CB310804),教育部/国家外国专家局高等学校学科创新引智计划(No.B07042),湖北省自然科学基金计划项目资(No.2009CDBl45),武汉市晨光计划项目资助(No.201050231067)一l·的能力,在自然语言处理过程中适度地引入语义知识便十分必要。人类语言的复杂

9、生,使得语义知识的内涵十分丰富,词法、句法、概念的分类结构、词语之间的相似度、词语之间的相关度

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。