基于互联网的自动问答系统关键技术研究与实现

基于互联网的自动问答系统关键技术研究与实现

ID:34304787

大小:1.41 MB

页数:73页

时间:2019-03-04

基于互联网的自动问答系统关键技术研究与实现_第1页
基于互联网的自动问答系统关键技术研究与实现_第2页
基于互联网的自动问答系统关键技术研究与实现_第3页
基于互联网的自动问答系统关键技术研究与实现_第4页
基于互联网的自动问答系统关键技术研究与实现_第5页
资源描述:

《基于互联网的自动问答系统关键技术研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:TP391学校代码:10697密级:公开学号:201520980硕士学位论文MASTER’SDISSERTATION基于互联网的自动问答系统关键技术研究与实现学科名称:软件工程作者:周蕾指导老师:史维峰教授西北大学学位评定委员会二○一八年六月TheResearchandApplicationofKeyTechniquesforWeb-basedQuestion-AnsweringAthesissubmittedtoNorthwestUniversityinpartialfulfillmentoftherequirementsfort

2、hedegreeofMasterinSoftwareEngineeringByZhouLeiSupervisor:ShiWeifengProfessorJune2018摘要互联网信息量的爆炸式增长使人们对信息检索的需求不断提高,用户期待在浩如烟海的信息空间中快捷、准确的找到自己所需要的资源。搜索引擎虽然为用户提供了获取信息的有效途径,但随着网络信息量不断增长,其暴露出了越来越多的弊端:关键词的组合难以清晰表达用户查询意图、检索结果存在冗余、返回的大量网页耗费用户时间长等。人们期待一种更加高效、便捷、人性化的信息检索方式。由此,自动问答系统作

3、为一种新型的信息检索方式出现,接受用户自然语言形式的问句,返回给用户准确、简洁的答案,并成为近年来自然语言处理领域的热点。然而,由于中文语言知识处理的复杂性使得中文问答系统的研究存在很多困难与挑战。本文主要对基于互联网的问答系统的两个关键技术——段落检索和答案抽取进行了分析和算法改进,并添加了新的功能模块,实现了一个改进的基于互联网的中文问答系统。论文的主要研究工作包括:针对信息检索模块现有段落检索算法中,仅考虑关键词的存在性和有限的浅层语法关系的问题。提出了一种优化段落中关键词语义相关词评分,并考虑段落长度对段落与问句相关度的影响,改进了

4、SiteQ段落检索算法,并通过仿真实验证明改进算法的有效性。针对答案抽取模块,本文改进了现有基于语义依存树的算法,综合考虑了依存树分析、词项依存关联度以及词形相似度对候选答案句质量的影响,对算法进行改进,实验结果表明,改进算法得到的答案有更高的正确率。针对构建开放领域知识库工程的庞大和复杂,本文通过添加模板匹配的功能模块,作为一种可行的替代方案,利用网络上的大量半结构化数据,构建一个模板匹配辅助的基于互联网的问答系统。仿真实验结果表明,新增模块的使用,提高了问答系统对用户问题的响应速度和回答问题的准确率,是行之有效的。关键词:基于互联网的问

5、答系统,查询词扩展,信息检索,答案抽取IABSTRACTTheexplosivegrowthofInternetinformationhasincreasedthedemandofthepeople,andtheusersexpecttofindresourcesquicklyandaccuratelyinthevastinformationspace.Althoughthesearchengineprovidesoneeffectivewaytoobtaintheinformationforusers,butalongwiththenet

6、workinformationquantityunceasinggrowth,itexposesthemoreandmoremalpractice:Thekeywordscombinationisdifficulttoexpresstheuserqueryintentionclearly,theretrievalresultsexistenceredundancyandnoise,thelotsofwebpageswaitusers’time.Peoplelookforwardtoamoreefficient,convenient,user

7、-friendlyinformationretrievalmethod,thus,automaticquestionansweringsystemappearsasanewwayofinformationretrievalmethod.Thesystemacceptstheuser'snaturallanguagequestion,returnstheaccurateandconciseanswer,andbecomethehotspotofnaturallanguageprocessinginrecentyears.However,due

8、tothecomplexityofChineselanguageknowledgeprocessing,therearemanydifficultiesandchallenges

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。