基于链语法英语作文自动评分探究

基于链语法英语作文自动评分探究

ID:6075271

大小:31.50 KB

页数:9页

时间:2018-01-02

基于链语法英语作文自动评分探究_第1页
基于链语法英语作文自动评分探究_第2页
基于链语法英语作文自动评分探究_第3页
基于链语法英语作文自动评分探究_第4页
基于链语法英语作文自动评分探究_第5页
资源描述:

《基于链语法英语作文自动评分探究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于链语法英语作文自动评分探究  摘要:分析研究当前国内外英语作文自动评分系统的研究成果,提出了一种基于链语法(LinkGrammar)的能为学生提供实时训练的英语作文自动评分系统。系统首先通过依据LinkGrammar对句子分析后的成本向量(costvector)计算文章的语法权值,其次则利用文章核心词、非核心词熵值和有效句比例来对文章主题分档,最后则是结合语法权值和主题分档结果计算文章分数。测试结果表明,10~15分段作文达到了88.9%的准确率,说明该系统在10~15分段作文具有较好的适应性,同时系统的分析时间也能很好的满足实时性的要求。关键词:自动作文评分;链语法;

2、信息熵;主题分档;英语教学中图分类号:TP391文献标识码:A文章编号:1009-3044(2014)02-0284-04作文自动评分(AutomatedEssay9Scoring,AES)就是利用计算机技术对作文的语言、内容等方面进行评估与打分[1]。由于作文自动评分具有诸如实用性、一致性等突出优点,近年来该方向的研究在国内也逐渐得到外语教学界和自然语言处理界的重视,相关专家学者如梁茂成[2]和葛诗利、陈潇潇[3]等都做了大量的尝试和研究。但与国外相比,国内的相关研究具有明显的探索性和探讨性,研究的针对性和实用性较弱。目前国外在教育考试领域处于实用中的一些AES系统有Pr

3、ojectEssayGrader(PEG)、IntelligentEssayAssessor(IEA)、E-rater等。但是,这些系统对于英语作为外语的考生的作文写作帮助和评分是否需要考虑不同的因素尚没有透彻的研究[4]。此外,尽管国外自动作文评分研究取得了较好的评分效果,但这些研究主要是针对英语母语或者较高水平的英语作为外语的学习者的大规模考试单一题目作文评分,对于我国英语写作教学来说,更迫切需要的是一种能够针对大多数学生英语写作水平,提供多题目实时训练的作文自动评估和反馈系统,这不仅能增加学生英语作文训练的机会,同时也能减轻老师的批改负担。而这也是本文研究的意义和目标

4、。9研究计算机自动作文评分,首先要面对的就是评分标准的形式化问题。当前主要有两种外语作文评分形式:分项评分和整体评分[5]。前者主要是利用机器学习的方法,从大样本中提取某些有效评分特征及其权重用于未评分作文的评分,如国外E-rater的开发人员提取文本特征建立回归方程,进行线性回归,得到了与人工评分较高的相关度[6]。国内的如梁茂成教授等[7]。而后者则是按照写作理论细化评分标准,提取内容和语言使用方面能够形式化的评分特征,同时分配各特征在作文评分中的权重,如曾用强的过程化作文评估[8]以及葛诗利面向大学英语教学的通用计算机作文评分和反馈方法研究[9]。由于前者依赖于大样本

5、的机器学习,因而不具有实时性和作文题目灵活多变的特点。因而本文采用后一种整体评分方法,从语法分析和主题内容这两个大的方面来研究和设计实时性的作文自动评分系统。1语法分析对外语写作者,即便是较高水平的外语写作者,如托福考生,自动作文评分与人工评分也会出现统计上的显著性差异[10]。主要原因是传统分析器的语言形式关注的往往是哪些符合语法,而不是哪些不合语法,因而在面对不合语法的输入时,传统分析器显得非常呆板。然而关键是不合语法规范的文章是很多的,特别是对于低水平的英语写作者,即作文中高频率出现词汇和句法方面错误的汉英中介语,传统的语法分析器则会遇到更大的困难,并且其健壮性也面临

6、很大挑战。用来解决健壮性问题的方法之一是制定反映不合语法规范的称之为“不良规则”的编码规则[11]。在本次研究中,所选择的分析器是由D.Sleator和D.Temperley开发的链语法分析器(LinkParser)[12]。链语法(Link9Grammar)不是建立在树结构的基础上,而是将语言知识完全落实到词汇基础上,通过词语的链接(Link)属性,来对句子进行分析。在分析不合语法的输入时,链语法分析器能够跨越句子中不合语法的单词,找到后面的词汇,并连接构成有句法意义的词对,比如:主语+动词,动词+宾语,介词+宾语,形容词+状语修饰语,和助动词+动词等,因而链语法分析器具

7、有很好的健壮性。2文章主题主题打分主要从文章的单词数量和文章切题程度两方面来展开。仿照人工评分时归档的思想,主题评分也按照分档的思路进行。针对文章词数和文章内容,主题评分的分档分两步完成:第一步通过文章的单词数目来归档;第二步则是在第一步基础上,通过文章核心词熵值、非核心词熵值、有效词的比例这三个参数来对文章进行降档。2.1单词数目归档2.2根据文章内容降档文章内容是否切题也是作文评分的重要方面。而作文主题作为作文自动评分的重要依据之一,也引起了学者专家们的广泛关注和研究。文秋芳(2007)的研究[13]更是表明“

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。