关于英语作文智能评阅系统的介绍及启迪_吴方

【教育求索】

··总第471期

关于英语作文智能评阅系统的介绍及启迪

□吴

(南京工业大学

南京

210000)

外语学院,江苏

摘要:本文评述近年来国内外作文自动评分系统中的关键技术,依据其英语作文测试中的效用和其可操作性对其进行分析。并结合自身所使用的句酷批改网英语作文自动评阅系统的经验,探讨其中的优点的同时,也将指出这些评分系统在评分信度和效度等方面存在的问题,以期为我国未来的英语作文自动评阅系统研发提供借鉴和启迪。

关键词:作文自动评阅系统;效用;可操作性〔中图分类号〕G360.0一、研究背景

2012年3月16日,教育部发布了《教育部关于全面提高高等教学质量的若干意见》。这一重要文件,是根据胡总主

席清华百年校庆讲话精神和《国家中长期教育改革和发展

规划纲要(2010-2020年)》内容制定的,计有30条,十分强调了信息技术在管理与教学层面上会得到更为广泛的应用。

具体,都是围绕着提升高等教育质量主旋律展开的。其中,

为了顺时应势,本文将探讨数字化写作方式与智能化尤其是近年来计算机科学技术的突飞猛进让我们看到了作文智能评阅系统的设计与开发已经获得很大发展,但从相关文献研究发现,目前与作文智能评阅系统相关的研究主要集中在计算机评阅系统的研究与开发方面,而有关作文智能评阅系统在大学英语教学中的实证性研究还很匮乏。

写作测评系统对于教学质量的提升作用。科学技术的进步,

作文智能评阅系统在大学英语写作课程中深入应用的

优势还在于它完全符合当今的《大学英语课程教学要求》,顺应了“以现代信息技术,特别是网络技术为支撑,使英学习方向发展”的潮流。

语教学不受时间和地点的限制,朝着个性化学习、自主式

二、国内外研究的现状和趋势1.国外AES技术发展近况

作文自动评分(AES,Automated

定义为“给作文自动评价和评分的计算机技术”,是作文智能评阅系统中的关键技术。其实早在40多年前国外就有人1966,1968),至今此技术还有很多方面要完善,但电脑辅

设想以计算机技术为基础的作文评分系统。(Page,助的作文评分系统已成为老师批改作文方式中的一个可行

网gr改o.批ia酷g句.pi

www

网gr改o. 批ia酷g句.piwww

网gr改o. 批ia酷g句.piwww

网gr改o. 批ia酷gi句.pwww

〔文献标识码〕A

〔文章编号〕1003-6547(2012)11-0189-02系统的不足,勇于面临挑战,提高其信度和效度。借鉴(梁茂成,文秋芳,2009)。“In

a1.,1998b);第二个模块为句法多样性(syntactic

Essay

Scoring)被

al.,2001

Valenti

et

外,尤其是美国,得到了长足的发展,并已付诸应用

(Elliot,2003)。然而,研究人员仍需要更好地了解自动评分

国外最具代表性的三种作文自动评分系统(PEG、IEA

和E-rater),认为这些评分系统在训练及作文的人工评分方法和机器评分效度等方面存在一些问题,不可否认的是这些作文自动评分系统为我国自主开发作文自动评分系统提供了

PEG分析重点是语言层面,长处是能合理客观地分析语

言的质量,不足表现在两方面,一是对文章内容不作分析;二是只对文本的表层特征进行分析。IEA分析重点是文章的内容,长处是能合理客观地分析作文内容的质量,不足一是对作文的语言质量不分析,二是对文章的篇章结构不作分析。而E-rater对文章的语言,内容和篇章结构三个方面都作分析。Burstein等人把这三个方面称作为模块(Burstein

Marcu,2000)。E-rater的第一个模块为话语篇章结构

conclusion”等总结词的方法得以实现(Bursteine

et

(discourse)分析模块,主要靠在文本中搜索“Insummary”,

variety)

分析模块,根据作文中多样性的句子结构和语言质量来进行评分;第三个模块为文本内容(content)分析模块。在这一

模块中,E-rater通过矢量空间模型和提取变量,统计作文中是否具有与作文题目相关的主题词。将这三个系统进行比

较,可以看出E-rater在写作智能评分过程中力求兼顾作文的内容和语言形式,是一种较为全面的写作智能评分系统。E-rater与人工评分之间的一致性一直高于97%(Burstein

et

a1.,2003)。长处在于三个模块

与人工评分要素更为一致。不足在于,一是对语言质量的分析不够全面;二是对文章的内容质量分析不力;三是对篇章

的选择(Page&Peterson,1995)。自动作文评分研究在国

(项目号:2012SJD740002)的阶段性成果。

[收稿日期]2012-08-13

基金项目:本文为江苏省教育厅高哲社科研究项目“英语作文智能评阅系统在二语写作教学中的应用研究”

[作者简介]吴方(1979-),女,江西九江人,南京工业大学外语学院讲师,硕士,研究方向:语言学及应用语言学。

理论界2012第11期

189

··总第471期

结构的分析拘泥于文本的表层特征。

虽然有人对自动写作评分系统的前景持怀疑态度,但很多观点还是对此持肯定态度的(Wresch,1993)。自动作文系统的评价强调了语言规则和语法约定等方面,而牺牲了一些无形的写作要素:如文章的思想内容,流利度和连贯性。根据这种观点,电脑能够对作文中特定的词语或结构给出分析,但不能像人类读者那样去真正理解和欣赏作家在文章中所传递的情感和信息。甚至智能写作系统的开发者也承认,虽然自动写作评分系统是教学和评估的有用的工具,但他们不可能取代写作老师。(Rich11-27)。

Swartz,个人通信,2000-

【教育求索】

成192个子维度进行测量,进行加权平均之后会形成总分和词汇、句子、篇章和内容四个维度的得分;同时,还可以根据比对语料库生成评写错误、语法错误、中式英语、高分句型和易混词汇等反馈。学生可以根据反馈进行自助作文修改,在不断修改的过程中提高自己的作文水平。

四、研究本课题的意义和价值

从相关文献研究可以发现,目前国内与作文智能评阅系统相关的研究主要集中在系统的设计与开发方面,有关作文智能评阅系统在二语写作教学中的应用研究基本上是空白的。

2011年9月我们南工大外语学院与句酷批改网合作,让老师试使用批改网的智能写作批改系统批改学生的作文,智能写作评阅平台辅助老师批改作文同时也提高学生的英语写作能力。经过半年的亲身体验,体会到了智能写作评阅系统带来的好处,如它可以极大地降低教师的批改作文的工作量,教师可以把充足的时间和精力放在教学组织和讲解上;同时学生可以写出更多的文章,写作能力会提高得更快。同时在使用此系统的过程中也发现了一些问题。例如智能系统只能针对学生的语法,词汇难度及句法进行评价考核,而对学生的语义,内容是否与主题相连是无法判断的。因此,在智能写作批改平台使用半年后,学院对大外教研室的全体教师进行了问卷调查,是否愿意下学期继续使用此写作平台。大概有52%的老师觉得这个平台利大于弊,仍然想继续使用。

本人将在下学期,针对将教的2012级的六个班级的学生

三、国内AES技术发展近况

我国在英语作文自动评分技术方面的研究近年来也取得了一些进步。由于开发成本等原因,我国的科技工作者对AES技术的研发工作尽管倾注了很多心血,但其研究和开发速度仍然缓慢。系统”

1.梁茂成等开发的“大规模考试英语作文自动评分

2005年,梁茂成教授主持开发“大规模考试英语作文自动评分系统”,该项研究成果可实现对中国学生英语作文的大规模机器评分,具有极大的实用价值。该系统的工作原理:提取浅层文本特征,对内容的潜在语义进行分析,再运用线性回归,进而得出评分。虽然实验结果与人工评分相比

较达到了较高的相关度,但“由于以浅层特征的统计分析为尚有一定的距离”。

主,以及样本数量、范围的局限性,其评分模型与实用系统

2.冰果英语智能作文评阅系统

2009年,浙江大学外语学院与杭州增慧网络科技有限公

司联合开发出一款“冰果英语智能作文评阅系统”。消息传出,顿时在报刊网络上引起热议。据新华报业网报道,开发商称:人工智能抓取准确率95%;英语老师说:电脑打分与电脑无法指出错误所在;专家指出:有些活是电脑代替不

人工有出入(教师称15分制作文,有2分误差);学生反映:了。该系统的工作原理和其他参数未见有说明。该系统针对日常作文训练,而非大规模考试。另外,该系统未能指出作文中的句子语法结构和单词拼写的错误。可见,此系统还要加大投入。

3.句酷批改网的英语智能作文评阅系统

句酷批改网(www.pigai.org)是一款基于语料库和云计

算的英语作文自动批改在线服务,旨在提高老师批改网英语作文的工作效率,提高学生的英语写作能力。批改网的原理是比较学生作文和标准语料库之间的距离,并通过一定的算

法将距离映射成分数、总评和按句点评。每篇作文都会分解

网gr改o.批ia酷g句.pi

www

网gr改o. 批ia酷g句.piwww

网gr改o. 批ia酷g句.piwww

网gr改o. 批ia酷gi句.pwww

显著性。

另外48%的老师认为批改网对学生的写作能力帮助不大。就使用智能写作评阅系统的体验进行问卷调查,并进行对比试验,把使用智能写作平台的班级和使用常规写作教学的班级的作文得分加以分析,并用SPSS系统分析其差异是否具有

目前大多数高校的大学英语写作教学仍然停留在写作技

巧的讲解、写作训练严重匮乏的阶段,随着计算机的普及,

尤其是网络教学的推广,作文智能评阅系统在大学英语教与学各个环节中的涉足一定能够提高大学英语教学水平。■

参考文献:

[1]Attali,Y.andBurstein,J.AutomatedessayscoringwithE-raterV-2,0[A].PaperoftheInternationalAssociationforEducationalAssessment(IAEA),Philadephia.June13-18,2004.

[2]Ben-Simon,A.&Bennett,R.E.TowardMoreSubstantivelyMeaningfulAutomatedEssayScoring[J].JournalofTechnology,LearningandAssessment,2007,(1).

[3]葛诗利,陈潇潇.国外自动作文评分技术研究[J].外语电化教学,2007(5).

[4]梁茂成,文秋芳.国外作文自动评分系统评述及启示[J].外语电化教学,2007(10).

责任编辑:邱枫

190

2012第11期理论界

【教育求索】

··总第471期

关于英语作文智能评阅系统的介绍及启迪

□吴

(南京工业大学

南京

210000)

外语学院,江苏

摘要:本文评述近年来国内外作文自动评分系统中的关键技术,依据其英语作文测试中的效用和其可操作性对其进行分析。并结合自身所使用的句酷批改网英语作文自动评阅系统的经验,探讨其中的优点的同时,也将指出这些评分系统在评分信度和效度等方面存在的问题,以期为我国未来的英语作文自动评阅系统研发提供借鉴和启迪。

关键词:作文自动评阅系统;效用;可操作性〔中图分类号〕G360.0一、研究背景

2012年3月16日,教育部发布了《教育部关于全面提高高等教学质量的若干意见》。这一重要文件,是根据胡总主

席清华百年校庆讲话精神和《国家中长期教育改革和发展

规划纲要(2010-2020年)》内容制定的,计有30条,十分强调了信息技术在管理与教学层面上会得到更为广泛的应用。

具体,都是围绕着提升高等教育质量主旋律展开的。其中,

为了顺时应势,本文将探讨数字化写作方式与智能化尤其是近年来计算机科学技术的突飞猛进让我们看到了作文智能评阅系统的设计与开发已经获得很大发展,但从相关文献研究发现,目前与作文智能评阅系统相关的研究主要集中在计算机评阅系统的研究与开发方面,而有关作文智能评阅系统在大学英语教学中的实证性研究还很匮乏。

写作测评系统对于教学质量的提升作用。科学技术的进步,

作文智能评阅系统在大学英语写作课程中深入应用的

优势还在于它完全符合当今的《大学英语课程教学要求》,顺应了“以现代信息技术,特别是网络技术为支撑,使英学习方向发展”的潮流。

语教学不受时间和地点的限制,朝着个性化学习、自主式

二、国内外研究的现状和趋势1.国外AES技术发展近况

作文自动评分(AES,Automated

定义为“给作文自动评价和评分的计算机技术”,是作文智能评阅系统中的关键技术。其实早在40多年前国外就有人1966,1968),至今此技术还有很多方面要完善,但电脑辅

设想以计算机技术为基础的作文评分系统。(Page,助的作文评分系统已成为老师批改作文方式中的一个可行

网gr改o.批ia酷g句.pi

www

网gr改o. 批ia酷g句.piwww

网gr改o. 批ia酷g句.piwww

网gr改o. 批ia酷gi句.pwww

〔文献标识码〕A

〔文章编号〕1003-6547(2012)11-0189-02系统的不足,勇于面临挑战,提高其信度和效度。借鉴(梁茂成,文秋芳,2009)。“In

a1.,1998b);第二个模块为句法多样性(syntactic

Essay

Scoring)被

al.,2001

Valenti

et

外,尤其是美国,得到了长足的发展,并已付诸应用

(Elliot,2003)。然而,研究人员仍需要更好地了解自动评分

国外最具代表性的三种作文自动评分系统(PEG、IEA

和E-rater),认为这些评分系统在训练及作文的人工评分方法和机器评分效度等方面存在一些问题,不可否认的是这些作文自动评分系统为我国自主开发作文自动评分系统提供了

PEG分析重点是语言层面,长处是能合理客观地分析语

言的质量,不足表现在两方面,一是对文章内容不作分析;二是只对文本的表层特征进行分析。IEA分析重点是文章的内容,长处是能合理客观地分析作文内容的质量,不足一是对作文的语言质量不分析,二是对文章的篇章结构不作分析。而E-rater对文章的语言,内容和篇章结构三个方面都作分析。Burstein等人把这三个方面称作为模块(Burstein

Marcu,2000)。E-rater的第一个模块为话语篇章结构

conclusion”等总结词的方法得以实现(Bursteine

et

(discourse)分析模块,主要靠在文本中搜索“Insummary”,

variety)

分析模块,根据作文中多样性的句子结构和语言质量来进行评分;第三个模块为文本内容(content)分析模块。在这一

模块中,E-rater通过矢量空间模型和提取变量,统计作文中是否具有与作文题目相关的主题词。将这三个系统进行比

较,可以看出E-rater在写作智能评分过程中力求兼顾作文的内容和语言形式,是一种较为全面的写作智能评分系统。E-rater与人工评分之间的一致性一直高于97%(Burstein

et

a1.,2003)。长处在于三个模块

与人工评分要素更为一致。不足在于,一是对语言质量的分析不够全面;二是对文章的内容质量分析不力;三是对篇章

的选择(Page&Peterson,1995)。自动作文评分研究在国

(项目号:2012SJD740002)的阶段性成果。

[收稿日期]2012-08-13

基金项目:本文为江苏省教育厅高哲社科研究项目“英语作文智能评阅系统在二语写作教学中的应用研究”

[作者简介]吴方(1979-),女,江西九江人,南京工业大学外语学院讲师,硕士,研究方向:语言学及应用语言学。

理论界2012第11期

189

··总第471期

结构的分析拘泥于文本的表层特征。

虽然有人对自动写作评分系统的前景持怀疑态度,但很多观点还是对此持肯定态度的(Wresch,1993)。自动作文系统的评价强调了语言规则和语法约定等方面,而牺牲了一些无形的写作要素:如文章的思想内容,流利度和连贯性。根据这种观点,电脑能够对作文中特定的词语或结构给出分析,但不能像人类读者那样去真正理解和欣赏作家在文章中所传递的情感和信息。甚至智能写作系统的开发者也承认,虽然自动写作评分系统是教学和评估的有用的工具,但他们不可能取代写作老师。(Rich11-27)。

Swartz,个人通信,2000-

【教育求索】

成192个子维度进行测量,进行加权平均之后会形成总分和词汇、句子、篇章和内容四个维度的得分;同时,还可以根据比对语料库生成评写错误、语法错误、中式英语、高分句型和易混词汇等反馈。学生可以根据反馈进行自助作文修改,在不断修改的过程中提高自己的作文水平。

四、研究本课题的意义和价值

从相关文献研究可以发现,目前国内与作文智能评阅系统相关的研究主要集中在系统的设计与开发方面,有关作文智能评阅系统在二语写作教学中的应用研究基本上是空白的。

2011年9月我们南工大外语学院与句酷批改网合作,让老师试使用批改网的智能写作批改系统批改学生的作文,智能写作评阅平台辅助老师批改作文同时也提高学生的英语写作能力。经过半年的亲身体验,体会到了智能写作评阅系统带来的好处,如它可以极大地降低教师的批改作文的工作量,教师可以把充足的时间和精力放在教学组织和讲解上;同时学生可以写出更多的文章,写作能力会提高得更快。同时在使用此系统的过程中也发现了一些问题。例如智能系统只能针对学生的语法,词汇难度及句法进行评价考核,而对学生的语义,内容是否与主题相连是无法判断的。因此,在智能写作批改平台使用半年后,学院对大外教研室的全体教师进行了问卷调查,是否愿意下学期继续使用此写作平台。大概有52%的老师觉得这个平台利大于弊,仍然想继续使用。

本人将在下学期,针对将教的2012级的六个班级的学生

三、国内AES技术发展近况

我国在英语作文自动评分技术方面的研究近年来也取得了一些进步。由于开发成本等原因,我国的科技工作者对AES技术的研发工作尽管倾注了很多心血,但其研究和开发速度仍然缓慢。系统”

1.梁茂成等开发的“大规模考试英语作文自动评分

2005年,梁茂成教授主持开发“大规模考试英语作文自动评分系统”,该项研究成果可实现对中国学生英语作文的大规模机器评分,具有极大的实用价值。该系统的工作原理:提取浅层文本特征,对内容的潜在语义进行分析,再运用线性回归,进而得出评分。虽然实验结果与人工评分相比

较达到了较高的相关度,但“由于以浅层特征的统计分析为尚有一定的距离”。

主,以及样本数量、范围的局限性,其评分模型与实用系统

2.冰果英语智能作文评阅系统

2009年,浙江大学外语学院与杭州增慧网络科技有限公

司联合开发出一款“冰果英语智能作文评阅系统”。消息传出,顿时在报刊网络上引起热议。据新华报业网报道,开发商称:人工智能抓取准确率95%;英语老师说:电脑打分与电脑无法指出错误所在;专家指出:有些活是电脑代替不

人工有出入(教师称15分制作文,有2分误差);学生反映:了。该系统的工作原理和其他参数未见有说明。该系统针对日常作文训练,而非大规模考试。另外,该系统未能指出作文中的句子语法结构和单词拼写的错误。可见,此系统还要加大投入。

3.句酷批改网的英语智能作文评阅系统

句酷批改网(www.pigai.org)是一款基于语料库和云计

算的英语作文自动批改在线服务,旨在提高老师批改网英语作文的工作效率,提高学生的英语写作能力。批改网的原理是比较学生作文和标准语料库之间的距离,并通过一定的算

法将距离映射成分数、总评和按句点评。每篇作文都会分解

网gr改o.批ia酷g句.pi

www

网gr改o. 批ia酷g句.piwww

网gr改o. 批ia酷g句.piwww

网gr改o. 批ia酷gi句.pwww

显著性。

另外48%的老师认为批改网对学生的写作能力帮助不大。就使用智能写作评阅系统的体验进行问卷调查,并进行对比试验,把使用智能写作平台的班级和使用常规写作教学的班级的作文得分加以分析,并用SPSS系统分析其差异是否具有

目前大多数高校的大学英语写作教学仍然停留在写作技

巧的讲解、写作训练严重匮乏的阶段,随着计算机的普及,

尤其是网络教学的推广,作文智能评阅系统在大学英语教与学各个环节中的涉足一定能够提高大学英语教学水平。■

参考文献:

[1]Attali,Y.andBurstein,J.AutomatedessayscoringwithE-raterV-2,0[A].PaperoftheInternationalAssociationforEducationalAssessment(IAEA),Philadephia.June13-18,2004.

[2]Ben-Simon,A.&Bennett,R.E.TowardMoreSubstantivelyMeaningfulAutomatedEssayScoring[J].JournalofTechnology,LearningandAssessment,2007,(1).

[3]葛诗利,陈潇潇.国外自动作文评分技术研究[J].外语电化教学,2007(5).

[4]梁茂成,文秋芳.国外作文自动评分系统评述及启示[J].外语电化教学,2007(10).

责任编辑:邱枫

190

2012第11期理论界


相关文章

  • 网络作文自动评分系统的评述和发展
  • 龙源期刊网 http://www.qikan.com.cn 网络作文自动评分系统的评述和发展 作者:吴晓萍 来源:<文教资料>2014年第34期 摘 要: 基于计算机网络的作文自动评分系统能够在一定程度上解决教师作文评阅负担重和 ...查看


  • 冰果英语作文系统使用说明(学生用户)
  • 冰果英语作文系统使用说明 2010级所有本科生从下周开始,在冰果作文智能评阅系统上定期完成作文,要求每周一篇.具体操作如下: 一. 在地址栏里输入http://writing.heep.cn,进入冰果英语智能作文评阅系统,点击"学 ...查看


  • 小学生阅读杂志
  • 小学生阅读优秀杂志 一. 故事类 1.[少年文艺](上半月) 邮发代号:28-14 定价:每本3.50元.全年十二本. 简单介绍:以阅读照亮人生,以真情温暖心灵.以快乐陪伴成长,以交流展示才华. 2.[少年文艺](下半月) 邮发代号:28- ...查看


  • 电气工程学科一级硕士研究生培养方案2016
  • 电气工程学科一级硕士研究生培养方案 (学科代码0808) 一.学科.专业简介 本学科于2009年获得电气工程一级学科硕士学位授予权,含有电机与电器(080801).电力系统及其自动化(080802).高电压与绝缘技术(080803).电力电 ...查看


  • 毕业设计指导教师评语
  • 毕业设计(论文)指导教师评语 论文选题符合专业培养目标,能够达到综合训练目标,题目有较高难度,工作量大.选题具有较高的学术研究(参考)价值(较大的实践指导意义). 该生查阅文献资料能力强,能全面收集关于考试系统的资料,写作过程中能综合运用考 ...查看


  • 我们如何做科学研究-MIT
  • 麻省理工学院 人工智能实验室 AI工作论文316 1988年10月 麻省理工学院人工智能实验室 如何做研究 MIT AI实验室在读.毕业及名誉研究生共同编写 David Chapman 编辑 1988年9月 第1.3版 张 陈 李明明 译 ...查看


  • [名家]祝智庭:智慧校园建设与应用新发展
  • WeEdu:我们的教育--每天关注咱们的事儿... 编者按:此文为华东师范大学终身教授和教育技术学博士生导师祝智庭在"湖北省首届智慧校园建设高端论坛"上的讲话,他介绍了上海.杭州等地的教育信息化建设案例,系统阐述了智慧校 ...查看


  • 中考网上阅卷规定
  • 中考网上阅卷24日开始,420名教师参加,预计7月5日完成. "网上阅卷"指的是,学生答题卡扫描后,卡上的选择题由计算机直接判分,主观题扫描后,按题切块分给评卷老师,在计算机屏幕上批改. 评卷分三个阶段,第一阶段6月24 ...查看


  • 辅导教师工作手册(湖南国培项目)-改
  • 目录 培训方案 ................................................................................................................ ...查看


热门内容