中文作文(在线)自动评分
项目介绍
亮点:作文是K12教育中唯一没有能够实现标准化阅卷的。

1、项目背景
1991-1996,本人曾研发过国内第一套文本自动校对系统,利用语言模型、编码原理、译码原理实现了汉语错误的发现和校正。
2014年初,接到华谊兄弟等影业公司需求,研究如何对大量的剧本初稿进行自动筛选,开始研究语义、语境的计算方法。
2015年8月,参与设计新闻自动评价软件设计。10月,受一些在线教育公司委托,研究作文自动评分。

2、评价项目与性能指标
1)评价项:
本文主题: LDA等主题计算方法实现
主题表达(满分10分):主题的描述程度
主题情感倾向(满分10分):正面、负面、中性?乐观、悲观?
破题立论(满分5分):开篇是否点题
扣题结论(满分5分):结尾是否扣题
主题一致性(满分30分):全文是否主题一致,分论点是否和主题相关
修辞与表达(满分20分):修辞手法和典故应用
字词基础(满分20分):词汇应用能力、词汇量、字词错误、版书
-------------------------------------
全文总分(满分100分):

2)速度:
目前5000字以内,在windows7平台,耗时10秒。随着程序的进一步细化和评估水平的提高,耗时将达到15-20秒之间。
3)可信度:
对于90分以上的高分和60分一下的低分,可信度100%。
71-81分的可信度只有80%左右,有些人工主观评价较好的,机器客观评价较差,但是是有数据根据的,比如领导人的讲话和政务活动的新闻通稿。

3、与同类产品的差异性
1)美国教育考试处的E-rater系统,自1999年以来已经进入操作阶段, 至2003 年, 共评定GMAT等作文750, 000篇。以前这类写作评价软件主要都是针对第二语言()(赴美外国留学生)的,偏重于词法和语法检测。
2)近期美国哈佛大学和麻省理工学院合作的EdX英语写作评价系统已经被美国20多所大学和在线教育网站应用于本土大学生写作评价。它的语义和语言评价较弱,强调的是学生之间的互相打分,每人给10个同学打分,交叉评估。
3)我国的科大讯飞和哈工大也在研发类似系统,它的定位较高,目标是高考自动阅卷,原理上偏重于机器学习,根据同次高考的部分抽样,提取不同分数段的文本特征,然后再对未知的文本进行上述特征的比对进行评分,属于相对标准。
4)一鸥软件的产品定位是文本写作的质量评估,对象是在线作文培训、剧本、新闻稿件等。在方法上采用的是基于语料库的语义计算,依靠的是绝对标准,包含但不限于文字、词汇、修辞,竞争亮点在于语义和主题计算。

4、商业化前景
1)免费建立网站和微信公众号,通过在线教育和培训、青少年书籍、食品、旅行、留学等广告获利。
2)为其他在线教育网站提供作文评价技术服务。
3)为付费的个人用户和机构(影视传媒、名牌中小学)提供无广告的评估服务。
4)与运营商合作,SP分成,中移动教育基地提出了包月制和按条付费的建议。

5、未来发展
1)基于篇章和句段的写作辅助工具(Writting Tools)。
2)基于语义的中英文辅助翻译工具(CAT)
广州一鸥软件科技有限公司

www.yalesoft.cn

商业计划
  • 天天投手机客户端

    建议
    反馈