科大讯飞相关负责人表示,这些都离不开科研人员研发的学生认知诊断和个性化推荐系统,该系统首先深度挖掘学生做题的历史大数据,对学生认知状态进行精准诊断,进而针对学生的薄弱项、结合多种教学和学习目标,对学生进行个性化题目推荐。
由此,基于对学生作业数据的采集生成的个性化作业报告,系统可以分析学生各维度能力状态和变化、形成个人能力画像,并且针对性进行个性化推荐。此外,系统将根据每位学生错题不同,推送不同题量、以及不同难度的个性化作业,个性化问题及时解决。
“采用自适应推荐技术,能够基于对学生知识状态的精准诊断,实现教育资源和学生之间的智能匹配,从而能够推荐更加适合学生的个性化学习路径。”科大讯飞相关负责人强调。
阅卷 机器学习建立模型,全面掌握评分标准
阅卷,是老师教学工作中非常重要的一环,也是耗时费力的一环。如果人工智能能够替代或辅助老师对考试和作业评分,将极大减轻老师负担,为教师减负与诊断学生学习情况提供有力的工具。
在大规模考试的智能阅卷中,评分的主要需求点是准确、高效,面向课堂作业和考试的评分等,则需要“有营养”的点评和批改反馈,特别是对语文作文的批阅。有专家指出,传统方法利用自然语言处理浅层分析的结果构建特征,如文章的长度、段落数、词汇丰富性等。但不难发现,这些特征与人评价作文时考察的维度和深度相距较远。以高考作文评分规范为例,评判标准除了考察其题意、内容、语言、文体等基础等级,还要考察其深刻、丰富、文采、创意等发展等级,这为机器评分带来相当大的难度。
针对上述问题,哈工大讯飞联合实验室相关负责人介绍,可以利用机器学习算法根据少量人工评分的样本学习一个预测模型,其中的关键是构建和利用有效的特征来描述作文、指示作文的质量。这套系统除了使用常用的浅层表征外,也针对诸如文本通顺、文采、立意分析、篇章结构等难度较高的维度进行探索。例如,对语法错误的诊断,是以预训练语言模型为基础,结合少量标注数据和大规模自动构建的伪数据,进行错别字、语法以及标点、成语等多类型错误识别。
对于文科主观题评分,系统首先通过版面和图文识别获得题目和学生作答内容,而后利用智能定标筛选具有代表性的学生作文进行专家定标评分并学习评分模型,最后,对机评结果进行汇总和分析。为了提高定标数据标注的效率和效果,研究人员提出“专家随机抽取+智能挑选样卷+聚类分段补充”的定标集选取方法,提升了评分模型对于各分数段的建模能力,符合高考等考试环境下考生成绩呈正态分布的特点,拓展了对专家评分和阅卷教师评分的综合学习能力,使得计算机智能辅助评分系统能够通过有限的定标数据,更加全面地理解和掌握评分标准。目前,该系统每年服务考生超过600万。