今年的高考作文涉及到人工智能,其实有点意料之内、情理之中,只是不知道会以什么形式出现,这不就来了。
新课标I卷
阅读下面的材料,根据要求写作。(60分)
随着互联网的普及,人工智能的应用,越来越多的问题能很快得到答案。那么,我们的问题是否会越来越少?
以上材料引发了你怎样的联想和思考?请写一篇文章。
要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。
原本我也想写一篇各家大模型如何写高考作文的测评,不过看到全网都在测,千篇一律的瞬间就觉得没意思了……就是不太喜欢做跟别人一样的事情!
于是我从另外一个角度想,假如让AI成为高考作文阅卷老师,来对高考作文进行批阅,那么它的评分标准和流程又会是什么呢?
如果评分标准定好了,是不是就不需要一张一张去阅了,把100张甚至1000张卷子同时喂给AI,那是不是就可以早点下来成绩了!
怀着这种激动的心情,我立刻就上手去操作了,现在把整个流程给大家演示一下。
注明:接下来我会让Chatgpt4o扮演阅卷老师,让其他国内大模型扮演高考生,看看Chatgpt给各家大模型打多少分
第一步:先让Chatgpt4o明确评分标准,最关键的是,评分标准的依据是什么?具体如下。
再来第二步,我让它按照以上评分依据,在作文满分60分的前提下,重新设计一份评分体系。
在这儿有个问题,AI貌似对算数非常不擅长,我打眼儿一看,让它写个60分总分,它给写了个70分……
于是我让它自己检查一下总分是不是60分,还好,它还知道自己计算出错,所以重新算了一个分享得分,过程我就不展示了。
评分体系是很清楚了,但全都是文字,看起来不方便,我让Chatgpt接下来将以上评分按照表格形式整理一下。
不得不说能直接输出excel表格这个功能,真的太逆天了。Chatgpt真是当之无愧的多模态大模型。
工具都已经准备好了,现在就来到最好玩的一步啦,让Chatgpt4o扮演阅卷老师,给国内的各个大模型输出的“高考作文”打打分吧,
同样主题下,我用了Kimi、智谱清言、通义千问、天工AI、文心一言、讯飞星火、万知、腾讯元宝8个。大家猜一下,谁会在这个修罗场里胜出?
现在我们让Chatgpt给我们开始评分吧,在这我不一一放上了,后面会给汇总表,过程只放一个展示一下就行。
当我把8篇文章一一喂给Chatgpt之后,它给我反馈的分数分布图如下,其实把8篇文章放一起做对比,既然不是AI我们也能看出一些好坏。
从一定程度上来说,这个评分还算是较为客观的,评分高的讯飞星火、腾讯元宝、通义千问、天工AI,在相同的要求下,出来的文章质量的确要高一点。
文心一言在意料之内,Kimi和智谱倒是让我没怎么想到,可能是打开方式不对
不过,这个分数也不代表权威,只是说一种方向和可能性,也并不严谨。未来可以将以上做成智能体,在知识库中设定好标准,那么我们需要做的,就是上传所有我们需要批阅的卷子,点一下开始,一切都会非常迅速地在几分钟之内结束~
暂无评论内容