一年一度的高考来了 国产大模型谁的作文写的好?
恰好今年的年度高考题目就与人工智能有关,我们来看看谁家“孩子”能拿下高分?
一年一度的高的作的好高考再次登上热搜,去年高考,考国ChatGPT以及国产大模型首发团队文心一言、模型讯飞星火、文写阿里通义千问等掀起大模型写作文的年度大混战,有的高的作的好号称满分,有的考国被批零分,有的模型文采有余情感不足……经过一年的时间这些大模型能力是否有大幅提升?恰好今年的高考题目就与人工智能有关,我们来看看谁家“孩子”能拿下高分?我们评测了国内知名的文写五家大模型产品:百度文心一言、科大讯飞星火、年度Kimi、高的作的好腾讯元宝、考国阿里通义千问。模型
先说结论:讯飞星火,文写完胜。Kimi只是给了一个稿件提纲,其他则陷入了题干中关于“问题”的陷阱中。
新课标Ⅰ卷作文题目:
随着互联网的普及、人工智能的应用,越来越多的问题能很快得到答案。那么,我们的问题是否会越来越少?
以上材料引发了你怎样的联想和思考?请写一篇文章。
要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。
讯飞星火
文心一言
腾讯元宝
KIMI
通义千问
我们再看一遍这道作文题:
随着互联网的普及、人工智能的应用,越来越多的问题能很快得到答案。那么,我们的问题是否会越来越少?
以上材料引发了你怎样的联想和思考?请写一篇文章。
这道题的题眼是“问题”二字,阅读材料里“问题”出现了两次,这两个“问题”其实是不同的内涵,根据新华词典的解释,第一个“问题”对应着“答案”,是“要求回答或解释的题目”的意思,而第二个“问题”是“需要研究并加以解决的矛盾、疑难”的意思,可以说第一个“问题”是狭义的,第二个“问题”是广义的,类似英文中question和problem的不同。
文心一言、腾讯元宝、通义千问、Kimi都掉进了第一个“问题”的陷阱,一直在重复关于好奇、求知、解答、知识这些浅层话题,而讯飞星火明显分辨出了两个“问题”的不同含义,在文章中段就将讨论范围从狭义的需要个体解答的“小问题”延伸到了广义的人类社会共同面对的“大问题”。
这体现的不是简单的“考试状态”,其背后充分体现了星火大模型在语言理解这一大模型核心能力上的领先。
为了能更好打分,我们按照全国高考作文评分标准对几篇文章做详细分析
文心一言:
基础等级方面,文章始终没有对互联网和人工智能对解决问题和产生问题的核心做出解读,明显偏离题意。结构方面,尽管有“首先……其次……再者……综上所述”这样看似严谨的结构支撑,但段落和段落之间,段落和结论之间,关系并不紧密。
发展等级方面,文心一言分别引用了爱因斯坦、牛顿的名言和一句古诗,一如既往的“掉书袋”看似有创意、有文采,但仔细看来,其内在逻辑其实比较混乱,比如这一段。
牛顿的话是关于科学传承,对这名言的引用显然有“驴唇不对马嘴”的感觉。
总体打分:35分
科大讯飞
基础等级方面,开篇点题,中段在“个体体验、信息爆炸、人工智能道德伦理”三个方面分析问题,结尾回归“人类的智慧、勇气和决心”升华价值,内容和表达无懈可击。
发展等级方面,深刻与丰富做得很好,文采和创意有所欠缺,星火是唯一一个通篇没有引用名人名言的“考生”,像是个严谨的理科生。
总体打分:55分
腾讯元宝
对题目的理解更加狭隘,感觉通篇一直在重复一种观点“问题是个好东西”,这是大模型语言理解能力欠佳的表现。每一句话都自然流畅,名言引用也比较恰当,但所有句子凑在一起产生了一种“废话连篇”的感觉,这是大模型文本生成能力欠佳的表现。毕竟腾讯元宝在5月底刚刚发布,也许不能要求太高。
总体打分:32
Kimi
作为以长文本著称的大模型,高考作文理应是Kimi大显身手的机会,但结果却令笔者有些意外,Kimi输出的文章在内容上并无特别之处,最大的区别是它给每一段加上了小标题,没展示出长文本理解和生成的核心能力,却有类似“标题党”的小伎俩?不得不感慨:“Kimi真是个小机灵鬼。”
总体打分:42
通义千问
去年的高考作文AI写作中,通义千问饱受诟病,被批“空洞没营养”,今年的通义千问有明显进步。通义千问的优点跟讯飞星火一样,具备语言理解和文本表达的广度和深度,缺点跟文心一样,错误引用名人名言刻意展示文采,可谓集众家所长,及所短。
总体打分:49
Chatgpt 问世以来,“写文章”成为人工智能大模型产品展示能力的普遍手段,高考作文有着严格明确的要求,以及相对严谨科学的评分标准,无疑是最佳的试金石。通过本次评测明显看出,讯飞星火大模型在语言理解和文本表达上的表现更胜一筹,拿高分实至名归,你们觉得呢?当然各位也可以打开手机或者电脑试试看,如高考作文题目所言,随着互联网的普及、人工智能的应用,这个问题能很快得到答案。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
62
-
浏览
4468
-
获赞
5
热门推荐
-
美潮 KITH x《教父》联名系列正式发布,经典重现
潮牌汇 / 潮流资讯 / 美潮 KITH x《教父》联名系列正式发布,经典重现2020年01月19日浏览:4149 前不久,美乐淘潮牌汇曾带来了高街美潮 KITH 即将整改开机广告不能满足于“一键关闭”
近日,江苏省高级人民法院终审驳回乐融致新电子科技天津)有限公司的上诉,江苏省消保委提起的全国首例智能电视开机广告消费民事公益诉讼终审获胜。开机广告是近年来随着智能电视机发展出现的新商业形式,在销售电视附近时尚运动服装店地址,附近名牌运动服专卖店
附近时尚运动服装店地址,附近名牌运动服专卖店来源:时尚服装网阅读:858杭州批发女服装批发地址(杭州衣服批发市场高档)地址:浙江省杭州市江干区航海路61-69号 杭州中兴外贸服装城 杭州中兴外贸服装城重症医学科小儿ICU分工解读医院年度评价重要规章制度
为更好地迎接医院年度评价,帮助科室成员了解掌握医院重要规章制度,重症医学科小儿ICU对《四川大学华西医院重要规章制度汇编》实行任务分配,分为4组进行分工解读,每组由4-5名核心成员负责。8月13日晚1严格!鲁梅尼格:C罗连庆祝进球的动作都要练
严格!鲁梅尼格:C罗连庆祝进球的动作都要练_球员www.ty42.com 日期:2021-09-17 10:01:00| 评论(已有302509条评论)临床营养科/营养膳食中心开展了“食物中毒应急预案培训及演练”活动
为健全完善食品安全应急体系建设,加强突发公共卫生事件处置能力,8月8日下午13点,临床营养科/营养膳食中心开展了“食物中毒应急预案培训及演练”活动。本次活动以我院职工在我院餐厅进餐后发生食物中毒为背景美国俄亥俄州一建筑发生天然气爆炸 致1死7伤
当地时间28日,美国俄亥俄州扬斯敦市一座建筑内发生爆炸,目前已经造成1人死亡、7人受伤,另有1人下落不明,建筑物严重受损。当地应急管理局在社交媒体上发文称,事故原因是天然气爆炸,并建议当地人员避开事故英雄联盟手游派克怎么玩
英雄联盟手游派克怎么玩36qq6个月前 (12-04)游戏知识111融创转移抵债资产收益 东方雨虹受损
近日,关于成都环球中心天堂洲际大饭店以以物抵债的形式易主给了东方雨虹的消息在快速传播中,从知情人士处确认该消息属实。经记者向知情人士了解,东方雨虹在接受成都环球中心天堂洲际大饭店以物抵债后发现融创已将新预告片曝光《寂静岭2》重制版10月8日发售
备受期待的恐怖游戏《寂静岭2》重制版终于确定了正式发售日期 - 2023年10月8日,登陆PCSteam)和PS5平台,售价70美元。《寂静岭2重制版》发售日预告:在最新发布的预告片中,我们可以看到主你做广告 我花钱退订?算盘不能这么打
不少电商平台均有短信推送商业广告的形式,但并未明确短信退订费由谁承担。去年,某生鲜电商平台被用户王女士告上法庭。法院认定,用户协议中未约定退订费用谁负担,判决由平台方承担0.1元短信退订费。日前有平台乐乐茶承认侵害鲁迅肖像权,门店已撤掉相关包材周边
tiffany蒂芙尼官方旗舰店(tiffany蒂芙尼官方旗舰店750lTALY)
tiffany蒂芙尼官方旗舰店(tiffany蒂芙尼官方旗舰店750lTALY)来源:时尚服装网阅读:4345国贸有卡地亚和蒂芙尼专柜吗1、您好,很高兴为您服务。根据我们的调查,东莞国贸有卡地亚专柜,恶意弹窗广告岂能想弹就弹
近日,国家网信办发布消息,即日起对手机浏览器进行专项集中整治,并点名UC、QQ、华为、360、搜狗、小米、vivo、OPPO等8款手机浏览器,要求不得PUSH弹窗“自媒体”发布WIND AND SEA x Fxxking Rabbits 联名系列 Lookbook 赏析
潮牌汇 / 潮流资讯 / WIND AND SEA x Fxxking Rabbits 联名系列 Lookbook 赏析2018年12月11日浏览:5598 继早前释出