三星写电子卷子是什么应用 科大讯飞付瑞吉:机器评分已经应用于安徽,江苏高考

小编 2025-05-02 电子应用 23 0

科大讯飞付瑞吉:机器评分已经应用于安徽、江苏高考

搜狐科技讯

11月26日,由搜狐科技主办的“2019搜狐科技AI峰会”在北京举行,峰会旨在解读AI前沿新技术,探索行业新趋势。

在峰会下午的教育论坛上,科大讯飞北京研究院副院长付瑞吉发表了题为《智能评阅核心技术及应用简介》的主题演讲。

付瑞吉介绍,科大讯飞在教育领域做了很多事情,包括考、评、管、教和学都有产品和应用。付瑞吉称,科大讯飞的在教育领域的技术和应用已经大规模服务各种考试、以及学生和老师。比如已经是在全国普通话水平考试30多个省当中应用,累计服务1700万名考生,还有就是在英语口语考试当中,我们在广东、北京、天津、上海等等十多个省市的高考当中得到应用。

付瑞吉特别提到,科大讯飞的评阅技术已经应用于中高考。比如安徽和江苏的高考,主要用于质检,实际上是在人工评分的同时进行机器评分,如果发现人工评分和机器评分有很大分差的话就会请专家进行仲裁评分,如果有问题就进行修正。 人工智能技术在日常考试评阅中的应用,维护了高考考试的公平和公正。

以下为付瑞吉演讲全文:

各位来宾,大家下午好,非常感谢搜狐科技邀请我来做这样一个分享。我们都知道,科大讯飞在教育领域做了很多事情,包括在考、评、管、教和学方面都有一些产品和应用,今天就和大家分享一些我们在考试当中的应用,也就是智能评阅技术。

我们是和教育部考试中心在2016年成立了这样的联合实验室,共同推进语音识别、手写识别、自然语言处理、智能评测和机器翻译这些技术在教育领域当中的应用,实际上我们是从2014年就开始研究智能评阅相关的技术了。

科大讯飞是做语音起家,我们从2005年就在研究口语评测,现在我们已经是在全国普通话水平考试30多个省当中应用,累计服务1700万名考生,还有就是在英语口语考试当中,我们在广东、北京、天津、上海等等十多个省市的高考当中得到应用。口语评测是对口语考试当中学生语音的流利度、精准性进行分析,我们的技术在准确率和相关性都已经达到了专家的水平。

基于口语评测技术启发,我们进行智能评阅研究,就是面向纸笔考试,口语评测和智能阅卷进行对比,也会扫描阅卷图片。语音评测一方面是对发音的准确性进行评价,另一方面是对文本语义进行评价,通过语音识别转化成为文字,综合在一起就会变成口语评测的结果。我们的智能评阅也是这样,图片进来以后首先会对书写质量评价,然后进行图文识别,并且对语义层面进行评价,非常的相似。

我们就拿最难的作文自动评阅技术来讲,实际上是对学生的中英文作文进行自动评分和批改,一方面是减轻阅卷员的阅卷负担,另一方面是便于评分的质检,保证考试的公平公正,应用于两大方向,一是大规模考试,二是日常教学。

这是一个简单的技术框架,作文自动评分参考中高考的评分标准,然后作为我们考察的维度,通过机器学习进行评分模型的训练,然后可以对考试的试卷进行自动评分,批改是在此基础上进行错误的检测,然后给考生一些反馈,主要也是应用在日常的教学过程当中。

我们来看语法检错。这方面需要检测语法当中缺词、多词、用词不当的样例和错误,(我们)去年参加了国际的语法检错大赛并且获得冠军,我们会把这项技术应用于作文评分错误检测以及作为评分维度使用。一篇作文比较复杂,谋篇布局是什么样子,通过全局和局部的语音关联技术可以把作文当中的论点、论据和相关决策识别出来,一篇文章的脉络就能够清楚地展现在我们面前,结构的好坏可以作为评分的标准依据。

表达方式就是记叙、描写和抒情,相关的表达方式都可以识别出来,作为我们评分的标准,比如有些好的作文可能描写会比较丰富和细腻,我们把它作为特征使用,修辞手法就不详细讲了,采用多任务识别的过程,比如通常的比喻、拟人、排比等等修辞,文本的相似度检测就是检测抄袭前面的阅读理解,这些在大规模考试当中老师都是很难发现的。

大规模应用考试就是中高考的考试,规模是几万人到几十万人,需求主要是质检或者替代人工评分,日常教学当中规模会小一些,平常的周测和月考等等,但是需求会更多一些,除了评分之外还需要批改的结果,因为平常的教学过程当中只给学生评分是起不到提高的作用,也需要给学生一些反馈,也需要给老师报告,就是你所在的班级当中评分作文的情况,便于老师进行教学。

我们来看应用的情况,大规模考试的过程当中,近几年我们在多地的中高考进行应用,比如安徽和江苏当中的高考进行应用,主要用于质检,实际上是在人工评分的同时进行机器评分,发现人工评分和机器评分有很大分差的话就会请专家进行仲裁评分,如果有问题就进行修正。当然,英语作文、简答题和数学等等考试当中都有应用,专家针对这种辅助技术的使用也给予好评,使得我们的人工智能技术在各地的推广奠定了基础。这是《中国考试》期刊上发表的两篇论文,很多数据也是从论文当中摘取。

日常的教学使用主要是针对字词语法抄袭的常见问题进行辅助诊断,帮助老师减负,我们在2000多所学校里三年以来的累计服务增长了十余倍,助力近万名老师。

以上就是我的分享,谢谢大家!

实际上,AI与各行各业的结合已经深入肌理,传统行业都在面临着前所未有的变革窗口期。借助AI实现企业的转型升级,已经从以往的锦上添花变成了如今迫在眉睫。AI将如何重塑行业,行业需求又如何倒逼AI技术的发展,成为了值得探讨的问题。

大会上午的主论坛共分为“AI重点相关技术”与“AI重点场景应用”两大板块,除了邀请中国工程院院士邬贺铨、搜狗公司CEO王小川、三星电子中国研究院院长张代君为我们解读AI发展的最新进展外,还邀请了来自IoT、零售、自动驾驶、金融、医疗五个领域的知名大咖来分享AI与行业的结合。而下午的分论坛则更为聚焦,深入探究AI如何改造零售、教育这两个关乎国计民生的行业。

除本篇外,搜狐科技还针对此次大会进行了全方位的报道,敬请关注本次峰会专题!

百度智能云升级两大AI基础设施,文心大模型日调用量超7亿次

9月25日,2024百度云智大会在北京召开。为帮助企业更快、更好、更省地使用大模型,百度智能云分别针对算力、模型、AI应用,全面升级百舸AI异构计算平台4.0、千帆大模型平台3.0两大AI基础设施,并升级代码助手、智能客服、数字人三大AI原生应用产品。

百度集团执行副总裁、百度智能云事业群总裁沈抖表示,大模型以及配套的算力管理平台、模型和应用开发平台,正在迅速成为新一基础设施。

“2024年大模型的产业落地正在加速,目前在千帆大模型平台上,文心大模型日均调用量超过7亿次,累计帮助用户精调了3万个大模型,开发出70多万个企业级应用。过去一年,文心旗舰大模型降价幅度超过90%,主力模型全面免费,最大限度降低了企业创新试错的成本。”沈抖说。

百度集团执行副总裁、百度智能云事业群总裁沈抖

升级百舸4.0:模型训练有效时长达99.5%,可高效管理十万卡集群

大算力是大模型落地的基础条件。为满足企业落地大模型从集群创建、开发实验,到模型训练、推理的全旅程算力需求,应对超大规模GPU集群高成本、难运营两大挑战,百度智能云升级发布百舸AI异构计算平台4.0,面向万卡、十万卡集群全面升级算力管理能力。

首先,在集群创建阶段,企业通常需要进行大量复杂、琐碎的算力配置和调试工作。百舸4.0预置了主流的大模型训练工具,能够实现工具层面的秒级部署,并将万卡集群运行准备时间从几周缩减至1小时,极大地提升部署效率,缩短业务上线周期。

百度百舸AI异构计算平台4.0

在开发实验阶段,企业需要针对业务目标对不同架构、参数的模型进行多次测试,进而制定最佳模型训练策略,保障后续训练的性能和效果。百舸4.0全新升级的可观测大盘,能够对多芯适配、集群效能、任务自动容错等方面进行全方位监测,提供直观决策依据,帮助用户更好地把控整体项目。

在模型训练阶段,稳定和高效是衡量GPU集群水平的“金指标”、“硬通货”。

在稳定性方面,一张GPU出现故障就会导致集群整体停摆,大量时间、成本浪费在故障恢复和数据回滚上。百舸4.0能够自动筛查集群状态,并基于对GPU故障的精准预测,及时转移工作负载,降低故障发生频次。此外,百舸独有的故障秒级感知定位、Flash Checkpoint模型任务状态回滚等技术,能够大幅减少集群故障处置时间,实现接近无损的集群容错。

目前,百舸在万卡集群上实现了有效训练时长占比99.5%以上,业界领先,极大地节约了客户算力与时间成本。此外,百舸4.0通过在集群设计、任务调度、并行策略、显存优化等一系列创新,大幅提升了集群的模型训练效率,整体性能相比业界平均水平提升高达30%。

在模型推理环节,百舸则通过架构分离、KV Cache、负载分配等一系列加速方法,实现了模型推理的降本提效,尤其在长文本推理方面,推理效率提升超过1倍。

面向未来,沈抖认为,大模型的Scaling Law将在一段时间内持续有效,很快就会有更多的十万卡集群出现,但是管理十万卡的难度与管理万卡有着天壤之别。

首先,在物理空间方面,十万卡集群需要占据大概10万平方米空间,相当于14个标准足球场的面积;在能耗方面,每天则要消耗大约300万千瓦时的电力,相当于北京市东城区一天的居民用电量。这种对于空间和能源的巨大需求,远远超过了传统机房部署方式的承载能力,跨地域机房部署又会给网络通信带来巨大挑战。此外,十万卡集群中的GPU故障将会非常频繁,有效训练时长占也将迎来新的挑战。

针对这些难题,百舸4.0已经构建了十万卡级别的超大规模无拥塞HPN高性能网络、10ms级别超高精度网络监控,以及面向十万卡集群的分钟级故障恢复能力。

“百舸4.0正是为部署十万卡大规模集群而设计的。今天的百舸4.0,已经具备了成熟的十万卡集群部署和管理能力,就是要突破这些新挑战,为整个产业提供持续领先的算力平台。”沈抖说。

生数科技作为国内领先的多模态大模型厂商,基于百舸平台开发出国内首款全面对标OpenAI Sora的视频大模型“Vidu”。会上,生数科技联合创始人兼CEO唐家渝宣布,即日起Vidu将通过百度智能云千帆大模型平台面向开发者、企业用户开放API服务。

生数科技联合创始人兼CEO唐家渝

对于自建智算中心的客户,百舸4.0此番还对“一云多芯”能力进行了升级。在万卡规模集群上,多芯混合训练效能高达95%,保持业界领先。“要建设更大的集群,同时确保供应链的安全和弹性,势必会存在不同芯片混合使用的情况,也就是说,对于自建智算中心的客户来说,一云多芯是必然选择。”沈抖说。

以中国邮政储蓄银行为例,2023年,为加速大模型应用落地,邮储银行新增大量来自不同厂商的GPU资源,基于大模型为18个核心业务系统、30多家分行的金融业务提供AI赋能。在百舸的支持下,邮储银行顺利完成了不同型号GPU资源的部署、上线;同时,也实现了GPU、CPU算力的规划重组,有力保障了300多个大小模型、6000多次训练任务。模型迭代时间也从过去的一个半月大幅缩短至半天,并实现了更好的模型效果。

长安汽车执行副总裁张晓宇表示,基于百舸平台,百度智能云与长安汽车合作探索开发了整套自动驾驶模型训练的最佳实践方案,实现了GPU资源的精细化管理与调度。双方紧密配合,在数据加载、计算效率、通信方式等维度进行联合优化,使得算力总体平均使用率提升到90%以上,综合资源利用率提升了50%。

长安汽车执行副总裁张晓宇

发布千帆3.0:三大服务全面升级,一句话即可生成企业级应用

为了满足企业客户对模型调用、模型开发、应用开发的需求,百度智能云发布千帆大模型平台3.0。

在模型调用方面,升级后的千帆平台,不但可以调用包括文心系列大模型在内的近百个国内外大模型,还支持调用语音、视觉等各种传统的小模型。在扩大模型种类的同时,百度智能云持续降低模型调用成本。过去一年,文心旗舰大模型降价幅度超过90%、主力模型全面免费,最大限度降低企业创新试错的成本。

文心大模型家族全景图

在模型开发方面,对于需要定制、微调专属模型的客户,千帆3.0不仅提供了最完善的大模型工具链,还支持CV、NLP、语音等传统模型的开发,并实现数据、模型、算力等资源的统一纳管和调度,为企业提供一站式的大、小模型开发服务。

千帆平台大模型工具链

模型投入使用后,千帆平台还支持企业将应用产生的数据,经过采样评估、人工标注、对齐或微调等方式反馈给模型,形成数据飞轮,持续优化模型效果,放大模型在特定场景下的优势。

在应用开发方面,针对企业落地大模型的高频应用场景,千帆3.0从检索效果、检索性能、存储扩展、调配灵活性四方面对企业级检索增强生成(RAG)进行了全面升级;针对企业级Agent的开发,千帆3.0增加了业务自主编排、人工编排、知识注入、记忆能力以及百度搜索等80多个官方组件支持。

此外,本次大会还发布了智能化低代码应用开发平台“AI速搭”,通过自然语言对话就能进行企业级应用开发,一句话就可以完成应用创建。

沈抖在大会现场还演示了如何通过对话,在AI速搭平台上开发一个资产管理应用。只需一句话描述对目标系统的需求,包含资产信息、资产入库、资产领用、资产维修、资产报废等功能模块,大模型就可以清晰地理解需求并生成应用。过去,这样一个应用即使用低代码方式开发也需要几天的时间,现在只需几分钟就能完成。

工具平台的不断完善,也促进了过去一年大模型产业落地的爆发式增长。目前,在千帆平台上,文心大模型日均调用量超过7亿次,千帆平台累计帮助用户精调了3万个大模型,开发出70多万个企业级应用。

三星电子大中华区总裁崔胜植表示,2024年初,三星在全球市场推出Galaxy AI,并与百度智能云达成战略合作,基于千帆平台、百度识图为中国用户带来国际领先的Galaxy AI本地化功能,包括即圈即搜、笔记助手、转录助手、聊天助手、浏览助手等移动 AI体验。

三星电子大中华区总裁崔胜植

在招聘领域,猎聘基于千帆平台,通过调用文心大模型,结合自身丰富的行业know-how,能够对企业岗位需求和求职者简历内容进行语义理解分析,并实现智能化的简历筛选功能,人岗匹配准确率相比业界平均水平的70%高出15个百分点,高达85%,并提升招聘效率50%以上。

在教育领域,考试宝作为一款职业教育在线学习App,过去主要依赖人工为会员提供试题解析服务,速度慢、成本高,有些试题甚者需要等待一天以上才能得到解析结果。如今,通过提示词工程和调用文心大模型,考试宝实现了试题的智能化解析,只需上传试题就能秒级得到解析结果,单条试题解析成本也从过去的1.5元降到3厘,降幅高达98%,用户付费意愿也增长了一倍以上。

此外,千帆行业增强版提供了体系化的工具和组件,支持行业客户、合作伙伴在千帆通用底座上不断添加行业特色,从而更方便地开发适合自己的行业应用。目前,千帆平台上已经沉淀了包括制造、能源、交通,政务、金融、汽车、教育、互联网在内的八大行业解决方案。

南方电网数字电网研究院副总经理胡荣表示,去年九月,南方电网发布了行业垂直领域首个自主可控的大模型“大瓦特”。“大瓦特”既是大模型、小模型及智能体构成的模型体系,也是开放共享的平台与生态体系。平台上,南方电网基于百度智能云千帆平台构建了电力调度值班助手。在应对突发事件时,电力调度值班助手可以秒级生成处置方案,极大地增强了调度员的应急响应能力。

南方电网数字电网研究院副总经理胡荣

代码助手、智能客服、数字人全面升级

随着大模型产业落地逐渐走向深水区,AI原生应用也将迎来爆发式增长,为了满足企业直接选购成熟AI应用的需求,百度智能云面向数字人、智能客服、代码提效三大领域,升级了三大AI原生应用产品。

基于文心大模型重构的AI原生智能客服应用“客悦”,在用户复杂意图理解、多模态信息交流等方面实现了大幅提升,让智能客服变得更聪明、更拟人。“问题自助解决率”是智能客服领域最关键的考核指标,当前业内平均水平是80%,升级后,客悦将这一指标提升至92%,实现业界领先。目前,客悦已累计帮助企业客户服务超过1.5亿人次,交互超过5亿次。

基于大模型能力,新升级的曦灵数字人4.0支持根据文字快速生成不同妆造、不同行业特色的3D数字人形象和视频。本次大会期间,曦灵平台宣布:将3D超写实数字人的价格从万元大幅降价至199元,达到业内最低价。

全新升级的4D(3D+时间维度)自动绑定技术和创新模态迁移技术,还解决了传统2D数字人动作僵硬的问题,可以实现人物在不同角度、形体、表情的高度一致,即使是面部微表情也能做到自然、逼真。

全新升级的全流程AI代码提效工具“文心快码”,聚焦研发全生命周期的业务流,实现了从项目接手到最终交付,全流程编码开发效率与质量的双重提升。

本次大会,文心快码业界首发“企业级代码架构解释”、“企业级代码审查”,两项全新功能。企业级代码架构解释能在项目接手初期,实现工程架构的智能解读,帮工程师快速理解业务逻辑;而企业级代码审查则能传承资深工程师的编码经验,智能辅助程序员查缺补漏。

此外,针对市面上通用代码助手缺乏对企业历史代码库的理解的痛点,文心快码全新升级的“企业级代码辅助能力”能够深度理解企业代码库,快速学习企业过往的代码与规范,让生成的代码更贴近企业的要求。

目前,文心快码已经服务超过1万家企业客户,帮助数百万中国开发者提升编码效率,整体提升研发效率20%。

相关问答

三星 手机有试卷还原功能吗?

有的。在三星手机的手机APP找下载夸克,APP将夸克APP正确安装之后打开夸克APP的试卷还原功能,点击拍照之后即可将世界还原成空白键。有的。在三星手机的手机AP...

pg 电子 鱼跃龙门官方官网老版本APPv9.4.9

【pg电子鱼跃龙门官方官网】(JNH9555.COM)):双十一作为一个近年来兴起的“传统节日”🚕,《风暴魔域2》这么潮流的游戏自然会赶一赶时髦。今年也是《风暴魔域2》...

用网上阅卷系统,家长和学生能不能查看试卷?-ZOL问答

很多网上阅卷系统只有老师可以查看试卷,学生是查看不到试卷的。我朋友家的小孩告诉我,他们学校用的翰林金榜网上阅卷系统专门开设了一个在线查询模...

有没有一部电视剧或者电影,让你看完想迫不及待的介绍给身边人?求分享?

就一部吗?那我就要放绝招啦!这部电影也是我曾经推荐给朋友最多次的一部。当然是肖申克的救赎啦剧情简介1947年,年轻有为的大银行副总裁安迪(蒂姆...花是一...

使用量较少,家用学生打印试卷资料用,能否推荐1000元以下,较小(不是超级大那种就可以)的激光打印机?

家里如果有学生的话,还是建议买一台打印机,从小学到高中,都需要的。第一,价格问题。激光打印机600到1000元的足够用了。我家的三星打印机ML1460,已经用了整...

临床三基考试题库app..._临床执业医师_帮考网

软件名称:医学三基考试题库(题无忧)软件评级:三星开发商:题无忧软件类别:国产软件/考试系统软件授权:共享版运行环境:Win2000/Win2003/WinXP/NT/...

在转账结算中,人们经常使用的信用工具是转账支票汇票和信用...

[回答]1、商品的含义:商品是用于交换的劳动产品。2、商品的基本属性——使用价值和价值使用价值概念:商品能够满足人们某种需要的属性。(注意:有使用价值...

高考完如何估分?

随着各大高考试卷答案的新鲜出炉,考生们一定想知道自己高考考得如何,进行估分吧?估分大致人工动估分与软件估分两种。人工估分顾名思义,就是自己对照着标...

【新课程报语文导刊八年级上苏教版40期答案】作业帮

[回答]第40期A2、A3版综合测试题参考答案1.(1)juébiělài辜怜悯(2)要求:结构合理,书写规范美观,每有一个错别字扣0.5分,扣完为止.(3)寂静平静或冷...

大家都用哪些小程序?

亲戚关系经常弄不清三大姑八大姨怎么叫的,这款小程序可以轻松帮你解决,简直是走亲访友的必备神器啊。再也不用低头瞎嘟囔了,大声叫出来小睡眠对于想小编这...