原标题:三大综合能力重磅升级!讯飞星火大模型打响赶超ChatGPT第一枪
智东西
作者 | 程茜
编辑 | 漠影
智东西6月10日报道,昨天,讯飞星火大模型V1.5亮相,升级了开放式知识问答、逻辑推理和数学能力、多轮对话三大综合能力,并发布了支持纯语音输入、多模态输入的星火APP。同时,科大讯飞还公布了星火大模型在办公、教育、医疗、工业领域的应用新进展。
星火大模型的文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力均在持续提升,其中知识问答能力提升高达24%,逻辑推理能力提升10%。
事实上,星火大模型与教育、办公场景的结合成果已经显现出来。5月6日,讯飞星火大模型发布并集成到教育、办公场景中,科大讯飞总裁吴晓如透露,今年6月1日到8日,拥有口语陪练、写作助手、作文批改等功能的讯飞AI学习机激活数量同比增长214%,搭载语篇规整、一键成稿等功能的讯飞办公本、讯飞听见,用户激活提升了176%和205%。
可以看出,新的用户体验正在极大激活用户的需求。
值得一提的是,6月9日正是全国高考最后一天,讯飞研究院院长刘聪也现场演示了星火大模型答高考卷的能力,做数学函数题、语文阅读理解题,都能给出逻辑清晰的分析过程。
在星火大模型发布之际,科大讯飞董事长刘庆峰就曾公布了星火年内的三次升级时间点,同时将在10月底整体赶超ChatGPT。这也是国内大模型厂商唯一明确给出升级时间的。现在正是其迭代升级的关键节点,刘庆峰谈道,因为长期主义的梦想需要一个又一个阶段里程碑来实现。
一、三大综合能力升级,用户能定制200+“私人”助手
讯飞星火大模型V1.5对于用户最需要的开放式知识问答、逻辑推理和数学能力、多轮对话三项综合能力实现了升级。
同时,讯飞发布了星火APP和小程序,支持全语音对话、多模态输入等,同步上线了“星火助手创作中心”,用户可以基于自己的需求打造大大小小的智能助手。
用户想要从0到1构建助手需要在后台输入相应的助手指令。如果想丰富文本的内容,用户还可以在助手指令里添加关键词,如“欢快幽默”、“引经据典”等。并且新生成的助手也会同步到PC、移动设备上。
目前,星火助手创作中心已经发布200多个助手。
1、开放式知识问答,文本内容能引经据典、补充分析见解
当下大模型在解决新知识更新上较为困难,回答一些事实类问题时容易发生张冠李戴的现象。而大模型可以基于其强大的语言理解能力,深度理解用户需求后,从实时的数据库、信息库中进行知识提取,再通过概括表达能力将答案提供给用户,从而保证结果的及时性和准确性。
吴晓如谈道,其实开放式知识问答最终拼的还是大模型的自然语言理解能力。
6月9日是全国高考最后一天,借这一契机,讯飞研究院院长现场向星火大模型提问,“2023年全国高考甲卷的作文题是什么?并分析一下它传递的意义”。星火大模型不仅给出了作文题目,还描述出题面背后想传递的内容。
在长文本生成能力上,星火大模型也实现进一步提升。当问到“高考刚刚结束,孩子即将开始新的起点,请给你的孩子写一封暖心的信”,星火生成的文本框架很清晰,并且还引经据典使得文章更加丰富。
还有关于通用人工智能产业的情况,“中国关于通用人工智能有什么新动向,并分析一下中国的基础和优势”。星火罗列了国内新动向后,还进一步分析了人才、数据、政策等方面的优势,最后还补充了当下面临的挑战。刘聪说,星火可以自己检索到今年6月发生的新信息,并从这些内容中抽取出共性知识,补充见解。
在司法领域,星火大模型还能帮助用户生成起诉状。当问到“我有个朋友叫张三,他在2023年1月5日晚上被李明家的狗咬伤了,前期治疗花了2000元,耽误上班损失了大概1500元。张三想让李明赔偿他的全部损失,但是好几次沟通无果,想要起诉他,请列出需要准备的材料”,星火生成了包括沟通记录、证人证言等材料,再次提问它还能直接生成起诉状。
大模型开放式问答展现了更强大的想象力,再加上其自然语言处理能力和专业知识库相融合,能为各个行业提供助力。
2、逻辑推理和数学能力升级,综合应用数学方法解答
大模型基于思维链的场景式逻辑推理和数学十分紧密,因此,逻辑推理能力提升也是数学能力提升的基础。
当问到“农夫需要带着狼、羊、菜一起过河,只有农夫能够划船,而且船比较小,农夫每次只能带一样东西过河,如果农夫不在,羊会偷吃菜,狼会吃羊,请设计一种方法,让农夫能够安全地将所有东西带过河”,星火不仅能给出方案,还会解释每一步骤的用意。
经典谜题星火也能轻松应对,如“一条船上有三个人,但是有两个父亲、两个儿子,请问是怎么回事?”
还有考察排列组合和空间想象力的初中数学题,当问到“六条直线相交,最多能有多少个交点?”星火会列出思考的过程,找到最终答案。
数学问题中,如三角函数等很多会包含大量的图片等,无法通过语音或者文字输入。讯飞星火APP基于OCR能力实现了图片输入。
例如一道考察多项式的数学问题,基于讯飞APP中的数学解题助手,就能给出完整的解题步骤。
星火大模型不仅能理清一些很绕的逻辑现象,还能综合应用方程、配列组合等数学方法来解决问题。
值得一提的是,此前搜狐科技选取了百度文心一言、阿里通义千问、讯飞星火大模型、360智脑、ChatGPT对2023高考上海数学卷前10道填空题进行了测试。结果显示,星火大模型的正确率最高为50%。
▲五大AI大模型高考数学题回答情况(图源:搜狐科技)
3、多轮对话能力升级,化身面试官、儿童作家
一般情况下,人和人协同完成任务需要多次交互,很少能通过一次性交互就完成复杂的任务,在人机交互中同样如此。
星火APP中的“讯飞智聘面试官”可以模拟面试现场,支持全语音交互。刚毕业的大学生如果没有面试经验,可进行模拟演练。例如说“我想面试产品经理的岗位”,助手就会询问用户此前的工作经历等,最后还会基于回答内容给出整体评价和建议。
还有一个更有趣的助手是故事创作助手,当用户输入一个标题就能生成一篇故事,如“小兔子去黄山旅游探险的故事”。如果小朋友对故事不满意,还可以补充需求,比如增加“小兔子遇到了一个伙伴皮卡丘”。
这样的话,星火大模型生成的故事就可以基于用户的需求不断丰富更新。
还有一个帮助用户生成故事的助手叫故事对话共创,用户输入标题后,星火小助手不会生成整篇文章,而是先给出一段话引入,用户再输入下一步的故事走向,以此类推去续写故事。
二、教育、办公场景设备再升级,工业、医疗服务次数大幅提升
在教育行业,讯飞此前发布的星火AI口语助手升级为了星火语伴APP,使得用户使用更为便捷。该APP面向的是中小学、大学生、商务人士等所有英语学习爱好者,除一般性交流外,还能发现用户发音、语法的问题,帮助纠错,支持语音、图片的翻译软件。
如果遇到不会用英语回复的问题,用户可以切换到中文,并且中英文混合输入星火语伴APP也能准确识别,同时,用户还可以在设置界面调整语伴的难度。
为了打造真人面对面的对话场景,星火语伴还支持虚拟人对话。
办公领域下,星火认知大模型搭载于讯飞听见智慧屏,该设备的拾音范围能达到10米,还能一线接入声音、视频等。录音完成后讯飞听见智慧屏支持快速转写录音,还能基于大模型的能力整理成稿,并生成会议纪要。
同时,用户想要离开办公环境,还能一键扫码将记录的内容转到手机上,同时自动生成工作待办、自定义关键词、提炼核心内容等,满足不同领域、不同风格的文本创作需求。
面向B端场景,星火大模型已经在工业、医疗行业实现应用。
此前,科大讯飞发布了羚羊工业互联网平台,贯穿工业领域企业的研产供销服管场景。工业场景的企业服务中,需要人工来对接企业需求的服务供应,但依靠人工所完成的需求和供应对接量十分有限。当下,AI+大数据的精准理解、分析、推荐在工业场景的融合应用,使得需求和供应的对接效率大幅提升。目前,羚羊平台用户总量达到32.2万人次,平台服务企业次数超72.1万次。
基于星火大模型,讯飞推出羚机一动,能将产业的商机、政策等推荐给用户。
例如问道“我们是一个家电生产企业,车间有大小设备20多台,正在寻求能进一步节能降耗的解决方案”,羚机一动会根据产业特点,为用户提出建议,同时给出一些解决方案案例、资源以及相应的技术专家。
刘聪称,基于星火大模型能力,讯飞开发了面向企业的产品介绍、新闻撰写等工具,下一步,讯飞也将会将这一工具的能力开放出来。
星火大模型可以和工业领域的知识结合企业,形成工业大脑,再和企业的知识库结合形成企业的知识大脑,企业的生产、研发、服务、营销各个环节,可以和企业大脑进行交互,更加精准的定位问题,找到针对性的解决方案。
此外,在车间场景中,一些新员工如果遇到设备故障,也可以询问羚机一动,“在总装车间进行整机调试的过程中,出现了触摸屏不灵的问题,有哪些原因导致”。当用户将周边工作环境的信息输入,羚机一动也会再次分析并给出建议。之后,羚机一动还会为用户提供触摸屏替代品建议,先从公司内部库存检索,然后再去外部寻找合适的触摸屏,实现了完成了故障查询、购买建议、测试验证的全流程
在医疗行业里,科大讯飞的智医助理可以应用到诊前导医、导诊,诊中帮助医生防止误诊、漏诊,诊后康复环节。吴晓如透露,智医助理系统已经应用到全国31个省,完成6.29亿次辅助诊断,修正了127份医生的首次诊断。并且智医助理和语音外呼相结合,已经完成了11亿次电话随访。
一般情况下,患者出院后服务的延续性会缺失,绝大部分患者面临出院即托管,医患人数不匹配使得医生不能对患者用药、饮食安全及时指导。吴晓如举了一个例子,脑卒中患者中有12%的人出院后30天内会再次出院,而这部分人中50%的患者其实可以通过诊后康复管理避免再次入院。
基于上述现象,星火大模型可以对病案进行全过程分析快速生成康复计划,同时这份计划会实时同步到医生、患者面前。
这一诊后管理平台的医生端界面有患者入院、出院、会诊单、检验记录、住院病历等,会基于这些数据为用户生成包含医生提醒、用药指导、康复运动、饮食建议等六个维度90天的康复计划。
经医生审核通过后,这份计划会同步到患者手机中,同时患者复查后上传检查单,医生端的数据也会同步变化,基于患者身体数据的变化调整健康管理计划,形成了复诊、随访,跟踪闭环患者康复情况的过程。
除了康复计划制定外,智医助理还能回答患者更加开放性的问题,同样基于患者的病历给出答案,如患者发烧吃退烧药能否与长期服用药物一起服用。
吴晓如称,康复管理医生诊后效果康复效率提升10倍以上,即时的管理使得患者对医生的依存性提升2.4倍,由于患者得到即时医院随访,问题及时回应、指导,其对医院的满意度从近90%提升到98%以上。
三、开放大模型七大能力、200+助手开发接口
星火大模型发布初期,科大讯飞就要联合行业合作伙伴共建大模型“星火”生态。刘庆峰透露,目前讯飞人工智能开放平台上的开发团队已经超过400万家。
他宣布要开放星火大模型的开发接口,包括七大维度能力和200个星火小助手,并且支持多端接入快速集成,对于数据安全有更高要求的企业还支持私有化部署。
5月6日发布星火大模型时,科大讯飞就划定了6月9日升级到V1.5,今年1024对标ChatGPT,实现中文超越、英文相当的时间表。刘庆峰谈道,这是因为科大讯飞在通用人工智能研究中,每一个关键模块都坚持自主研发,其“1+3+1”的创新体系,包含自主研发的安全可控大模型训练基座、软硬一体化的高性能大模型推理平台,以及数据、建模和强化学习等关键模块。
这也是科大讯飞能给出明确时间迭代节奏的关键。
未来,科大讯飞将在类脑智能、神经网络大模型的新算法和博弈智能等领域布局,探索更多的潜在路径,以前这些领域的交叉研究。
在人才培养方面,科大讯飞已经与首批全国22所重点高校联手,开展星火大模型场景创新赛、讯飞高校AI星火营,让更多学生参与到通用人工智能产业中来。
结语:围绕技术、应用、生态,“星火”再升级
点点“星火”,已成燎原之势。讯飞星火大模型与行业应用的结合愈加紧密,其能力展现的也更加充分,不仅包括用户感知度更高的教育、办公等场景的设备,还有工业、医疗行业的应用升级。
有AI国家队之称的科大讯飞,凭借其技术积累为大模型研发划定了时间表,其以大模型为核心的技术研发、应用落地、生态建设蓝图正徐徐展开。技术的发展并不难一蹴而就,需要综合考虑多方因素,包括技术研发进展、应用落地情况等,但科大讯飞基于其自主研发的大模型底座,以及在数据安全、建模、强化学习实现安全可控,都使得其在大模型浪潮中更加从容。
随着星火大模型的不断升级,星火大模型正在赶超ChatGPT的道路上勇往直前。返回搜狐,查看更多
责任编辑:
暂无评论内容