三大综合能力重磅升级！讯飞星火大模型打响赶超ChatGPT第一枪-卡咪卡咪哈-一个博客

原标题：三大综合能力重磅升级！讯飞星火大模型打响赶超ChatGPT第一枪

智东西

作者 | 程茜

编辑 | 漠影

智东西6月10日报道，昨天，讯飞星火大模型V1.5亮相，升级了开放式知识问答、逻辑推理和数学能力、多轮对话三大综合能力，并发布了支持纯语音输入、多模态输入的星火APP。同时，科大讯飞还公布了星火大模型在办公、教育、医疗、工业领域的应用新进展。

星火大模型的文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力均在持续提升，其中知识问答能力提升高达24%，逻辑推理能力提升10%。

事实上，星火大模型与教育、办公场景的结合成果已经显现出来。5月6日，讯飞星火大模型发布并集成到教育、办公场景中，科大讯飞总裁吴晓如透露，今年6月1日到8日，拥有口语陪练、写作助手、作文批改等功能的讯飞AI学习机激活数量同比增长214%，搭载语篇规整、一键成稿等功能的讯飞办公本、讯飞听见，用户激活提升了176%和205%。

可以看出，新的用户体验正在极大激活用户的需求。

值得一提的是，6月9日正是全国高考最后一天，讯飞研究院院长刘聪也现场演示了星火大模型答高考卷的能力，做数学函数题、语文阅读理解题，都能给出逻辑清晰的分析过程。

在星火大模型发布之际，科大讯飞董事长刘庆峰就曾公布了星火年内的三次升级时间点，同时将在10月底整体赶超ChatGPT。这也是国内大模型厂商唯一明确给出升级时间的。现在正是其迭代升级的关键节点，刘庆峰谈道，因为长期主义的梦想需要一个又一个阶段里程碑来实现。

一、三大综合能力升级，用户能定制200+“私人”助手

讯飞星火大模型V1.5对于用户最需要的开放式知识问答、逻辑推理和数学能力、多轮对话三项综合能力实现了升级。

同时，讯飞发布了星火APP和小程序，支持全语音对话、多模态输入等，同步上线了“星火助手创作中心”，用户可以基于自己的需求打造大大小小的智能助手。

用户想要从0到1构建助手需要在后台输入相应的助手指令。如果想丰富文本的内容，用户还可以在助手指令里添加关键词，如“欢快幽默”、“引经据典”等。并且新生成的助手也会同步到PC、移动设备上。

目前，星火助手创作中心已经发布200多个助手。

1、开放式知识问答，文本内容能引经据典、补充分析见解

当下大模型在解决新知识更新上较为困难，回答一些事实类问题时容易发生张冠李戴的现象。而大模型可以基于其强大的语言理解能力，深度理解用户需求后，从实时的数据库、信息库中进行知识提取，再通过概括表达能力将答案提供给用户，从而保证结果的及时性和准确性。

吴晓如谈道，其实开放式知识问答最终拼的还是大模型的自然语言理解能力。

6月9日是全国高考最后一天，借这一契机，讯飞研究院院长现场向星火大模型提问，“2023年全国高考甲卷的作文题是什么？并分析一下它传递的意义”。星火大模型不仅给出了作文题目，还描述出题面背后想传递的内容。

在长文本生成能力上，星火大模型也实现进一步提升。当问到“高考刚刚结束，孩子即将开始新的起点，请给你的孩子写一封暖心的信”，星火生成的文本框架很清晰，并且还引经据典使得文章更加丰富。

还有关于通用人工智能产业的情况，“中国关于通用人工智能有什么新动向，并分析一下中国的基础和优势”。星火罗列了国内新动向后，还进一步分析了人才、数据、政策等方面的优势，最后还补充了当下面临的挑战。刘聪说，星火可以自己检索到今年6月发生的新信息，并从这些内容中抽取出共性知识，补充见解。

在司法领域，星火大模型还能帮助用户生成起诉状。当问到“我有个朋友叫张三，他在2023年1月5日晚上被李明家的狗咬伤了，前期治疗花了2000元，耽误上班损失了大概1500元。张三想让李明赔偿他的全部损失，但是好几次沟通无果，想要起诉他，请列出需要准备的材料”，星火生成了包括沟通记录、证人证言等材料，再次提问它还能直接生成起诉状。

大模型开放式问答展现了更强大的想象力，再加上其自然语言处理能力和专业知识库相融合，能为各个行业提供助力。

2、逻辑推理和数学能力升级，综合应用数学方法解答

大模型基于思维链的场景式逻辑推理和数学十分紧密，因此，逻辑推理能力提升也是数学能力提升的基础。

当问到“农夫需要带着狼、羊、菜一起过河，只有农夫能够划船，而且船比较小，农夫每次只能带一样东西过河，如果农夫不在，羊会偷吃菜，狼会吃羊，请设计一种方法，让农夫能够安全地将所有东西带过河”，星火不仅能给出方案，还会解释每一步骤的用意。

经典谜题星火也能轻松应对，如“一条船上有三个人，但是有两个父亲、两个儿子，请问是怎么回事？”

还有考察排列组合和空间想象力的初中数学题，当问到“六条直线相交，最多能有多少个交点？”星火会列出思考的过程，找到最终答案。

数学问题中，如三角函数等很多会包含大量的图片等，无法通过语音或者文字输入。讯飞星火APP基于OCR能力实现了图片输入。

例如一道考察多项式的数学问题，基于讯飞APP中的数学解题助手，就能给出完整的解题步骤。

星火大模型不仅能理清一些很绕的逻辑现象，还能综合应用方程、配列组合等数学方法来解决问题。

值得一提的是，此前搜狐科技选取了百度文心一言、阿里通义千问、讯飞星火大模型、360智脑、ChatGPT对2023高考上海数学卷前10道填空题进行了测试。结果显示，星火大模型的正确率最高为50%。

▲五大AI大模型高考数学题回答情况（图源：搜狐科技）

3、多轮对话能力升级，化身面试官、儿童作家

一般情况下，人和人协同完成任务需要多次交互，很少能通过一次性交互就完成复杂的任务，在人机交互中同样如此。

星火APP中的“讯飞智聘面试官”可以模拟面试现场，支持全语音交互。刚毕业的大学生如果没有面试经验，可进行模拟演练。例如说“我想面试产品经理的岗位”，助手就会询问用户此前的工作经历等，最后还会基于回答内容给出整体评价和建议。

还有一个更有趣的助手是故事创作助手，当用户输入一个标题就能生成一篇故事，如“小兔子去黄山旅游探险的故事”。如果小朋友对故事不满意，还可以补充需求，比如增加“小兔子遇到了一个伙伴皮卡丘”。

这样的话，星火大模型生成的故事就可以基于用户的需求不断丰富更新。

还有一个帮助用户生成故事的助手叫故事对话共创，用户输入标题后，星火小助手不会生成整篇文章，而是先给出一段话引入，用户再输入下一步的故事走向，以此类推去续写故事。

二、教育、办公场景设备再升级，工业、医疗服务次数大幅提升

在教育行业，讯飞此前发布的星火AI口语助手升级为了星火语伴APP，使得用户使用更为便捷。该APP面向的是中小学、大学生、商务人士等所有英语学习爱好者，除一般性交流外，还能发现用户发音、语法的问题，帮助纠错，支持语音、图片的翻译软件。

如果遇到不会用英语回复的问题，用户可以切换到中文，并且中英文混合输入星火语伴APP也能准确识别，同时，用户还可以在设置界面调整语伴的难度。

为了打造真人面对面的对话场景，星火语伴还支持虚拟人对话。

办公领域下，星火认知大模型搭载于讯飞听见智慧屏，该设备的拾音范围能达到10米，还能一线接入声音、视频等。录音完成后讯飞听见智慧屏支持快速转写录音，还能基于大模型的能力整理成稿，并生成会议纪要。

同时，用户想要离开办公环境，还能一键扫码将记录的内容转到手机上，同时自动生成工作待办、自定义关键词、提炼核心内容等，满足不同领域、不同风格的文本创作需求。

面向B端场景，星火大模型已经在工业、医疗行业实现应用。

此前，科大讯飞发布了羚羊工业互联网平台，贯穿工业领域企业的研产供销服管场景。工业场景的企业服务中，需要人工来对接企业需求的服务供应，但依靠人工所完成的需求和供应对接量十分有限。当下，AI+大数据的精准理解、分析、推荐在工业场景的融合应用，使得需求和供应的对接效率大幅提升。目前，羚羊平台用户总量达到32.2万人次，平台服务企业次数超72.1万次。

基于星火大模型，讯飞推出羚机一动，能将产业的商机、政策等推荐给用户。

例如问道“我们是一个家电生产企业，车间有大小设备20多台，正在寻求能进一步节能降耗的解决方案”，羚机一动会根据产业特点，为用户提出建议，同时给出一些解决方案案例、资源以及相应的技术专家。

刘聪称，基于星火大模型能力，讯飞开发了面向企业的产品介绍、新闻撰写等工具，下一步，讯飞也将会将这一工具的能力开放出来。

星火大模型可以和工业领域的知识结合企业，形成工业大脑，再和企业的知识库结合形成企业的知识大脑，企业的生产、研发、服务、营销各个环节，可以和企业大脑进行交互，更加精准的定位问题，找到针对性的解决方案。

此外，在车间场景中，一些新员工如果遇到设备故障，也可以询问羚机一动，“在总装车间进行整机调试的过程中，出现了触摸屏不灵的问题，有哪些原因导致”。当用户将周边工作环境的信息输入，羚机一动也会再次分析并给出建议。之后，羚机一动还会为用户提供触摸屏替代品建议，先从公司内部库存检索，然后再去外部寻找合适的触摸屏，实现了完成了故障查询、购买建议、测试验证的全流程

在医疗行业里，科大讯飞的智医助理可以应用到诊前导医、导诊，诊中帮助医生防止误诊、漏诊，诊后康复环节。吴晓如透露，智医助理系统已经应用到全国31个省，完成6.29亿次辅助诊断，修正了127份医生的首次诊断。并且智医助理和语音外呼相结合，已经完成了11亿次电话随访。

一般情况下，患者出院后服务的延续性会缺失，绝大部分患者面临出院即托管，医患人数不匹配使得医生不能对患者用药、饮食安全及时指导。吴晓如举了一个例子，脑卒中患者中有12%的人出院后30天内会再次出院，而这部分人中50%的患者其实可以通过诊后康复管理避免再次入院。

基于上述现象，星火大模型可以对病案进行全过程分析快速生成康复计划，同时这份计划会实时同步到医生、患者面前。

这一诊后管理平台的医生端界面有患者入院、出院、会诊单、检验记录、住院病历等，会基于这些数据为用户生成包含医生提醒、用药指导、康复运动、饮食建议等六个维度90天的康复计划。

经医生审核通过后，这份计划会同步到患者手机中，同时患者复查后上传检查单，医生端的数据也会同步变化，基于患者身体数据的变化调整健康管理计划，形成了复诊、随访，跟踪闭环患者康复情况的过程。

除了康复计划制定外，智医助理还能回答患者更加开放性的问题，同样基于患者的病历给出答案，如患者发烧吃退烧药能否与长期服用药物一起服用。

吴晓如称，康复管理医生诊后效果康复效率提升10倍以上，即时的管理使得患者对医生的依存性提升2.4倍，由于患者得到即时医院随访，问题及时回应、指导，其对医院的满意度从近90%提升到98%以上。

三、开放大模型七大能力、200+助手开发接口

星火大模型发布初期，科大讯飞就要联合行业合作伙伴共建大模型“星火”生态。刘庆峰透露，目前讯飞人工智能开放平台上的开发团队已经超过400万家。

他宣布要开放星火大模型的开发接口，包括七大维度能力和200个星火小助手，并且支持多端接入快速集成，对于数据安全有更高要求的企业还支持私有化部署。

5月6日发布星火大模型时，科大讯飞就划定了6月9日升级到V1.5，今年1024对标ChatGPT，实现中文超越、英文相当的时间表。刘庆峰谈道，这是因为科大讯飞在通用人工智能研究中，每一个关键模块都坚持自主研发，其“1+3+1”的创新体系，包含自主研发的安全可控大模型训练基座、软硬一体化的高性能大模型推理平台，以及数据、建模和强化学习等关键模块。

这也是科大讯飞能给出明确时间迭代节奏的关键。

未来，科大讯飞将在类脑智能、神经网络大模型的新算法和博弈智能等领域布局，探索更多的潜在路径，以前这些领域的交叉研究。

在人才培养方面，科大讯飞已经与首批全国22所重点高校联手，开展星火大模型场景创新赛、讯飞高校AI星火营，让更多学生参与到通用人工智能产业中来。

结语：围绕技术、应用、生态，“星火”再升级

点点“星火”，已成燎原之势。讯飞星火大模型与行业应用的结合愈加紧密，其能力展现的也更加充分，不仅包括用户感知度更高的教育、办公等场景的设备，还有工业、医疗行业的应用升级。

有AI国家队之称的科大讯飞，凭借其技术积累为大模型研发划定了时间表，其以大模型为核心的技术研发、应用落地、生态建设蓝图正徐徐展开。技术的发展并不难一蹴而就，需要综合考虑多方因素，包括技术研发进展、应用落地情况等，但科大讯飞基于其自主研发的大模型底座，以及在数据安全、建模、强化学习实现安全可控，都使得其在大模型浪潮中更加从容。

随着星火大模型的不断升级，星火大模型正在赶超ChatGPT的道路上勇往直前。返回搜狐，查看更多

责任编辑：

THE END