昨夜,微软甩出10项硬核新品!28.5万个核心的AI超算机,最大语言模型开源

打开凤凰新闻,查看更多高清图片

文 | 韦世玮 董温淑

智东西5月20日消息,昨晚,一年一度的微软Build开发者大会拉开序幕。与往常不一样的是,大会的舞台从往年的美国西雅图搬到了线上,同时发布的新产品和新升级也几乎面向开发者,成为开发者们的“独家盛宴”。

毫不意外,今晚大会仍以微软现任CEO萨蒂亚·纳德拉(Satya Nadella)的主题演讲作为开场。在短短的20多分钟演讲中,“开发者”、“Azure”、“Microsoft 365”和“Windows”等关键词贯穿全场,尤其是“开发者”。

他谈到,目前GitHub上的开发者已超过5000万人,Power Platform上的开发者也超过了350万人。而微软也将为开发者提供一系列提高工作效率的开发工具和解决方案,进一步提升生产力。

围绕开发者,本次微软Build大会的核心亮点如下:

1、宣布与OpenAI合作开发的AI超级计算机,专门用于训练大规模分布式AI模型。

2、推出面向医疗行业的Microsoft Cloud for Healthcare,提升医疗护理团队的协作、决策和操作效率。

3、推出针对工业系统的AI开发平台Project Bonsai,以及Project Moab实验平台。

4、推出Windows开发者平台Project Reunion,统一UWP和Win32的现有API。

5、升级DeepSpeed库,主要面向深度学习领域,并开源史上最大语言模型——微软图灵模型。

6、发布Azure Synapse Link,可对实时运营数据进行分析。

7、WSL 2新增特性,包括对GPU、Linux GUI应用程序的支持,以及简化安装体验。

8、推出Microsoft Teams平台功能更新,包括为开发人员提供流线型体验。

9、开源并升级Fluid Framework,提供Fluid组件和Fluid工作区。

10、提供负责任的机器学习工具,以减少不公平性。

除此之外,微软推出命令行界面Windows Package Manager,帮助开发者快速搜索、查看和安装各类管理工具。同时,微软Chromic内核的浏览器Edge也新增了侧边栏搜索、同步等新功能。

值得一提的是,微软还宣布收购机器人流程自动化(RPA)创企Softomotive,以将RPA技术引入Power Automate。

一、AI超级计算机亮相,针对大规模分布式AI模型训练

2019年7月,微软宣布向人工智能研究实验室OpenAI投资10亿美元,以共同构建一个新的Azure AI超算平台,将主要用于训练和运行更加先进的AI模型,其中包括基于微软Azure AI超算技术。同时,这笔投资也将进一步帮助OpenAI开发AGI(通用人工智能)技术。

历时一年,这台超级计算机终于在今晚亮相,主要用于大规模分布式AI模型训练。

微软声称,这台超级计算机的性能位列全球前五,共包含28.5万个CPU核心和1万个GPU,每个GPU网络带宽为400Gb/s。

由于在Azure中托管,这台超级计算机已经能够实现一系列现代云基础架构的功能,包括快速部署、可持续的数据中心,以及对所有Azure服务进行访问。

经研究人员实验,该超级计算机已经能够实现大规模AI模型训练,可深入了解语言语法、知识概念和上下文内容的细微差别。同时,它还可以总结冗长的对话、在实时游戏中进行适度对话、解析复杂的法律文件,甚至通过搜索GitHub生成代码。

目前,微软已使用图灵模型来改善Bing、Office、Dynamics和其他生产力产品的语言理解功能。例如,在Bing中,该模型生成文字和回答问题的速度提高了125%。

微软表示,其将通过Azure AI服务和GitHub,进一步将大规模AI模型、训练优化工具和超级计算机资源释放出来,让开发者、数据科学家和商业客户都能轻松利用AI的力量。

二、Microsoft Cloud for Healthcare:提升医疗护理效率

在微软看来,今年新型冠状病毒疫情的大流行几乎影响了人们生活的方方面面,同时也阻碍了医疗保健业务的正常运行,大大降低了患者治疗和护理的效率。

针对这一问题,推出了其首个针对特定行业的云产品——Microsoft Cloud for Healthcare,支持微软Teams中的新Bookings应用程序,护理人员能够在Teams中安排、管理和进行患者的虚拟就诊,并提供相应服务,进一步增强患者沟通、护理团队的协作和管理效率。

与此同时,用户还可以使用Microsoft Cloud for Healthcare来扩展Microsoft Dynamics 365 Marketing、Dynamics 365客户服务和Azure IoT价值,以进行患者体验、医生转诊管理、患者检测等部署。

其中,基于Microsoft Cloud for Healthcare扩展的Microsoft Healthcare Bot服务,自今年3月以来已有超1600个COVID-19机器人实例投入使用,服务了23个国家的3100万人,进一步减轻相关疾病预防控制中心的紧急热线压力。

三、工业系统AI开发平台Project Bonsai

简单地说,Project Bonsai是一个用于构建自主工业控制系统的AI平台,也是一项“机器教学”服务,它结合机器学习、校准和优化功能,能够为制造、化工、建筑、能源和采矿等行业机械的核心控制系统提自主化,以更好地管理各类工业设备。

Project Bonsai通用强化学习平台能够协调AI模型的开发,为AI模型的部署和训练提供了针对算法和基础设施的访问,允许模型在本地、设备或云上部署,并支持MATLAB Simulink、Transys、Gazebo和AnyLogic等模拟器。

此外,用户能够在Project Bonsai的仪表盘上查看所有工作和训练状态,对模型进行调试、检查和改进。同时,Project Bonsai还支持多用户协作构建和部署新模型。

与此同时,针对想要尝试Project Bonsai的工程师和开发者,微软还开发了一款名为Project Moab的硬件设备。

它是一个具有三个手臂、一个操纵杆控制器的机器人,能够让一颗小球在顶部的透明板上保持平衡。该工具为用户提供了一个模拟环境,让用户借助模拟器进行实验。

四、Project Reunion:统一Windows应用生态平台

微软此次推出Windows开发者平台Project Reunion,主要目的就是在于统一Windows的应用生态平台,通过融合Universal Windows Platform(UWP)和Win32的现有API,让开发者能够摆脱不同操作系统之间的限制,轻松实现跨平台开发。

微软将在两者间添加更多通用的API和可互操作代码。这将为应用程序提供一个通用平台,帮助用户使用最新功能更新,以及现代化现有应用程序,无论是C++、.NET(包括WPF、Windows Forms、UWP),还是React Native。

此外,微软还面向企业用户推出了Windows Terminal 1.0,能够让用户在多个选项卡和窗格中运行任何命令行可执行文件,包括WSL发行版和Azure Cloud Shell。

五、DeepSpeed库升级,微软图灵模型开源

早在今年2月,微软发布了DeepSpeed的开源版本,并同步推出了ZeRO(零冗余优化器)。

DeepSpeed主要为跨多台服务器进行分布式模型训练而设计,ZeRO是一种将大型模型拟合到内存中的技术,通过减少数据并行中的内存冗余以实现结果。

ZeRO-1包含模型状态内存优化,ZeRO-2则提供了激活内存和碎片内存的优化。同时,ZeRO-2还针对单个GPU上的训练模型进行了改进。据悉,ZeRO-2训练模型的速度比谷歌BERT提升30%。

微软表示,ZeRO的内存优化技术能够训练具有170亿个参数的机器学习模型,如拥有170个参数的微软图灵模型,它是目前世界上最大的语言AI模型,主要用于自然语言生成(NLG)。

值得一提的是,微软宣布将在短期内开源微软图灵模型,以及在Azure机器学习中训练它们的方法。DeepSpeed库的升级,也将让开发者能够使用ZeRO-2来训练大型神经网络。

六、Azure Synapse Link:可对实时运营数据进行分析

Azure Synapse Link能够让用户通过Azure Synapse Analytics中的实时操作数据,直接获得分析结果,无需进行提取、转换或加载步骤。同时,它还能将实时数据与现有的分析存储库结合,以获得相关业务的整体视图。

此外,Azure Synapse Link可以在SQL行的指导下以“PB级”速度查询数据,具有智能工作负载管理和并发功能,可以实时优化查询性能。

在安全性方面,Azure Synapse Link具有自动威胁检测和始终在线数据加密功能,具备动态数据屏蔽、细粒度访问控制和列级/行级安全性。

据悉,Azure Synapse Link最初将在Azure Cosmos DB中发布,但很快就会应用到所有的操作系统中,进一步帮助开发者降低成本并减少时间。

七、WSL 2新增对GPU、Linux GUI应用程序的支持

WSL 2新增几项特性,包括对GPU、Linux GUI应用程序的支持,以及简化安装体验。

一方面,WSL 2支持GPU计算工作流,使Linux工具能够利用GPU为一系列开发场景进行硬件加速,例如并行计算、训练AI和机器学习模型。该功能将在今年下半年正式更新。

另一方面,WSL 2将支持Linux GUI应用程序,允许用户在打开一个WSL实例时直接运行Linux GUI应用程序,无需第三方服务器。

今年晚些时候,WSL 2将支持简化安装体验。届时,开发者能够简单地运行“wsl.exe -install”命令并重新启动。

八、Microsoft Teams平台功能

在疫情期间,Microsoft 365核心组件Microsoft Team智能会议平台的使用量出现了大幅度的增长。

今年4月,Satya Nadella谈到,Microsoft Team的单日参会量已超过2亿,产生了超过41亿分钟的会议记录。此外,目前Teams每天有超过7500万活跃用户,其中有三分之二的用户在Teams上进行文件共享、协作或交互。

因此,微软针对线上会议的庞大需求,对Microsoft Teams进行一系列功能更新,其中包括扩展Visual Studio和Visual Studio Code,让开发者能使用自己熟悉的工具对Teams应用进行开发;提供Power Virtual Agents bot,消除在Teams中使用Power Virtual Agents bot时,用户重复登录的需要等。

九、开源并升级Fluid Framework

2019年,微软推出了协作平台Fluid Framework,它能帮助用户更好地进行协作,并增强共享互动体验。

在今晚的大会上,微软宣布将开源Fluid Framework,同时还针对其协作形式进行一系列升级,主要体现在Outlook和Office.com中。

一方面,用户可以在网页版Outlook中插入图表、任务列表等,使用户的销售数据、项目任务和研究报道等资料保持实时更新;

另一方面,用户可创建和管理Fluid工作区,如文档活动源和推荐列表,或在office.com中进行搜索。由于Fluid Framework组建是轻量级的,因此用户可即时编辑。

十、提供负责任的机器学习工具

微软人工智能平台副总裁埃里克·博伊德(Eric Boyd)曾指出,如今越来越多的开发人员都被要求构建一个易于解释,且符合非歧视和隐私法规的AI系统。

基于此,微软决定在Azure机器学习和OSS工具包中发布负责任的机器学习工具,通过改善模型的可解释性来减少不公平性,并确保数据隐私和机密性,进一步帮助开发者更负责任地部署AI模型。

一方面,它通过将Fairlearn与Azure机器学习结合使用,让开发者和数据科学家可利用专门的算法来确保每个人都拥有更公平的结果。

另一方面,它通过将新的WhiteNoise差异隐私工具包与Azure机器学习结合,让数据科学团队能够构建机器学习解决方案,在保护隐私的同时防止个人数据的重新标识。

此外,为了实现安全的模型训练和部署,Azure机器学习还提供数据和网络保护功能。其中,包括对Azure虚拟网络的支持、用于连接机器学习工作区的专用链接,以及客户管理密钥等。

结语:一场面向开发者的技术盛宴

从今晚微软Build大会的发布看,微软越来越重视开发者的体验,在为开发者提供越来越便捷和丰富的开发工具时,也更强调他们身上所担起的责任和义务。

其中,微软与OpenAI合作开发的AI超级计算机面世、首次面向专业领域推出的Azure服务、针对工业系统的AI开发平台Project Bonsai、UWP和Win32的统一,以及微软图灵模型等重磅产品推出和升级,无疑展现了微软与开发者之间的彼此依赖、彼此赋能。

随着全球各行各业的数字化转型热潮铺开,微软又将如何在这个过程中进一步探索自己与开发者、与AI技术、与产业之间的合作与未来?时间会告诉我们答案。

    THE END
    喜欢就支持一下吧
    点赞6 分享
    评论 抢沙发
    头像
    欢迎您留下宝贵的见解!
    提交
    头像

    昵称

    取消
    昵称表情代码图片

      暂无评论内容