首个财经垂类大语言模型“财经头条大语言模型”诞生！-卡咪卡咪哈-一个博客

原标题：首个财经垂类大语言模型“财经头条大语言模型”诞生！

早关注音频：进度条00:00 09:07 后退15秒倍速快进15秒

自微软旗下的OpenAI推出生成式人工智能大语言模型以来，商业世界进入了一个新的纪元。

一是全球企业在短期内推出了数以千计的AI模型，热闹非凡。

百度拥有文心大模型技术，在底层技术、场景建设、生态圈建立等领域都有涉及。特别是旗下文心一言大模型已经外延到企业客户的商用服务领域，协助企业开发自己的专属大模型。

今年四月，360创始人周鸿祎在内部信中发布了“总动员令”，其中表示：“360每一位员工、每个产品和业务都要全面拥抱人工智能，适应人机协作，着手产品重塑。”

此外，科大讯飞旗下的星火大模型、阿里的“通义千问”、腾讯的“混元”等各头部企业的类似产品也迅速出炉，在国内掀起不小的浪花。

最近，IDC预计，中国人工智能市场规模在2023年将超过147亿美元，到2026年或将超过263亿美元。

二是各国政府正密切关注生成式人工智能行业发展的动态，相关监管政策正在逐步建立和完善当中。

四月中旬，国家网信办发布《生成式人工智能服务管理办法（征求意见稿）》，其中对用户隐私、内容歧视和模型研发三个重要风险点做了回应梳理和底线明确。

近日，日本有关部门召开AI战略小组会议，明确在收集作品数据的AI开发阶段，原则上可不经著作权所有方允许进行利用，但若公布或销售生成的图像等，则遵循一般的侵犯著作权的思维方式来判断。

美国白宫建立了一个汇聚众多行业顶级专家的生成式人工智能工作组，组员由AMD的首席执行官苏姿丰（Lisa Su）和谷歌云首席信息安全官菲尔·维纳布尔斯（Phil Venables）等人构成，主要职能是研究生成式人工智能技术在科学及社会领域的影响。

政策面和商业界的极度重视告诉我们，一个由生成式大语言人工智能模型（ChatGPT）所引领的、在DALL-E 2、Midjourney等图像生成领域，以及蛋白质结构预测等各科学应用层面百花齐放的AI时代正快速到来。

但一切真的如此顺利吗？

生成式大模型并不简单

AI所带来的内容错误或偏颇、道德辩论和对众多岗位的冲击不是本文的重点，暂且不论。就从商业应用方面上讲，大模型时代带给企业的可能并不全是好的。

首先，类似ChatGPT这样产品的研发费用极其高昂、门槛很高。

当我们要求一个模型使用几乎整个互联网的数据进行训练时，这个代价是显而易见的。OpenAI没有公布确切的成本，但麦肯锡的估算认为，上一代的GPT3是用大约45太字节（TB）的文本数据上训练出来的，这大致是整个美国国会图书馆的四分之一的馆藏文本量。

且硬件上需要使用512颗英伟达V100显卡训练7个月时间，估计训练总成本约每个月数百万美元。

华为最近也表示，旗下大模型开发和训练一次的成本高达1200万美元之巨。

对于大多数中小微企业来说，要自研一个性能较为充足的大语言模型实属门槛高、投入多、风险大。

另一方面，那些获得核心技术的头部企业，诸如OpenAI和谷歌已经开始允许开放应用程序接口，这样一来，很多第三方开发者可以将现成的大模型集成到自己的应用层面，不用自研，只需要支付给这些头部企业服务使用费。

即便当前像GPT3.5 API接口的费用可能只有0.002美元/1000 tokens。但我们依然有理由相信一旦时机成熟，这些掌握核心技术的头部企业很可能会提高要价，到那时已经将企业生命线放在大模型上的各家企业则只能乖乖买单。

其次，由于生成式人工智能大模型会带来含有偏见、攻击性或者侵害版权的内容，各国政府对这类模型的监管意见也可能为企业的商业应用带来一定的风险。

特别是对于上市企业来说，如果在内部植入了其他头部企业的大语言模型，则很容易出现机密信息外泄的担忧。

据外媒报道，包括摩根大通、威瑞森（Verizon）在内的数家大公司已屏蔽了内部对ChatGPT的访问渠道。诸如亚马逊这样的互联网企业则鼓励公司的程序员使用内部AI工具来获得写代码的捷径。

此外，对于我国的企业来说，使用大模型过程中的数据存放地和服务场所如果是在国外，则也存在一定的跨境数据安全风险问题。海外大模型厂商如何解决这个棘手问题可能才是这些厂家赢得国内企业青睐的关键策略。

最后，退一万步，上述这些问题都已经得到解决，很多企业家和管理者依然面临着一个“初心式”的问题：不用大模型肯定会被时代淘汰，但公司要如何应用大模型呢？

财经头条大语言模型来了

面对上述这些商用化难题，财经头条通过多年积累下来的人工智能领域研发能力，在短时间内开发出了一款真正为企业提供人工智能大模型时代综合性解决方案的产品——财经头条大语言模型。

据悉，该产品将成为我国首个财经垂直领域的大语言模型。不但能帮助企业精准找到财经领域大语言模型的各种应用场景，还能直接提供具体方案，为企业业务的人工智能化转型出谋划策，提供一站式的咨询服务。

未来企业自研人工智能大模型的门槛会非常高，最强大的模型肯定要数头部企业的最新产品。此外，价值创造将主要源于基于大模型的应用替换过去几年建设的类似应用、生成式AI带来的增量市场和全新的AI赋能的企业级应用三个方面。

说白了就是不具备大模型应用能力的厂商将难以维持商业上的优势。

财经头条方面表示，本次推出的大语言模型是我国首个财经垂直领域的企业级大模型平台，不但提供包括GPT在内的大模型服务及自研大模型服务，还提供大模型植入和企业应用端建设的整套工具链和咨询服务。

主要的优势有四点：

第一，以大语言模型为核心，以较低的成本帮助企业和个人客户完善产品和服务流程。

第二，作为一个大模型服务商，财经头条可以帮助客户和个人开发自己的专属大模型植入方案，找到变现和智能化转型的最佳通道。

第三，以数据安全和谨慎的内控为准绳，严格防范各类商业泄密和虚假内容风险。

第四，利用财经头条旗下财经媒体矩阵多年来深耕用户服务和内容创作的经验，结合为数以亿计的用户提供创新阅读体验的传播能力，提升了该模型在财经垂直领域的精度和应用场景的广度。

在使用方法上，本款产品做到了极简化的操作需求，能让企业和个人用户可以在一个类似微信聊天的界面获得各类答案，也能创造定制化的软件植入解决方案，甚至还能帮助企业训练一个属于自己的GPT大模型。

尾声

当前，全球各类大模型扎堆出现，大小不一的公司都在这个赛道抢夺话语权，很多人不由发出疑问，人工智能大模型的爆发到底是潮头还是泡沫？

对此，在详细了解内情以及亲身使用之后，财经头条大语言模型给我的感觉并不是一款“泛泛之辈”的产品。

就好比财经头条能够花100元做到谷歌1000万元做到的事情。而且产品的更新非常迅速，船小好调头，因为大公司的产品往往做得非常复杂，研发和更新都会较慢。

对于客户来说，不太可能花费如此大的价差来获得差不多的体验，这也将是财经头条大语言模型最大的优势。

【免责声明】文章内容仅供研究和学习使用，所涉及产品信息仅供参考。返回搜狐，查看更多

责任编辑：

THE END

NLP

首个财经垂类大语言模型“财经头条大语言模型”诞生！

1超越ImageNet预训练，Meta AI提出SplitMask，小数据集也能自监督预训练

2智能推荐算法：内容发布系统未来趋势与展望

3专业选择的思路与方法

4入行Web前端的难点是什么如何正确拆分JS代码

5百度马小龙：Spark在百度的工程实践分享

6高精地图技术专栏 | 基于空间连续性的异常3D点云修复技术