1.01亿美元融资,为Stable Diffusion捐赠算力的公司两年成为独角兽

编辑:shanshan、张倩

这家公司声称要让 10 亿人用上开源大模型。

根据文本生成图像是今年大火的一个研究方向,与之相关的 Stable Diffusion 模型已经在 GitHub 上收获了 3 万多颗星,其热度增长曲线之陡峭甚至盖过了刚出道时的 Transformer。

值得注意的是,该模型是首个在 4000 个 A100 Ezra-1 AI 超大集群上进行训练的文本转图像模型,可以在消费级 GPU 上的 10 GB VRAM 下运行,并在几秒钟内生成 512×512 像素的图像,无需预处理和后处理,这是速度和质量上的突破。

它背后的技术基础主要来自一篇 CVPR 2022 的论文——《High-Resolution Image Synthesis with Latent Diffusion Models》,作者是几位来自慕尼黑大学、海德堡大学和 AI 视频剪辑技术创业公司 Runway 的研究者。

那么,这几位研究者是如何得到那么多训练资源的呢?我们可以在其 GitHub 的介绍中得到答案:一家名为 Stability AI 的英国开源人工智能公司为其捐赠了计算资源。

打开凤凰新闻,查看更多高清图片

当然,Stable Diffusion 的成功也给 Stability AI 带来了可观的回报。美国东部时间 2022 年 10 月 17 日,Stability AI 宣布获得 1.01 亿美元融资,由 Coatue、Lightspeed Venture Partners 和 OShaughnessy Ventures LLC 投资。融资完成后,Stability AI 估值将达到 10 亿美元,成为新晋独角兽。

据悉,Stability AI 将利用这笔资金加速开发面向全球消费者和企业用例的图像、语言、音频、视频、3D 等开放 AI 模型。

“人工智能有望解决人类面临的一些最大挑战。但只有当这项技术对所有人开放且可供所有人使用时,我们才能实现这一潜力。”Stability AI 创始人兼首席执行官 Emad Mostaque 说。

AI by the people, for the people

Stability AI 总部位于英国伦敦,它正试图使 AI 民主化,并利用其潜力 “唤醒人类的潜力”,在其官网顶部赫然写着 “AI by the people,for the people”。

Stability AI 创始人兼 CEO 莫斯塔克(Emad Mostaque)今年 39 岁,来自孟加拉国,在英国长大。他在 2005 年获得牛津大学数学和计算机科学硕士学位,毕业后在英国一家对冲基金公司工作了 13 年。

作为一个拥有计算机背景的投资人,Emad Mostaque 更善于捕捉 IT 技术的市场机会。2019 年,他曾创业做了一家身份认证的 SaaS 公司,但并不顺利。2020 年底,Emad Mostaque 卷土重来,创立 Stability AI,初衷就是做一个 AI 开源的平台。

在对冲基金工作的经历帮他积累了一些资金和大量的人脉,这也是 Stability AI 得以成立并支持 Stable Diffusion 等大型模型训练的前提。在最近的一次采访中,Emad 也提到了 Stability AI 的算力情况:他们在亚马逊的帮助下,构建了一个包含 12,100 个计算节点的开源集群,它有可能成为第十位最快的公共超级计算机。

Stable Diffusion 是一款功能强大、免费且开源的文本到图像生成器。不仅完全开放了图片版权,甚至开放了源代码,并允许用户免费使用该工具,允许后继的创业者们使用开源框架构建起更加开放而生猛的内容大生态。

“Satble Diffusion 最初用于训练的 4000 台 A100 的显卡价值不菲,很难想象他们有着怎样的财力,抱着怎样的理念,或者说为人们做贡献的精神去把这个东西放出来的。它的价值之高,对业界的影响之大,说是 AI 革命都不过分。” 一位创业者如此评论。

关于 AI 底层工具要不要开源,这是一个意见分歧很大的话题。OpenAI 被微软以 10 亿美元收购的时候,马斯克认为它背离了当初联合创立 OpenAI”自由开放” 的初衷,很多以前的开源工具现在都变成收费了,成为了一家以商业盈利为目标的企业。

Stable Diffusion 更像是回到了 OpenAI 的初衷,开发者可以完全免费下载 AI 绘画的底层代码,来训练自己的模型。不过,用户在使用 AI 绘画服务的时候还是要按需付费。目前,Stability AI 还在进一步探索商业模式,包括在研发用 AI 做短视频和动画片。

Emad 表示,他们「有一个基础使命,即在保持研发和学术独立性的同时,如何将其产品化,使其触达 10 亿用户…… 让成百万人,数亿人用上这项技术」。

为了实现这一愿景,Stability AI 正在不断聚集资金、人才、顶级模型等资源。

据悉,该公司目前共有 103 名员工,有 1 名博士,明年计划资助超过 100 位博士。最近,前谷歌研究科学家 David Ha 等知名研究者也官宣加入 Stability AI。

除了 Stable Diffusion,Stability AI 的社区目前还聚集了 EleutherAI 和 LAION 等知名开源项目,生物模型 OpenBioML、音频生成 Harmonai、人类偏好学习 Carperai、新冠研究 Caiac 和多模态 DeepFloyd 等更多项目。

公司发言人表示,未来商业模式类似红帽和 MongoDB,开源版本免费,通过商业版本来盈利。而有熟悉公司商业计划书的人士说,更长远的计划是成为一个控股公司,支持多个开源项目的商业化。

一边被热情赞美,一边被激烈批评

自 8 月推出以来,Stable Diffusion 已被全球超过 200,000 名开发者下载和授权,成为目前可用性最高的开源模型。DreamStudio 是 Stability AI 面向消费者的产品,目前注册用户已经超过 100 万,他们来自全球 50 多个国家,共同创建了超过 1.7 亿张图像。

但是,也正由于这种开放性,使得 Stable Diffusion 一边被热情赞美,一边被激烈批评。相比其他 AI 绘画平台,Stable Diffusion 一方面开源了很多底层代码,使得有一定编程能力的开发者可以绕开限制,实现别的平台难以实现的功能;另一方面监管程度更低,比如在别的平台上被禁止的名人和敏感图像,在这里也可以使用,使得 Stable Diffusion 成为争议最大的 AI 绘画平台。

有从业者指出,Stable Diffusion 让生成暴力和色情图像变得更容易,而且内容中往往包含大量真人特征。同时,版权方面的争议给 Stable Diffusion 招来了诸多批评,人们抱怨它们在盗窃艺术家的创作成果。甚至有批评人士指出,AI 不仅窃取了艺术家的心血,还践踏了人们用无数小时磨练出的精湛技艺。

Stability AI 做出的回应,是多次重申技术中立的态度。“归根结底,使用者自己需要为如何使用这项技术负责,包括是否合乎道德和法律。人们当然可能用它生成糟糕的内容…… 但我认为这只占总使用量中非常非常低的比例。” 在 Emad Mostaque 看来,AI 世界正走向由硅谷文化和道德主导的道路,而开源软件可以开辟出新的战线。以图像生成工具为例,他希望不同国家能够开发属于自己的模型和数据集,借此 “反映人类社会的多样性”,最终摆脱 “以西方占主导的单一互联网文化”。

“我们相信开源 AI 技术有能力释放人类的创造力并实现更广泛的利益。Stability AI 是一个伟大的想法,它超越了 AI 的直接应用。我们很高兴能成为 Stability AI 旅程的一部分,我们期待看到世界用 Stability AI 的技术创造什么。”Coatue 的普通合伙人 Sri Viswanath 说。

    THE END
    喜欢就支持一下吧
    点赞12 分享
    评论 抢沙发
    头像
    欢迎您留下宝贵的见解!
    提交
    头像

    昵称

    取消
    昵称表情代码图片

      暂无评论内容