开源ChatGPT、Stable Diffusion本地部署，及关于国产AI产业链的思考-卡咪卡咪哈-一个博客

高岭土的破解

中国的瓷器工业曾经遥遥领先世界，通过向欧洲出口赚取高额利润。差不多统治市场长达上千年，而其中的秘诀，就是高端瓷器使用了景德镇的高岭土。

法国传教士殷弘绪1699年来到中国。他一边传教一边学习陶瓷制作工艺，获取了景德镇陶瓷制作工艺的第一手资料。同时为了验证这些资料的准确性，他查阅了不少陶瓷典籍，尤其是景德镇当地文献。

殷弘绪将这些资料成果整理成两封书信，分别于1712年9月1日和1722年1月25日发给奥里神父。

在信中，他写道：

“制瓷原料是由叫做白不子和高岭的两种土合成的……精瓷之所以密实，完全是因为含有高岭土。高岭土可比作瓷器的神经……”

这两封书信传到法国50年后，法国陶工终于在利摩日找到了高岭土，并成功生产出硬质瓷。当然了，法国人还发现高岭土中，有一类可以治疗腹泻，发明了“蒙脱石散”，这是后话… …

随着高岭土配方的破解，中国的瓷器技术被欧洲学习并超越，市场占有率一落千丈。

不要一提开源就跳脚

星空君是推崇开源的，中国的码农也是全球开源大军中重要的组成力量，为世界开源事业做出了伟大的贡献。

很多人经常把一句话挂在嘴边：一开源就有国产。暗示所谓国产都是模（chao）仿（xi）。

其实中国并不是一开始就强调什么都要国产的，尤其是上世纪90年代加入WTO前后，中国一直试图融入全球产业链，成为合理的一个环节。

注意，是合理。

如果欧美当一等人，日韩当二等人，中国和亚非拉人只能当三等甚至末等人，永远8亿衬衫换一架波音，那么这个产业链一定是不合理的。

2010年4月15日，美国总统奥巴马在白宫接受澳大利亚电视台采访时说，“如果超过10亿中国人的生活方式与澳大利亚人和美国人现在的生活方式相同，那么我们所有人都将处于一个非常悲惨的时期。”

很显然，有些人不想拿中国人当人。或者，他们想当中国人的人上人。

在这种情况下，利用拿来主义模（chao）仿（xi）开源产品做成国产自主可控产品，星空君觉得并没有什么道德上的负担。

一个冷知识，现在中国的国产操作系统、软件，绝大多数都符合开源协议（麒麟操作系统曾经有过被反编译发现抄袭的黑历史，但后来也通过符合开源协议和解）。

哪怕被网友黑的体无完肤的鸿蒙，也是符合开源协议的。

有人想把你打回农耕文明，你还在冷嘲热讽备战备荒的行为不符合西方礼仪。

Stable Diffusion本地部署

文心一言刚放开测试的时候，其AI绘画功能被很多人嘲讽套了一个壳，后面接的是Stable Diffusion等开源产品。

先不说百度本身就是开源的积极践行者（当年连AI自动驾驶项目都开源了），这种全球级的大厂如果用这种方式，必然会被同行挖出，然后体无完肤。

百度只是商业营销方面有过道德瑕疵，软件开发方面还真没有。

星空君差不多用了两个礼拜深度使用Stable Diffusion，测试了数十个模型（含lora），安装了若干个插件（包括百度翻译prompt）… …

是因为好玩吗？

不，AI小姐姐的诱惑力还没那么大。

是因为它是先进生产力的发展要求，是先进文化的前进方向。

一定要为我所用。

1、什么是Stable Diffusion

现在在最火的AI绘图工具莫过于midjourney，已经可以生成近乎可以直接用来商用的AI图片。

不过，midjourney有两个门槛，一个是有些操作需要科学上网，第二个是每月有一笔不大不小的费用（30美金）。

如果不是以绘图为职业，仅仅是兴趣爱好，或者相对AI绘图有一个相对较为底层的了解，或许有另外的不花钱的选择。

Stable diffusion。

Stable diffusion是一个基于Latent Diffusion Models（潜在扩散模型，LDMs）的由文字生成图像的（text-to-image）模型。

重要的是，它是开源+本地化部署的。

需要声明的是，免费的，往往是最贵的，因为要有折腾的成本。

假如你是一个需要接商单的职业画师，建议还是去花钱。

2、给小姐姐完整的一生（身）：硬件

首先你要有一块还算可以的Nvidia显卡，20系30系都可以，当然了，如果上最新的40系，除了价格贵以外，还可能会有开车太快的眩晕感。

打开凤凰新闻，查看更多高清图片

如果实在没有显卡，集显用户也不是不能操作，比如我曾经用笔记本的集显跑一个多钟头算AI小姐姐，同样的参数，在Nvidia 3060上只需要5秒。

在预算较低的情况下，3060是一个非常不错的选择，为了后续使用ChatGLM（但是仅仅是跑起来而已，后面还是要升级显卡），我特意选了12G显存的配置，内存16G，硬盘换成了长江存储颗粒的2T容量SSD。

最近长存颗粒杀红眼了，2T只需要500块。

本来看好了一套深度学习的主机，要2万块，但想了想不如先从起步开始。

3060的全套配置（不含显示器）下来，只需要6000块。

3、选择一个汉化好的安装包

Stable diffusion是开源的，已经有了不少的汉化的不错的版本。

如果你是老手，请点击右上角的关闭符号；

如果你是新手，本文会给你一个简单到“一键式”使用的操作方式。

下载：

https://pan.baidu.com/s/1aT9t7hwVjasaNboE6nK0ng?pwd=lgyh

（请复制到浏览器打开，提取码lgyh）

这个安装包整合了Stable diffusion依赖的所有环境，可以一键启动.

不过体积也比较大，差不多十几个G，如果想要获得很好的效果，还要下载安装一些模型，一般模型都要几个G，所以2T的硬盘是有必要的。

启动界面说明：

生成引擎是选择你要计算用的显卡，显存优化根据你的显卡实际容量进行选择，监听端口默认7860，这个端口可以修改，如果开放远程连接，则需要在系统的防火墙里进行配置，允许TCP协议通过7860（或修改后）的端口。

开放远程连接的好处是可以在其他电脑（局域网内）甚至手机上连接该电脑，进行AI绘图。这样我只需要把台式机塞在桌子底下，用核显笔记本连接进行绘图即可。

如果拥有公网地址，则可以通过路由器配置端口映射在互联网随时访问。

以win11为例，在防火墙和网络防护–高级设置–入站规则，增加一个规则“7860”，规则的内容为TCP协议允许7860特定端口被访问。

4、开始你的第一张AI小姐姐吧：常见功能介绍

程序启动成功后，系统会自动打开浏览器并跳转到绘图页面。

如果在局域网里其他电脑访问，可以采用 http://ip地址:7860 的方式。

最常用的是“文生图”功能，也就是用文字触发AI绘图，现在大部分版本只支持英文，这对使用者输入关键词的能力非常高。

也可以安装百度翻译的插件，能够相对轻松的实现和AI的交互。

第一批因为AI绘画下岗的画师，已经开始在网上批斗Stable Diffusion等AI工具了，但没有意义，与其抨击，不如拥抱未来。

开源版的ChatGPT

OpenAI的股权架构发生了比较大的变化，马斯克作为初始投资者之一，几乎没有任何控制权。

换言之，这成了一个资本操控的公司，背后最大的资本是微软。所以，指望ChatGPT开源，难度很大（当然不排除会开源一个低阶版本）。

在ChatGPT火爆的同时，清华团队推出的ChatGLM没有得到公众的重视。

但星空君重视了，因为它有两大特点，是ChatGPT不可能取代的。

一是仅需消费级显卡，单机可部署。ChatGLM对显卡最低配置要求才7G，当然了，如果很好的跑起来起码要13G（市面上没有这么巧合的显卡，你只能买16G起），再进一步想要自己训练的话，可能24G起步。虽然是消费级，但这是高消费啊！话又说回来，和OpenAI烧了十几万张专业算力卡相比，ChatGLM实在是太太太亲民了。

二是开源（ChatGLM做了两个版本，一个是130B的商业版，一个是开源的是6B版本）。开源的意思是全世界的爱好者都可以参与开发，众人拾柴火焰高。星空君想到的第一件事就是可以训练专属语料库，用在垂直领域。并且惊喜的发现，已经有人在这么干了，把开源代码放在了github.上。

然而看到显卡配置的时候，星空君眼前一黑。

截至目前（4月9日），ChatGLM共有三个图形界面部署包，一个是秋叶大神（B站ID：秋葉aaaki，Stable diffusion的中文一键部署包就是他的杰作）制作的，一个是大江户战士制作的，另一个是官方团队制作的。

略搞笑的是，其中做的体验最差的是官方团队那一版。

本文推荐秋叶大神的版本（为了鼓励作者，请到他的主页三连：笔芯）。

链接: https://pan.baidu.com/s/1LlhQTHrMpI8kUPI6-dkP6Q 提取码: 31j8

1、准备工作

第一依然是显卡，8G起步，6G的不要考虑了，12G也只能玩缩水版，16G可以给她完整的一生，如果要训练自己的语料库，24G的显卡是必须的。

2、安装最新版的显卡驱动

3、安装最新版的cuda

Cuda是Nvidia的专属工具，新版可以对显卡的算力进行优化。在部署Stable diffusion的时候没有发现问题，但在部署ChatGLM的时候却发现报错，升级cuda后解决。

4、一键启动后的界面