不写代码、靠“玩”ChatGPT年入百万，提示工程师正变成硅谷新宠-卡咪卡咪哈-一个博客

一个阳光明媚的早晨，住在旧金山的软件工程师Anna像往常一样，坐在电脑前，打开ChatGPT，输入“帮我规划我的一天”。

ChatGPT回答“当然可以！”，随机给出从早上到晚上的日程计划，并提示“你可以根据自己的情况进行调整。”

Anna想了想，在对话框里补充，“我晚上9点要哄娃睡觉，重新帮我规划。”

这一次，ChatGPT的帮她在晚上的日程里添加了“帮助孩子准备第二天上学准备物品”和“帮助孩子洗漱并睡觉”等事项。

随着ChatGPT等AI工具的风靡，Anna身边越来越多的人开始将其作为日常生活和工作的助手。事实上，Anna 不仅会向 ChatGPT 咨询生活安排，也会让它处理一些简单的工作，比如给一段代码添加一个功能等。

不过，当涉及到比较复杂的任务时，即便知道 ChatGPT 很强大，Anna 也觉得有点力不从心，“说了一堆要求，但是它给出的代码经常不是我想要的。”

Anna 的这句话道出了目前困扰不少科技公司的一个问题：在强大的工具面前，如何更好的与它对话，来完成专业任务？

对此，一个新兴职业——提示工程师（Prompt Engineer）应运而生。不少公司对这一职位求贤若渴，开出的薪资甚至高达33.5万美元一年。

提示工程师的主要职责是帮助训练大型语言模型(LLM)，让AI能更好的理解需求，完成专业任务。简而言之，他们的任务就是将一个复杂的任务拆分，提炼成长度有限的自然语言，来一步步查询AI工具，从而获得更准确的回答。

用自然语言对话，这听起来是一件再日常不过的事情，可它为什么一下子成为了香饽饽？

重启对话：逻辑让AI更懂需求

在旧金山，AI 研究公司 Anthropic 为提示工程师开出的薪水高达33.5万美元。在职位描述中，该公司提到，“这是编程、指导和教学的结合”，主要职责是帮助公司构建提示库，让 LLM 完成不同的任务。

那么，到底什么是提示？提示工程又是什么？

按照学者们的定义，提示是一组输入文本或指令，用于指导 ChatGPT 等 AI 模型生成所需的输出。换句话说，提示是一种特定文本，它的目标是让 AI 模型产出符合特定标准或参数的结果。

提示工程则是是创建和完善这些提示，以生成所需结果的过程。提示工程的目标是创建准确有效的提示。提示工程师使用自然语言，并将纯文本命令发送到 AI 模型，让其执行实际工作。相比之下，传统程序员则使用编程语言，通常需要更多的代码编写和技术知识，以执行相同的任务。

而提示工程师的薪资如此之高，很大程度上是因为语言模型的成功取决于编写清晰的提示。这需要工程师们开发复杂的策略，将简单的输入转化为高质量的结果，避免出现离题或者不一致的输出。

目前最出名的提示工程师可能是名为Riley Goodside的程序员，就是他发现，只要提示ChatGPT“忽略之前的指示”，ChatGPT就会说出自己从OpenAI那里获取的“出厂设置”信息。

图源：Twitter

不仅如此，他还凭借出色的提示技术，把ChatGPT玩出了不少花样，并在Twitter上一炮而红。随后，他高薪加入了创业公司Scale AI，成为了“世界上第一个被招聘的提示工程师”。

在Scale AI看来，AI大模型可以被视为一种新型计算机，而“提示工程师”则相当于其编程人员。通过提示工程找到最合适的提示词，可以激发AI大模型的最大潜力。所以，Riley Goodside完全配得上这份薪水。

不止Riley Goodside，还有越来越多的人正在加入这个行业。

29岁的 Albert Phelps 是AI金融咨询公司 Mudano 的一位提示工程师。他和同事们的日常就是为 OpenAI 等工具编写提示。这些提示可以作为预设，保存在 OpenAI 的 Playground 中，供其客户使用。Phelps 介绍，他们每天需要编写5 个不同的提示，与 ChatGPT 进行大约50次交互。

和大多数程序员不一样的是，Phelps 并没有计算机相关背景，而是毕业于历史系。事实上，对于提示工程师而言，最重要的是逻辑。虽然编程知识和机器学习的背景对工作很有帮助，但却并不是必要条件。

Anthropic 的技术人员 Matt Bell 就曾提到，“我们最好的提示工程师是一位哲学家。好的提示包括写出极其清晰的解释，并找出造成误解的原因以及如何避免误解。”

也就是说，当AI模型的使用者像软件工程师Anna一样，一次性“说了一堆要求”时，可能会因为提示不清晰，而导致AI误解，给出离题的答案。

对此，阿德莱德大学澳大利亚机器学习研究所(AIML)的高级讲师 Lingqiao Liu 指出，好的提示工程的关键是将一项复杂的任务分解成一组简单的任务。

他介绍，如果你问这些模型一个简单的问题（称为“零样本提示”），它通常会以缺乏细节或结构的“普通”答案作为回应。为了让 AI 模型给出更加符合标准的结果，用户可以采取以下几种方式：

第一种方法是一次性提示，即用户给出一对问答示例，让 AI 了解需求，并按照该模版处理后续请求。比如，在咨询关于某一种动物的信息时，让模型根据特点、居住区域、饮食习惯等来给出信息。

第二种是角色提示，例如告诉模型”我是一个妈妈，想要知道每天行程规划“，从而让模型根据”妈妈“的角色来给出具体安排。

第三种方法是引入关键代理。例如，你可以让 ChatGPT 写一个关于机器人的故事，然后让它根据自己的建议进行批评和改写。

最后一种方法是思维链，即先让AI对回答某个问题给出具体步骤，然后在鼓励它依照自己给出的步骤，来推理更复杂的问题。

如果一位艺术家想要使用 ChatGPT 和 Midjourney 来进行创作，或许可以尝试一下这一条来自 PromptHero 的高赞提示：

[我想让你充当 Midjourney 人工智能程序的提示生成器。你的工作是提供详细的、有创意的描述，以激发 AI 独特而有趣的图像。请记住，AI 能够理解多种语言并能解释抽象概念，因此请尽可能发挥想象力和描述性。例如，您可以描述未来城市的场景，或者充满奇怪生物的超现实景观。您的描述越详细、越富有想象力，生成的图像就会越有趣。这是你的第一个提示：“一望无际的野花田，每一个都有不同的颜色和形状。在远处，一棵巨大的树耸立在风景之上，它的树枝像触手一样伸向天空”]

总之，对于生成文本的AI模型而言，如何编写出逻辑清晰的提示至关重要。不过，在其他领域，好的提示可能需要更多元素。

构建图像：关键词拓展想象力

随着提示工程的价值被挖掘，这股新鲜血液开始涌向更多场景。图像则是其中最受关注的领域之一。

就图像生成而言，创造者们认为提示的好坏与否取决于关键词。

七个月前，Jason Allen 凭借着下面这张在 Midjourney 上创作的一幅作品《太空歌剧院》赢得科罗拉多州的一场艺术比赛。

Jason Allen 获奖作品《太空歌剧院》