AI提示工程的深度探讨:Anthropic专家圆桌讨论的重点总结

最近才有空看完了这场来自Anthropic的圆桌讨论,多位来自不同岗位的AI专家深入探讨了提示工程(Prompt Engineering)的本质、技巧与未来发展。参与者包括负责开发团队关系的Alex、主要与客户打交道的David Hershey、领导微调团队的Amanda Askell,以及提示工程师Zack Witten。一些核心重点总结如下:

什么是提示工程?

提示工程本质上是一门关于如何与AI模型进行有效沟通的艺术。正如Zack所说,这项工作的核心在于”指导模型完成特定任务,致力于挖掘模型的最大潜力。通过与模型协同合作,我们得以完成那些原本难以实现的目标”,”从根本上说,与模型交互就像与人对话一样。我们需要深入理解模型的运作机制和反应模式。”

为什么称之为”工程”?

  • 迭代过程:提示工程最大的特点在于其试错和迭代的特性。与人类交谈不同,你可以随时”重启”对话,从头开始尝试不同的方法;
  • 系统思维:需要考虑数据来源、系统延迟等技术因素;
  • 版本控制:就像编程一样,需要追踪不同版本的提示词效果;
  • 整体规划:特别是在企业应用中,需要考虑如何将提示词整合到整个系统中;

优秀提示工程师的特质

  1. 清晰的沟通能力
    • 能够明确表达任务需求,不带模糊性;
    • 想象你在向一个聪明但对你的领域完全陌生的临时工解释任务;
  2. 迭代精神
    • Amanda分享说她在15分钟内可能会向模型发送数百次提示来优化结果 – “这就是不断来回、反复、再反复…所以我认为这种愿意迭代和观察的态度很重要,要思考『这里是否有什么被误解了?』然后修复那个问题”;
    • 但要警惕过度迭代的陷阱,Zack提醒说有时候会陷入追求”完美提示词”的误区。要学会判断何时应该停止迭代,认识到可能存在模型能力的硬性限制;
  3. 边界思维
    • 考虑异常情况和边界条件 – “你真正想要做的是找到那些不寻常的情况…你必须思考你的提示词,想想『在哪些情况下,我会对应该怎么做感到非常困惑?』”
    • Amanda强调,不要只测试典型案例。比如,如果你的任务是”提取所有以G开头的名字”,你应该测试:
      • 没有G开头名字的情况
      • 完全空白的输入
      • 格式错误的数据
    • 在企业环境中,边界测试尤其重要,因为用户的输入往往难以预料,例如往往会包含拼写错误、缺少标点符号等问题;
  4. 同理心
    • 理解模型的”思维方式”;
    • 能够预见用户可能的输入方式。在企业场景中尤为重要,因为你需要考虑最终用户如何与模型互动;

实用技巧与方法

1. 尊重模型能力,给与充分上下文

  • David强调不要”低估”模型,很多客户倾向于过度简化任务。他举例说 - 当客户描述他们的需求时,直接将这些口头描述转成提示词甚至往往比精心设计的提示词效果更好;
  • Amanda建议让其他人阅读你的提示词,看他们是否能理解;

2. 向模型寻求帮助

  • 分析错误原因:当模型出错时,直接询问它为什么出错,让它分析原因;
  • 提示词改进:Amanda分享了一种改进提示词的方法。她在给出初始提示词时,会要求模型不要直接执行指令,而是先分析指令中不清晰或存在歧义的部分。虽然这种方法并非总能完美识别问题,但常常能带来帮助。
  • 利用模型辅助优化:可以直接请模型帮助编写更好的指令版本;
  • 协同设计:可以让模型通过提问的方式帮助完善任务需求,类似设计师与客户的交互 - David分享说:在提示工程过程中,最具挑战性的部分是从思维中准确提取相关信息并将其转化为提示,同时确保不遗漏重要内容。为了解决这个问题,他采取了让Claude对自己进行采访,再将采访内容转化为提示的方法;

3. 处理边界情况

  • 用户的实际输入往往比预期的要混乱得多,需要为意外情况提供明确的处理方案,例如Amanda建议在提示词中明确指出:”如果遇到异常情况,请在特定标签中输出’不确定’”,这样不仅能防止模型做出错误判断,还能帮助收集问题数据;

4. 角色与诚实性

  • 讨论中提到了一个有趣的观点:随着模型能力的提升,没有必要对模型”撒谎”或假装特定角色:
    • Amanda表示她更倾向于直接告诉模型她的身份和真实目的 – “我认为随着模型变得更加强大,对世界的理解更加深入…我认为没有必要对它们使用虚构的设定”;
    • 不过在特定情况下,使用类比可能会有帮助。比如Zack分享说,在评估图表质量时,让模型想象自己在给高中作业打分可能会有帮助;

提示工程的演变

历史变迁

  • 从预训练模型到现代模型的变化 - 早期需要更多技巧性的提示词设计,现代模型更容易理解自然语言指令。Zack提到,很多曾经有效的”技巧”现在已经被直接训练进模型中;

当前趋势

  • 与模型协作:Amanda分享说她现在经常直接给模型相关论文或资料,让模型自己理解任务;
  • 更自然的交互:专家们发现,简单直接的表达往往比复杂的提示词更有效;
  • 关注边界探索:David指出简单的任务(如写邮件)并不能提供足够的学习机会,真正的学习来自于尝试完成看似不可能的任务建议,这样可以更好地理解和突破模型的能力边界;
  • 测试驱动开发:像软件开发一样,提示工程也开始重视测试和评估的重要性;

未来展望

短期发展

  • 模型将更多地参与提示优化过程;
  • 提示生成工具会更加普及;
  • 交互方式会更加自然;
  • 测试和评估工具将变得更加完善;

长期趋势

  • Amanda提出了一个有趣的观点:未来可能从”教导模型”转变为”与专家对话”;
  • 模型可能更像设计师而不是临时工,会主动引导用户明确需求;
  • 提示工程师的角色可能更偏向发展为需求分析师;

结语

提示工程不仅仅是一门技术,更是一门艺术。正如Amanda所说,它很像哲学写作:你需要让一个聪明但可能对领域完全陌生的读者完全理解你的意思。随着AI技术的发展,基础的提示工程可能会变得更加简单,但对于追求卓越性能的场景,精确的提示工程仍将继续发挥重要作用。

正如讨论中提到的,好的提示工程就像是”将你的大脑外化”的过程[注1],能够清晰地表达思维,并理解AI模型的特点。在未来,这种人机协作的方式可能会发生变化,但清晰沟通和系统思维的核心价值将持续存在。

[注1] – 这里的“外化“指能够清晰全面地表达自己的想法,就像在向他人传递知识一样;

原始采访视频: