焦虑
有些小伙伴最近跟我反馈,看到他人演示的样例,见识到 AI 的强大作用,非常想把这项技术和自己的领域技能结合。但是面对着各种各样的新知,一不小心就被信息洪流淹没其中。好容易奋力挣扎,把某个软件工具吃透,才知道该项技术早已过时或已有更好解决方法,颇感挫折。
以提示词工程举例。在目前阶段,你是否掌握了这项「咒语咏诵术」,对于大语言模型的执行结果而言,差别非常巨大。
本学期,我在两门本科生课程,和一门研究生课程,都试验性加入了「AI 编程」模块,很受学生欢迎。他们用 AI 做游戏,做数据分析,玩儿得不亦乐乎。
可是,他们在调用大语言模型执行任务的时候,往往只会粗略概括自己的目标。例如「给我编个贪吃蛇游戏」或者「帮我分析并可视化这个 csv 数据」。顺利的时候,一切还好。一旦遇到挫折,马上就会认为 AI 目前做不好某些任务,于是退回到手工操作。
于是我给他们讲了一些提示词的基本技巧,大语言模型生成内容的效果立即大为改观。可是,让一个初学者,从头开始了解系统各种类别提示词的撰写方式及其背后逻辑(例如 CoT 等),学习成本并不低。
好在现在有很多提示词包裹的方式,例如 Custom GPTs 。你不需要自己从头发明轮子。完全可以查找到别人做好的 GPT,然后拿来即用。
直接使用别人做好的提示词包裹 Agents 虽然界面简单易用,但是适合别人的提示词,未必真正适合你自己。你可能需要对别人的提示词进行修改。然而很多包裹后的 Agents 是当作 AI 应用发布的,里面有经济利益,所以你未必能看到提示词的原文。
另外,如果你的项目比较复杂,需要把若干个任务结合起来,那么你就得一个个 Agents 轮着来调用,这种重复劳动,有时也会让你非常疲惫。
那么,有没有什么办法获得常见任务的最佳提示词,自己不仅能看到提示词全文,还可以随意修改定制。特别是,你还可以用最为便捷的方式,把这些 Agents 的功用串接起来,协同完成自己的个性化工作呢?
听起来,颇有点儿过于理想化了。好在,我还真的找到了。
效果
我先给你看看这个工具的运行效果。
这段视频,有 1 小时 40 多分钟,要是从头来看,即便是开了两倍速,也得看上一节课的时间。但是如果你非常想了解这则视频里面的要点,可以在命令行里执行一条指令,就可以看到输出的结果:
这些要点,可以有效帮助你快速吸收视频的主要内容。
而我特别喜欢的,是其中这个「想法和引用」功能。
假设你是一名科技作者,在快速了解了 WWDC 2024 的这些要点后,希望写一篇文章,那你可以先把这些要点存储在 yaodian.txt 文件。
之后,再来执行一条命令。这是执行结果的第一屏:
你看,一篇博客的初稿,就写好了。
当然,你可能会质疑这样写出来的博客的质量。不过谁让你把它直接发布出去了?我一直跟你说,AI 是咱们的帮手,不是枪手。这样的初稿,更应该成为建筑大厦的脚手架——待到大厦建成之时,你应该用自己的风格和逻辑,把它改到面目全非才好。
命令
那么,我们刚才究竟执行了什么样的「魔法指令」呢?
其实非常简单。
从 Youtube 提取智慧,我们用的是这一行:
Keep reading with a 7-day free trial
Subscribe to Shuyi’s Newsletter to keep reading this post and get 7 days of free access to the full post archives.