冲击
Claude 3 在 2024 年 3 月 4 日发布,至今只有短短一周时间,但它已经颠覆了很多人的既有观念。
Claude 3 提供三种模型,分别是「中杯」的 Haiku、「大杯」的 Sonnet 和「超大杯」的 Opus。我们今天主要介绍的是超大杯(Opus)模型。
下图展示了 Claude 3 超大杯模型与 GPT-4 的对比。
可以看到,Claude 3 Opus 模型在多个指标上都用绿色字体标出,体现出「全面碾压」的优势。这改变了我们之前将 GPT-4 视为最高性能标杆的认知。
在众多应用场景中,我个人使用 Claude 3 最深刻的体验是将视频转换为博客。我既是一名博客写作者,也是一名视频 up 主。这两项工作有很多重叠之处。当我想要传递某个内容时,我希望既能通过视频的方式呈现,又能提供博客文字,方便读者阅读、检索和日后复习。但过去这两项工作往往相互独立,需要花两份时间来完成。现在情况不同了。
从 GPT-4 时代起,我就在尝试先收集素材做成幻灯,然后录制视频,再将视频转换成博客。你 可以参考这篇文章。
在当时那篇文章里,我给你讲解了不少提示词的技巧。关键就在于「欲速则不达」。如果你试图一次性处理过多的东西,反而会适得其反,效果更糟。但是,那是由彼时GPT-4的上下文窗口不够长,以及在持续输出后造成幻觉等因素缺陷造成的。
现在我发现,Claude 3 大大提升了从视频到博客这个创作过程的体验。今天就来和你详细分享一下。
纠错
首先是纠错环节。将视频转换为博客的第一步,就是修复转写稿中的错误。如果不消除这些错误,后续的人工校对工作会非常繁琐。
要完成这一步,我们需要先获取视频的原始转写稿。得益于 OpenAI Whisper 模型,市面上有众多应用可供选择,从免费到付费,从本地应用到云端服务,应有尽有。
这里我推荐吕立青开发的 bibigpt.co 。
在这个应用中,你可以看到界面里左侧播放视频,右侧会显示视频摘要、思维导图,以及视频的完整转写稿。你只需点击复制按钮,就能获取完整的转写文本。
我将转写稿直接粘贴出来是这个样子的。
可以看到,一上来我的名字就被识别错了。可能是因为我知名度不高吧。😂
此外,文本中还有很多转写错误和标点问题,比如不恰当的问号等等。这些错误显然都需要纠正。
Keep reading with a 7-day free trial
Subscribe to Shuyi’s Newsletter to keep reading this post and get 7 days of free access to the full post archives.