Shuyi’s Newsletter

Share this post

User's avatar
Shuyi’s Newsletter
如何用 AI 帮你对论文进行事实核查?

如何用 AI 帮你对论文进行事实核查?

今天我们来聊每个研究生都会遇到的难题:如何有效自查文稿,提升论文质量。

Wang Shuyi's avatar
Wang Shuyi
Jul 17, 2025
∙ Paid
1

Share this post

User's avatar
Shuyi’s Newsletter
如何用 AI 帮你对论文进行事实核查?
Share

无论是准备投稿的期刊、会议论文,还是即将提交的本硕博毕业论文,完成初稿都绝不意味着大功告成。你需要对初稿进行细致检查。这其中许多环节,AI 都能成为我们不可或缺的「学术僚机」。

注意这个方法并不仅仅适用于论文这一文体,也并不止适用于研究生群体。你大可以举一反三,把它用到自己的工作中。

痛点

你或许有过这样的经历:辛苦写完一篇论文,自己实在不想再多看一个字,便直接发给了导师。结果,换来的是一顿严厉的批评,「这儿不对,那儿也不对」。

你硬着头皮,按照导师的意见修改后再次提交,结果可能招致更严厉的批评,甚至在导师心中被贴上「不靠谱」的标签。

我在《学术写作五部法》中曾深入分析过这背后的机理。简单来说,导师认为许多基础性问题本应由你自己解决,而你却试图将这个担子甩给他,这便是导师不满的根本原因。

那么,自己检查,问题就解决了吗?许多同学从头到尾通读文章,却总觉得「怎么看怎么顺眼」,难以发现疏漏。

如果不能主动找出这些潜在错误,轻则挨批,重则可能引发严重的学术后果。别忘了「文责自负」这个通行原则 —— 一旦论文正式提交,任何基础性的技术错误都可能带来无法预料的麻烦。

旧法

为了跳出固有的阅读视角,我曾从朋友那里学到一招:从后往前,逐段阅读。

注意,不是一句话挨个字儿倒着读,而是从文章的最后一段开始,逐段向前回溯。这个方法的原理其实很简单,它打破了你惯常的思维顺序,将熟悉的内容陌生化。

当你从一个新的角度审视时,会更容易发现段落间的逻辑是否连贯,论证是否充分,从而更专注地找出问题。我将此法教给学生,效果一直不错。

不过这种方法虽然有效,效率却不算高。而且它能查找出来的也只是一部分问题。今天咱们打算处理的,是对文稿进行全面事实核查 —— 包括数据、事例和参考文献真实性、准确性的检查。

这事儿吧,从后往前读,也不管用。

破局

好消息是,AI 来了。你应该早已经了解,AI 可以有效帮助咱们提升效率。

那具体来说,它能不能帮咱们对论文文稿进行技术性检查呢?它提供的意见是否足够准确?

要回答这个问题,我们需要打破一个认知误区:AI 不再仅仅是工具。在特定情境下,有的 AI 已经能胜任出色的实习生,精准领会并执行你布置的任务;有的 AI 能成为你的合作者,产出与你能力相当的成果;更有甚者,当你对某个领域不甚了解时,阅读过海量文献的 AI 甚至可能成为你的导师。所谓「学高为师」嘛。毕竟,我们中不少人一生的文本阅读量,都难以企及 AI 训练时一天处理的信息量。

利器

更令人振奋的是,我们现在可以使用 AI Agent。它不再是单纯的大语言模型,而是一个更强大的系统。

根据 Agno 官网的介绍,一个 AI Agent 通常包含四个核心部分:

  • 模型 (Model):例如我们熟知的 GPT-4o, DeepSeek 等。

  • 记忆体 (Memory):能够记住我们过往的对话和个性化要求。

  • 知识库 (Knowledge):可以导入我们自己的文档,让 AI 基于特定背景知识进行工作。

  • 工具 (Tools):能够调用外部工具来拓展能力。 工具的调用能力,随着 Anthropic 推出 MCP (Model Context Protocol) 技术后,变得愈发强大。下图截取自 mcp.so 网站,仅仅是特色工具(Featured MCP Servers)就已琳琅满目。

而这其中,有好几个工具,都是可以用来搜索的(下图标红)。

这意味着,即便 AI 模型的训练数据不包含最新的论文,它也可以通过调用工具访问论文数据库,实时补充知识,弥补过时训练数据的短板。而且,它还可以对这些获取的内容加以思考分析,这正是 AI 能够胜任论文自检事实核查任务的基础。

沟通

与 AI 的沟通效果,直接决定了我们能收获怎样的结果。有人认为模型越聪明,提示词 (Prompt) 越不重要,我的感受并非如此。AI 不是你肚子里的蛔虫,无法完全洞悉你的意图。有效的沟通,能让结果产生质的飞跃。

这里有一个关键技巧:在提示词中为 AI 设定「问题空间的约束」,通俗讲就是告诉 AI 不要做什么。这一点对于当下的主流模型至关重要,效果显著。其原因,我已经在《从平庸到惊艳:让AI输出质量飙升的提示词构造方法》这篇文章里给你详细讲过,此处不赘述。

核查

事实核查,旨在帮助我们检视文稿中的数字是否准确、案例是否真实、参考文献引用是否扎实。

这个环节的疏忽,教训是惨痛的。有一个名为「撤稿观察」(Retraction Watch) 的网站,它提供了一个公开的撤稿数据库。

我下载分析后发现,其中专门有一列记录了「撤稿原因」。

我让 AI 分析了因「AI 生成内容」(官方分类为 Computer-Aided Content or Computer-Generated Content) 而被撤稿的数据。结果如下图所示,从 2023 年起,这类撤稿数量急剧攀升。2024 年,情况大幅缓解。但到了 2025 年上半年,仅仅 4 月份一个月,撤稿数量就超过了 600 篇。

我不禁在思考一个问题 —— 这些论文使用 AI 生成,是如何被发现的?

许多人可能认为 AI 检测工具能够识别,但这类工具的误报率其实相当高,编辑和专家并不会完全采信,仅会作为参考。更常见的情况是,论文中由 AI 编造的内容明显错误,从而被专业人士一眼识破。因此,如果你提交的论文混入了这类低级错误,后果将非常严重。

因此,我们需要借助 AI 进行高效的事实核查,确保论文的根基牢固。

下面是我设计的一个事实核查提示词:

Keep reading with a 7-day free trial

Subscribe to Shuyi’s Newsletter to keep reading this post and get 7 days of free access to the full post archives.

Already a paid subscriber? Sign in
© 2025 Wang Shuyi
Privacy ∙ Terms ∙ Collection notice
Start writingGet the app
Substack is the home for great culture

Share