问题
知识星球上,有读者问我如何对长文进行高质量翻译。
一开始,我以为这只是另一回重复提出的问题 —— 应该回去翻前面的读者提问和我的解答。因为我一直推荐的沉浸式翻译(Immersive Translate),可以非常高效地帮助用户翻译长文档。
不管是 PDF、EPUB、字幕、纯文本、Docx,还是其他网页格式,都有专门的选项来满足不同需求。
但是旋即我明白了,这位星友的意思并非如此简单。他希望的不是一个从英文到中文的基础翻译。很多时候,翻译质量的糟糕会严重影响对原始文档的理解,特别是技术类文档。
不知你是否读到过「不知所云」的翻译著作。原著在亚马逊上可以给五星好评;至于这个翻译版…… 冲着原作者的面子,给个两星已经算是慷慨。
对于翻译质量要求较高的长文档,尤其是技术文档或者论文,简单地使用一款浏览器插件加上一个大语言模型 —— 比如我之前推荐的 Qwen2(便宜)或者默认使用的 ChatGPT、GPT4(更贵)—— 逐段翻译,真的能达到令人满意的效果吗?
咱们用一个例子来看看。
例子
我们选择了情报学的开山之作 “As We May Think” 来展示翻译效果。这篇文章由 Vannevar Bush 于 1945 年发表,预见了许多现代信息技术的概念。
我的导师王知津教授曾带领团队翻译过这篇重要文献,收录在《新媒介与创新思维》一书中。
在这一部翻译文集中,第一篇就是《如我们所想》(As We May Think 彼时的中文译名)。
打开第一节后,这是英文原文的样子。
下面是使用 Immersive Translate 插件翻译后的效果。你可以看到,一键启用,翻译结果直接嵌入到原文中,让阅读体验非常流畅。
只不过,你可能一眼就看出了问题 —— 这是其中第三段落的翻译:
研究的积累越来越多。但有越来越多的证据表明,随着专业化的扩展,我们今天陷入了困境。研究者被数千名其他工作者的发现和结论所困扰 - 他没有时间去理解,更不用说记住,这些不断出现的结论。然而,专业化对于进步变得越来越必要,而跨学科的桥梁建设相应地变得肤浅。 翻译后的文本:研究的积累越来越多。但有越来越多的证据表明,随着专业化的扩展,我们今天陷入了困境。研究者被数千名其他工作者的发现和结论所困扰 - 他没有时间去理解,更不用说记住,这些不断出现的结论。然而,专业化对于进步变得越来越必要,而跨学科的桥梁建设相应地变得肤浅。 (Translation: 有一座越来越多的研究积累。但有越来越多的证据表明,随着专业化的扩展,我们今天陷入了困境。研究者被数千名其他工作者的发现和结论所困扰 - 他没有时间去理解,更不用说记住,这些不断出现的结论。然而,专业化对于进步变得越来越必要,而跨学科的桥梁建设相应地变得肤浅。) 注:由于原文中有些表达方式在中文中并不常见,因此在翻译时做了一些调整,以使中文表达更加自然流畅。
一段文字,它居然重复翻译了三遍。这样的翻译质量显然不符合读者的要求。所以,咱们需要调整策略来改进。
效果
下面我们就来看看,使用本文提供的方法,翻译出来的效果。
这篇原文,显示起来为什么这么怪呢?因为在原文里,保留了很多「硬回车」。所以很多行都被拦腰截断了。
但是这根本难不倒咱们,因为经过咱们的工作流,这些问题都被自动轻松化解。
这是翻译出来的结果,我放在了一个 Notion 页面,供你查看。
你读一下,是不是感觉翻译效果好了不少?
我翻译之后,从头到尾读了一边,深深为 Bush 先生的前瞻性而折服。只不过,我也在慨叹,我们每个人都无法摆脱时代的局限性。在 Bush 先生的很多想象中,都保留着机械装置和电子管的基因,他或许根本无从想到,未来不久,大规模集成电路的出现就会深刻影响数字化产品的形态。
咱们的工作流对于图文并茂的内容,也可以轻松翻译。例如说,这是 Attention is All You Need 一文的翻译效果:
你看图片、链接、数学公式、章节标题…… 一应俱全。
我把翻译的结果发到了知识星球上,这是星友给的反馈:
闲言少叙,下面咱们先说说用法,让你也能立刻用上。
用法
Keep reading with a 7-day free trial
Subscribe to Shuyi’s Newsletter to keep reading this post and get 7 days of free access to the full post archives.