翻译文档时,使用术语表,让译文更专业

SimplifyAI
2024-01-14

虽然大模型的翻译在大部分情况下可以打 80 分,虽然它知道很多很多的概念和名词,但它无法准确翻译某些特定的人名、品牌名,也可能不知道某些小众的专业词汇和新词。

比如下面这个例子中,zero-shot 被遗憾地翻译成了“零射击“:

Sample Image in Article

这个有点翻车,因为在机器学习领域,zero-shot 更应该被翻译成“零样本。在正文中的有些地方,它的确被正确地翻译成“零样本”。

遇到这样的问题,我们也许可以尝试使用更好的大模型,比如当前 GPT-4。但也可以通过术语表来解决。

注:新版本的 SimplifyAI 已经通过 Prompt 的优化把这个问题解决了。现在再上传同样的文件,会得到正确的“零样本”。但我们仍然以它为例。

术语表的使用方法

使用起来很简单。

首先进入术语页面,创建一个术语表。如果你一个术语表都没有,系统会自动帮你创建一个。

Sample Image in Article

添加术语。每一条术语就是一个原文-译文对。在添加术语时,要分别输入原文和译文。如果原文是英文这样的使用 26 个拉丁字母组成的语言,大小写是不区分的。

Sample Image in Article

或者上传 xlsx 文件批量导入术语。术语应该在文件第一个工作表中,每行一条术语,第一行是标题行,标题应分别为“原文”和“译文”,如果有重复术语,将以后面的为准。

Sample Image in Article

翻译时,选择术语表

Sample Image in Article

使用术语表来翻译,我们就可以得到我们想要的结果

Sample Image in Article

每个术语应该只有一个对应译文

在翻译的时候,你的术语会被当做翻译示例传给大模型,告诉它这些术语应该这样翻译。

如果有些词有多种翻译,它就不应该用作术语。比如“维护”对应的英文可以是 maintain 也可以是 maintenance,此时就不应该限定它的翻译,而是让大模型自己来决定。

不能把网上找到的一些行业词汇对照翻译,直接导进去。因为在那些词汇里,很多词都可能有多种翻译。

比如在这篇介绍音乐词汇英汉对照的文章里,notation 是对应翻译为“记谱法”。而当我用这些英汉对照作为术语表翻译某个音乐软件介绍时,就产生了不好的结果。

原文是这样:

Sibelius not only lets you create and print beautiful scores, you can import or record MIDI
which is directly transcribed into notation.

不使用术语表的 GPT 翻译是这样

Sibelius不仅可以让你创建和打印精美的乐谱,还可以导入或录制MIDI,直接转录为符号。

更好一点的翻译可能是这样(把 notation 理解为 notes):

Sibelius不仅可以让你创建和打印精美的乐谱,还可以导入或录制MIDI,直接把它们转录为音符。

但当我加入了基于音乐词汇英汉对照文章做的术语表,反而导致翻译结果没那么好:

Sample Image in Article

所以要注意,在使用术语表时,只有当某个词汇在那个领域只有一种翻译时,才能被用作术语。

文档翻译
术语表
PDF翻译
|
|
知乎机构号
© 深圳市群蜂信息技术有限公司 2020-2023
粤ICP备2021006232号