如何评价最近爆火的ChatGPT，在翻译领域表现如何？

新闻 1970-01-01

438 0

谢邀！最近在做新的GPT模型，正好回答一下目前翻译领域的应用。

什么是ChatGPT？

推出上线仅5天，注册用户数超100万，上线两个月后，用户数破亿。瑞银集团报告指出，ChatGPT是史上用户增长速度最快的消费级应用程序，它像一颗“核弹”引爆人工智能圈以至整个科技界。ChatGPT是由美国人工智能实验室OpenAI开发的一个对话AI模型，于2022年11月正式推出，因其出色的文本生成和对话交互能力在世界范围内迅速走红，迅速蔓延到其他领域。ChatGPT可谓一日看尽长安花。 ChatGPT的爆火出圈，引发资本市场的强烈关注，在热门题材股关注度从不掉队的A股市场及时抓住热点。爆火的ChatGPT使得与其有相关度的科技公司股价坐上火箭，一大波概念股顺势起飞，连续多日霸占涨幅榜前列。

近5亿条回答，实时积累海量用户点赞互动投票数据，在问答赛道长期占据不可替代地位...凭借AIGC大模型开发的天然优势，以知乎为代表的内容价值型社区近乎直面ChatGPT发展的赛道。2月8日，知乎美股与港股股价一同迎来暴涨，涨幅均超30%，盘中一度扩大至50%。

与ChatGPT直接关联的人工智能领域亦然。2月初，AIGC概念股开盘走强，多年坚实技术积累、核心技术位居世界前沿。作为A股市场人工智能的龙头企业，2023年以来科大讯飞的股票涨幅已经超50%，今天市值已超千亿，在一大群前仆后继的中国AI公司中稳居前列。

为什么最近ChatGPT火了？

会聊天的机器人有什么值得这么出圈的地方？ChatGPT不是第一个，也不会是最后一个。别说其他前沿AI，siri都行，为什么爆火的，偏偏是ChatGPT？值得关注的是，ChatGPT的惊艳之处在于不局限于聊天功能，而是迭代变成了一个具备一定创造力的生产力工具：通过大量语料内容训练，在对搜集素材进行消化、整理后，它可以处理非常复杂的语言工作，并进行尽可能符合人类心理预期的输出。写论文、诗歌、简历、视频脚本甚至写程序都没有问题。

ChatGPT非常简单，使用者只需提问即可，只要拥有注册账号，谁都可以先玩一玩，几乎没有使用门槛。说白了，传统的大模型都只是企业的专属工具，只为能赚钱的业务提供价值，开放给用户的能力、接口和产品体验远远不如chatGPT。并且chatGPT更加接地气，让每个人都可以用得上，不同场景下的泛化能力更强。所以我更愿意把它叫观念革命，而不是技术革命。

ChatGPT主要核心技术+历代模型

ChatGPT的重大革新在于它的训练方法，使用的是transformer模型，并通过预训练在大规模语料库上，再通过人类反馈学习和微调实现专门任务，这是一种新的训练方法。因此，ChatGPT可能启发或颠覆一些传统思路。

·核心技术1:Transformer

ChatGPT使用的核心技术之一是Transformer，这其实从其全称上也能看得出来，Chat Generative Pre-trained Transformer。Transformer是Google于2017年提出的一种采用注意力机制的深度学习模型，是近几年人工智能技术亮点之一，可以按输入数据各部分重要性的不同，而分配不同的权重。 Transformer作为近几年最为常用的神经网络模型，精度和性能上都要优于之前流行的CNN（卷积神经网络）、RNN（循环神经网络）等模型。

这大幅提升了模型训练的效果，让人工智能得以在更大模型、更多数据、更强算力的基础上进一步增强能力。此外，Transformer还具有很强的跨模态能力，不仅在NLP（自然语言理解）领域表现优异，在语音、图像方面也显示出了优异的性能。

·核心技术2:RLHF

此外，OpenAI使用 RLHF（Reinforcement Learning from Human Feedbac，人类反馈强化学习）技术对 ChatGPT 进行了训练，且加入了更多人工监督进行「微调」（fine tuning)。ChatGPT可以主动承认自身错误并道歉，会质疑不正确的问题，会承认自身的无知和对专业技术的不了解。

GPT历代模型示意图

国内外人工智能领域的研究，一直努力不断探索新的技术路线，大模型是目前重点研究投入的方向。Open AI、谷歌、微软，国内的百度、阿里、腾讯、华为等也纷纷推出大模型。其中，特别是今天OpenAI 的GPT-3.5架构的ChatGPT，就是典型的AIGC大模型。一经推出反响剧烈，具有了更高的语言理解能力和更广泛的知识领域，ChatGPT有望为AIGC打开一个新的大体量的市场规模，也让人更加期待GPT-4的到来。

ChatGPT在翻译领域表现如何？

最近在做大型预训练语言模型和垂直领域精调模型的对比研究，ChatGPT是典型的大型预训练语言模型，属于什么领域都能说上几句的百晓生，既然题主提到翻译领域，我们可以进行类似的对比研究，正好我手里有台之前在国外时交流一直使用的科大讯飞翻译机。

如果说ChatGPT 是典型的大型预训练语言模型，那像科大讯飞双屏翻译机这样的翻译机，就是典型的翻译领域的垂直领域精调模型。与同期AI设备相比，ChatGPT作为最前沿的大型预训练语言模型，翻译效果和速度会更加突出。但若要与垂直领域的专业翻译设备比较，缺陷可能还是比较明显，接下来就将这两个详细进行一个对比。

首先是IP问题，众所周知ChatGPT并未对全球所有国家开放，由于有些国家对于人工智能技术的使用有限制，或由于在这些国家法律规定下OpenAI不能合法提供服务，因此目前ChatGPT无法在这些国家/地区提供登陆服务，比如在我国国内就不能使用，还有泰国，这应该是我们国家的人旅行比较喜欢的国家了，也不在开放使用之列。如果该地区被限制使用，那ChatGPT的翻译效果直接是0，这时候直接选用翻译机才是明智之举。

其次是应用场景，目前ChatGPT只支持打字对话获取翻译效果，这对下沉群体是一个比较大的bug，而像我在国外用的这款科大讯飞双屏翻译机，使用场景会更广泛，语音翻译、拍照翻译、录音翻译、同声字幕、演讲翻译等等都可以用，更细化的功能可以覆盖更广泛的使用场景。讯飞这款翻译机的主客双屏设计也是我比较欣赏的点，视听同步让信息的传递更直观，直接提高了和外国朋友的沟通效率。

在翻译的专业度方面，科大讯飞的翻译机显然会比ChatGPT的翻译更专业，我同时用两款程序跑出了一些例句，ChatGPT的翻译图和两个翻译结果的对比截图都在下面，大家可以看看。

例1例2

从图上可以看出，就专业性而言，ChatGPT更加口语化，而科大讯飞的翻译效果可以媲美专八、专业领域的行业翻译，主打的同传级翻译应用在演讲翻译、同声字幕、录音翻译这三个功能中，以及其他诸如会话翻译等功能。

为了测试讯飞的专业性，我拿它进行了六级翻译选段测试。

会话翻译方面我也做了一个小测试，将翻译机和电脑都接入同一个网络，电脑开始播放英文电影，然后点击翻译机的“会话翻译”功能，再看看讯飞和中文字幕的区别，对比下来讯飞的翻译效果更专业，除了略有延迟外，整体翻译结果的表述方式也更符合人物当下的语境。

另外的语种方面，科大讯飞支持83种语言在线翻译、16种语言离线翻译、32种语言拍照翻译，具体语言的选择，大家使用时自己手动调节即可。其中支持离线翻译使用这个优点，真的对只能联网工作的ChatGPT做到了吊打。 ChatGPT的「频繁宕机」，也是劝退很多人的一个缺点，火爆的ChatGPT多次因为访问量激增而宕机，国外用户经常收到“当前需求异常高，我们正调节系统，请稍等”的提示。

大家可能比较会关心ChatGPT的收费方面。2月2日，OpenAI公司宣布ChatGPT的免费访问权限虽然仍将存在，但会推出付费试点订阅计划ChatGPT Plus，定价每月20美元。

付费版功能包括高峰时段免排队、快速响应以及优先获得新功能和改进等。资本投入训练的终极是利用人工智能变现，ChatGPT研发斥资巨大，后期商业化是必然的。如果只是为了更高效便捷的翻译，个人观点，与其阶段性付费给到平台，不如直接get最前沿技术的翻译机一劳永逸。

最后，我想用较宏观的概念解释我们比照得出的结论。如果说ChatGPT 是大型预训练语言模型（以下简称大模型），那么像科大讯飞双屏翻译机这样的翻译机就是垂直领域的精调模型。从ChatGPT的发布效果来看，大模型训练的AI表现出了不错的效果，但是，垂直领域可能仍然需要精调模型，因为特定领域的数据和任务往往需要专门的模型。大模型通过预先在大量数据上进行训练，具有高效的语言理解能力和广泛的知识领域。

适用于快速生成文本、回答问题等任务，也可以作为其他模型的预训练部分。而精调模型仍然具有其重要作用。它们通过在专业领域的少量数据上进行训练，可以更准确地捕捉特定领域的语言特征。精调模型更适用于应用于特定领域的任务，如语音识别、机器翻译等。评价人工智能的表现，需要看在具体任务上的完成效果如何，两者可能在未来都有各自的优势和适用场景。

ChatGPT，它更多是在大部分通用场景有了乍一眼很惊艳的表现，尤其是自然语言理解、信息抽取和生成方面，但在精准翻译这种相对专业的垂直领域，使用像科大讯飞翻译机这样的精调模型，用户体验效果会更好，并且后期增量训练也更方便和有效。

ChatGPT教育