Skip to content

Latest commit

 

History

History
20 lines (15 loc) · 1.96 KB

2312.1075.md

File metadata and controls

20 lines (15 loc) · 1.96 KB

背景

  • 背景
    文章介绍了神经机器翻译(NMT)和由ChatGPT代表的大型语言模型(LLMs)的日益普及,强调了深入理解这些最新翻译技术的独特特征和它们之间的关系的必要性。

  • 已有的工作 有研究表明ChatGPT可以在自动化评估和人工评价方面与如Google Translate和DeepL这样的高级NMT引擎相匹敌甚至超越,它能产生自然流畅、类似人类的翻译。但当前的研究尚未深入探讨能够区分ChatGPT产生的翻译与NMT和人类翻译(HT)的语言学和文体特征,以及它们之间的相似性程度。

核心贡献

  • 提出了一个多特征的方法
    • 挑战1:区分ChatGPT、NMT和HT产生的翻译 使用统计测试、机器学习算法和多维分析(MDA)来分析翻译文本中的广泛语言特征。监督分类器在区分这三种翻译类型方面表现出高精度,而非监督聚类技术未能产生满意的结果。

    • 挑战2:发现ChatGPT产生的翻译与NMT的相似性大于与HT 结合多维度分析(MDA)维度中的最终发现,通过计算距离和可视化表明,在多数MDA维度上,ChatGPT产生的翻译与NMT的相似性大于与HT。

实现与部署

研究构建了一个自定语料库,包括对重要国内外事务发言人评论的英语翻译。选择了这一语域是因为它独特地结合了即兴性和正式性,研究采用多特征方法同时在词汇、句法和文本层面上检验相关特征。此外,对于第三个研究问题,研究利用距离计算和降维可视化技术来揭示三种翻译类型在语言特征上的相似性。

总结

本研究为ChatGPT作为NMT之外的另一种翻译工具的可能性提供了初步答案,并展示了ChatGPT与NMT和HT相比的独特特性。这些新认识有助于未来更人性化、更符合语境的翻译系统的开发,并为如何有效使用AI生成的翻译提供洞见。