人工智能翻译下的大数据语料库建设

论文摘要

机器翻译的质量依赖可供其学习的语料,随着人工智能的发展,语料库数据的建设成为实现翻译智能化和场景化的关键。人工智能翻译下大数据语料来源众多,互联网、企业数据库,用户生成内容和机器生成内容都将成为语料数据的来源;其类型也呈现出多样性特征,从传统的术语、文本、拓展到非结构化数据和知识图谱。鉴于此,人工智能翻译下的大数据语料库建设可以从基于第三方开源数据、众包翻译的共享模式、基于机器闭环学习模式和人机协同模式四个方面进行,未来的翻译教学也可依托语料库的建设成为翻译智能化中的重要一环。

论文目录

1 概述

2 AI下的翻译要素

3 大数据下语料数据的特点

3.1 大数据下的语料数据来源

3.2 大数据下的语料数据类型

4 大数据语料库的构建模式

4.1 基于第三方的开源数据

4.2 众包翻译的语料数据共享模式

4.3 基于机器的自我闭环学习模式

4.4 基于人机合作的协同模式

5 对翻译教学的思考

文章来源

类型: 期刊论文

作者: 陆艳

关键词: 人工智能,翻译语料库,翻译教学

来源: 甘肃科技 2019年17期

年度: 2019

分类: 基础科学,哲学与人文科学

专业: 中国语言文字

单位: 上海立信会计金融学院外国语学院

基金: 教育部人文社科项目(14YJC740062)

分类号: H085

页码: 80-84

总页数: 5

文件大小: 447K

下载量: 343

人工智能翻译下的大数据语料库建设

论文摘要

论文目录

文章来源

相关论文文献