4.效果评测
为了检验本次更新的效果,我们也使用公开的联合国领域内数据(United Nations Parallel Corpus v1.0)以及UM-Corpus做了评测。其中公开的United Nations Parallel Corpus v1.0为1990年到2014年的数据,我们选择了所有的外语到中文的双语数据(英中、法中、西班牙中、阿拉伯语中、俄语中文),另外补充了2015-2016年的联合国双语数据每个语言对大约30万句以及UM-Corpus的210万句英中双语数据。测试集合选择United Nations Parallel Corpus v1.0中的公开测试集合开发集。图6给出了以BELU值作为评测指标的对比图。