中国建成4000万词级蒙古语自然口语语料库--时政--人民网
人民网>>时政>>滚动新闻

中国建成4000万词级蒙古语自然口语语料库

2013年02月20日11:18    来源:新华网    手机看新闻

  原标题:中国建成4000万词级蒙古语自然口语语料库

  新华网呼和浩特2月20日电(记者阿斯钢)记者从内蒙古社会科学院获悉,历经7年的搜集录制和标注加工,中国已在内蒙古自治区呼和浩特市建成一个4000万词级的蒙古语自然口语语料库。

  据内蒙古社会科学院蒙古语言文字研究所所长达·巴特尔介绍,这一时长达3826小时的蒙古语自然口语语料库由档案文件、检索界面和资源系统组成。资源库可检索、可视听、可复制。

  据悉,内蒙古自治区从2006年起投巨资实施该工程。这项工程是以搜集自然口语语料、收集书面语朗读语料、汇集现代文献语料和历史文献语料为对象,以收集、保护、保存、研究、利用蒙古语、达斡尔语、鄂温克语、鄂伦春语语言材料为目的的民族文化建设项目。

  长达·巴特尔表示,建成后的“蒙古语语料库建设工程”将为抢救濒危民族语言、保护弱势语言、保存并开发利用蒙古语等少数民族语言资源提供坚实基础,并为蒙古语等少数民族语言(文字)的规范化、信息化提供一个理想的信息资源。

(来源:新华网)

分享到:


24小时排行 | 新闻频道留言热帖