格鲁修学社区

 找回密码
 注册社区
搜索
热搜: 活动 交友 discuz
查看: 1622|回复: 0

藏汉自动翻译系统及实验室简介

[复制链接]
发表于 2011-4-4 11:52 | 显示全部楼层 |阅读模式
藏汉机译实验室简介

一、工作基础
青海师范大学藏文智能信息处理省级实验室是依托国家高技术“863”计划项目建立起来的。1994年筹建,2001年经青海省教育厅评估验收,正式命名为“省级重点实验室”。 本实验室自上世纪90年代从事藏文信息处理工作以来,先后完成了6000万字的包括藏族五明文化典籍、大学藏文《力学》、《热学》、《电磁学》、《光学》、在《原子物理学》、《无机化学》、《有机化学》、《植物学》和《动物学》等内容的语料库建设工作,建立了18万词条的标有详细语法信息的汉藏英三语词典(2003年9月,青海省科技厅组织北京、内蒙和青海的专家对本项目进行了鉴定。鉴定认为“《班智达藏汉英电子词典》的研发,填补了藏汉英三语词典的国内空白,处于国际领先水平,该项成果对于促进汉藏英文化交流,加速藏区科技教育事业的发展以及文字的信息化建设具有重要意义。”的结论。);承担完成了国家“863”计划项目“汉藏科技机器辅助翻译系统”( 1998年通过国家智能计算机系统专家组的鉴定,鉴定认为填补了该领域的国内空白,技术上处于国际先进水平,并于2001年获青海省科技进步二等奖;)以及“实用化汉藏机器翻译系统”( 2001年通过国家智能计算机系统专家组的验收,专家组综合评议为“B+”,并建议“加快产业化速度”);同时完成了省级项目“藏文字处理系统”(2003年9月,青海省科技厅组织北京、内蒙和青海的专家对本项目进行了鉴定。鉴定认为填补了藏文词组输入的国内空白,处于国际先进水平,对于促进藏文化交流,加速藏区的发展以及藏语言文字的信息化建设具有重要意义)、国家教育部高等学校骨干教师资助计划项目“藏语语法信息词典框架设计与实现”和国家自然科学基金项目“基于格助词和接续特征的藏文自动分词系统”(已达到实用化水平)等多项省部级项目,取得了一系列重要成果,在藏文信息处理基础理论研究和应用系统开发方面建立了一支具有较高水平的研发队伍,积累了许多有价值的技术成果。实验室研究人员针对现代信息处理技术的需求,同时在藏语词法、句法分析系统开发,藏文分词规范、藏汉、藏英译名规范、藏文名词术语规范,汉藏并行语料库建设、藏族教育资源库建设等方面开展了卓有成效的研究,在国内具有一定的影响。
二、工作条件
青海师范大学藏文智能信息处理与机器翻译省级重点实验室是目前国内唯一的一所研究藏文信息处理的省级重点实验室,青海师范大学又是整个藏区三家藏族教育培训基地之一,有先进的科研设施和严格的管理制度。实验室有能力为开展藏文信息处理相关课题研究提供必要的硬件设施和图书资料。实验室是集科研和教学为一体的省级重点实验室,青海省先后所完成的两项国家 “863”计划项目均由本实验室承担。

科研队伍
实验室实行专兼职相结合,固定人员和流动人员兼有的管理体制。几年来,通过科研促进了教学,通过教学又带动了科研,并培养了一批教学与科研相结合的年青的少数民族科研队伍。实验室现有人员17名,其中教授2名(享受国务院特殊津贴的专家1人,博士1名),副教授5名(硕士3人),讲师4名(硕士2人),助教4名(硕士2人),形成了老中青结合,知识结构互补的学术梯队,是国内藏文信息处理方面一个重要的研究基地。

2、教学成果
(1)教材建设方面:
已经完成了大学藏文《力学》、《热学》、《电磁学》、《光学》、在《原子物理学》、《无机化学》、《有机化学》、《植物学》和《动物学》教材的编译工作,部分教材已经在教学中使用,效果良好。由实验室人员主编的《汉藏英对照物理学词汇》、《汉藏应对照化学词汇》、《汉藏应对照生物学词汇》已由青海民族出版社出版 94年12月。96年获第六届西南、西北地区优秀科技图书二等奖。由全体实验室人员编译的提交全国藏文教材审查委员会审定通过的《汉藏英对照自然科学名词术语丛书——物理学词典》、《汉藏英对照自然科学名词术语丛书——数学词典》和《汉藏英对照自然科学名词术语丛书——化学词典》已经出版发行;主要由全体实验室人员编译的《汉藏英对照自然科学名词术语丛书——计算机词典》和《汉藏英对照自然科学名词术语丛书——生物学词典》已提交五省区藏文教材审查委员会审定计划在近期内出版。

(2)教学方面:
为了使少数民族学生掌握现代信息处理的方法,我们为少数民族理科本、专科共计20多个班级开设计算机实验课;为配合科技翻译理论及实践课程,利用业余时间(包括周六和周日)免费为全校部分优秀学生(包括民族学生)开设了计算机普及教程,每周上机人数达140人次。

3、主要科研成果
一个汉藏英文兼容的操作系统——班智达系统
一个科技汉藏翻译系统——班智达汉藏科技翻译系统
一个公文汉藏翻译系统——班智达汉藏公文翻译系统
一部汉藏英三语对照的电子词典——班智达电子词典
一个6000万字的藏文生语语料库(已完成三次校对)(可作为建立一个面向五省区服务的国家级藏族教育资源库的基础)
一个具备实用化的藏文分词系统
4、加强科研协作
实验室先后和清华大学计算机系、北京大学计算机系、中国科学院计算所、青海民族学院、青海民族出版社、青海民族教材编译处、五省区藏族教育协作办公室、青海省政府翻译处等建立了广泛的科研协作关系,创造了一个多元文化交融的良好园地,开阔了视野,提高了科研队伍的素质,促进了人才培养。
课题与获奖情况
近几年来本实验室课题承担与参加的课题:
1、《汉藏科技机器翻译系统》国家863计划,通过鉴定,并由科技部公布在《科学技术研究成果公报》2000年第四期上, 正在进行产品转化中。
2. 《实用化汉藏机器翻译系统》,国家863计划, 包括科技、公文两大系统。正在进行产品转化中。
3. 《汉藏英词汇互译系统》正在进行产品转化中。
4. 《基于格助词和接续特征的藏文自动分词系统》,该项目来源于国家自然科学基金, 已达到实用化水平。
6. 《藏语语法信息词典框架设计与实现》 国家教育部,高等学校骨干教师资助计划,1999-2003,已完成。
7.《藏文视窗平台研究》省级课题项目,已鉴定, 1998-2002。
8.《藏药信息系统藏药信息系统》已通过鉴定, 1998-2001。
9.《科技藏文翻译标准和方法研究》省级课题,通过鉴定,1990-1994。
10. 《理科藏文教材翻译研究与教学实践》校级 已鉴定。
11.《科技藏文翻译研究与教学实践》校级   已鉴定。
12、《班智达藏汉英电子词典》自主开发 2003年9月29日通过鉴定。
13、《班智达藏汉英字处理系统》青海省自然科学基金项目 2003年9月29日通过鉴定。
17、《班智达藏汉英字处理系统产品化研究》青海省民委在研项目。
近几年来本实验室获奖情况:
97’年《理科藏文教材翻译研究与教学实践》(李延福、陈玉忠等)获省级教学成果二等奖。
98’年《藏族地区科技政策与科技管理研究》(李延福等)获省级科技进步三等奖。
97’年《科技藏文翻译研究与教学实践》(李延福、陈玉忠等)获校级教学成果一等奖。
《加强科技藏文翻译研究对策初探》(德盖才让、李延福)一文在第二次全国民族语文翻译优秀论文评选中获三等奖。
1995年陈玉忠老师被评为“青海省优秀教师”。
1996年陈玉忠荣获1995——1996年度青海省高校优秀教师小岛奖励金。
1997年才让加荣获1996——1997年度青海省高校优秀教师小岛奖励金
由陈玉忠、才让加等编译的《汉藏英对照物理学词汇》、《汉藏应对照化学词汇》、《汉藏应对照生物学词汇》(由青海民族出版社出版 94年12月)。96年获第六届西南、西北地区优秀科技图书二等奖。
1997年陈玉忠老师获首届青海青年科技创业奖。
1998年陈玉忠老师获全国民族团结进步模范个人称号。
2000年陈玉忠老师被授予青海师范大学“优秀骨干教师”称号。
2001年李延福、陈玉忠、公保才让、才让加等完成的《汉藏科技机器翻译系统》,获省级科技进步二等奖。

近几年来本实验室人员发表的论文和论著有:
陈玉忠:《理科藏文教材建设之我见》, 《青海师范大学学报》(自然科学版),1995
陈玉忠(德盖才郎)、李延福:《汉藏机译系统中以词组为主的藏语词语分类初探》,95智能计算机接口与应用进展,电子工业出版社,1995
陈玉忠(德盖才郎)、李延福:《汉藏科技机器翻译系统初探》,97智能计算机接口与应用进展,电子工业出版社,1997
陈玉忠:《对理科藏文教材建设的思考》,全国优秀教育学论文集(第二辑),1998
陈玉忠:《青海师范大学藏汉双语教学调查与研究》,当代中国少数民族双语教学理论与实践,陕西人民教育出版社,2001
陈玉忠、李保利、俞士汶等:《基于格助词和接续特征的藏文自动分词方案》,第一届学生计算语言学研讨会优秀论文(1st Students' Workshop on Computational Linguistics),中国北京 2002。(2003年《语言文字应用》第1期刊载 )
陈玉忠、俞士汶 :《藏文信息处理技术的研究现状与展望》,第二届中日自然语言处理专家(the Second China-Japan Natural Language Processing Joint Research Promotion Conference-CJNLP-2002)研讨会论文,中国北京 2002
李延福、陈玉忠 :《科技藏文的翻译理论与实践》,青海师范大学学报(自然科学版)、1993年第1期
李延福、陈玉忠: 《科技藏文翻译新方案》,第二届全国藏语文翻译学术会议、优秀论文奖,1994 西藏拉萨
李延福、陈玉忠:《科技新词术语翻译》 民族译坛 1995第2期
索南当周、韩维良、陈玉忠等:《实用化汉藏机器翻译系统中藏文格助词和动词时态的处理》,99‘智能计算机接口与应用进展,电子工业出版社
李保利、陈玉忠:《A Comparative Study on Automatic Categorization Methods for Chinese Search Engine》,第八届联合国际计算机会议论文(The 8th Joint International Computer Conference),中国浙江宁波,2002,
柏晓静、胡俊峰、暂红英、陈玉忠、俞士汶:《A Corpus-based Approach to Term Bank Construction》,第三届国际语言资源和评估会议论文,西班牙帕尔马,2002
陈玉忠(德盖才郎)、才让加等合作编译《汉藏英对照物理词汇》、《汉藏英对照化学词汇》、《汉藏英对照生物学词汇》,青海民族出版社,1996
陈玉忠(德盖才郎)、才让加等合作编译《汉藏英物理学词典》 四川民族出版社,2000
陈玉忠(德盖才郎)、才让加等合作编译《汉藏英数学词典》 四川民族出版社,2000
才让加、陈玉忠(德盖才郎)等合作编译《汉藏英化学词典》 四川民族出版社,2003
陈玉忠(德盖才郎)、才让加等合作编译《汉藏英计算机词典》 待出版
陈玉忠(德盖才郎)、才让加等合作编译《汉藏英生物学词典》待出版
才让加、李延福等《实用化汉藏机器翻译系统中汉藏短语的处理策略》,99`智能计算机接口与应用进展,99年7月
索南当周、韩维良等《实用化汉藏机器翻译系统中藏语格助词和动词时态的处理》 99`智能计算机接口与应用进展,99年7月
才让加 《汉藏机器翻译中科技汉语长定语处理策略》青海师范大学学报(自然科学版)2000年第1期
才让加《藏族教育教学资源库框架的设计与实现》 首届中国少数民族语言信息与资源库建设学术研讨会论文集,2004年4月 北京
才智杰 柔特《班智达藏汉英电子词典的设计与实现》首届中国少数民族语言信息与资源库建设学术研讨会论文集,2004年4月 北京
柔特 才智杰《班智达藏文词组输入法的设计与实现》首届中国少数民族语言信息与资源库建设学术研讨会论文集,2004年4月 北京
扎洛《班智达汉藏翻译系统中的短语规则探究》首届中国少数民族语言信息与资源库建设学术研讨会论文集,2004年4月 北京
索南当周 华却才让《班智达汉藏科技翻译系统中的几种句法分析策略探讨》首届中国少数民族语言信息与资源库建设学术研讨会论文集,2004年4月 北京
才藏太 李延福《班智达汉藏公文翻译系统中基于二分法的句法分析方法研究》首届中国少数民族语言信息与资源库建设学术研讨会论文集,2004年4月 北京
华却才让 索南当周《浅析藏文字符集编码标准化》首届中国少数民族语言信息与资源库建设学术研讨会论文集,2004年4月 北京
张国喜《英藏机器翻译研究》首届中国少数民族语言信息与资源库建设学术研讨会论文集,2004年4月 北京
才让加《藏族教育教学资源库体系结构的设计与实现》首届全国少数民族青年自然语言学处理学术研讨会论文集,2004年8月 呼和浩特
张国喜《汉藏机器翻译中人名翻译探究》首届全国少数民族青年自然语言处理学术研讨会论文集,2004年8月 呼和浩特
柔特《通用藏文键盘的设计方案》首届全国少数民族青年自然语言处理学术研讨会论文集,2004年8月 呼和浩特
索南当周 曹玉林《基于规则和语料相结合的英藏机器翻译的设计模型》首届全国少数民族青年自然语言处理学术研讨会论文集,2004年8月 呼和浩特
才藏太 李延福《网络班智达藏汉英电子词典的设计》首届全国少数民族青年自然语言处理学术研讨会论文集,2004年8月 呼和浩特
近几年来,参加过的学术会议有:
1998年6月25日——7月5日两人参加了在西北师大召开的“少数民族教育中的双语教学”研讨会。
1995年7月两人参加了在山东威海举行的“第二届中国计算机智能接口与智能应用学术会议”。
1997年7月两人参加了在湖南张家界举行的“第三届中国计算机智能接口与智能应用学术会议”。
1999年7月四人参加了在山西太原举行的“第四届中国计算机智能接口与智能应用学术会议”。
2001年两人参加了在上海举行的第一届中文信息处理发展国际研讨会。
2002年一人参加了在北京、计算机语言学专家研讨会。
2OO1年1人参加了兰州举行的妇女与少数少数民族教育国际学术会议。
2001年1人参加了北京举行的第二届汉语词汇语义学研讨会。
2001年1人参加了苏州举行的第一届UNL开放会议-“First UNL Open conference”。
2001年1人参加了北京举行的第七届国际分析技术会议-7th International Workshop on Parsing Technologies。
2002年1人参加了北京举行的第一届学生计算语言学会议。
2002年1人参加了北京举行的中日自然语言处理专家研讨会。
2004年4月4人参加了北京举行的首届中国少数民族语言信息与资源库建设学术研讨会
2004年8月5人参加了呼和浩特举行的首届全国青年少数民族自然语言处理学术研讨会
三、建设目标及发展规划

1、建设目标
实验室计划通过五至八年的努力,争取成为面向藏、青、川、甘、滇五省区的藏文信息处理和汉藏机器翻译方面的研究中心和人才培养基地,为五省区藏文智能信息处理领域专业人才培养、理科藏文教材建设和科学研究服务,并积极将科研成果转化为产品,为西部藏区的信息化建设和经济建设服务。
2、发展规划
(1)五年内争取成为五省区藏文智能信息处理研究中心。进行藏文智能信息处理领域专业人才培养。重点开展藏文平台、藏汉英电子词典的产业化开发以及汉藏科技机器翻译系统的产业化开发工作。为此,将目前综合性的实验室再分成三个专业性研究室和一个产业化研发室:
汉藏、藏汉机器翻译研究室。就国内外整个发展趋势来看,今后较长一段时期内,机器翻译研究主要将在受限语言和特殊领域系统、PC机器翻译系统、翻译工作站、Internet上的机器翻译系统、语言翻译系统以及软件本地化等方面展开。根据我们的研究基础和社会需求,下一步我们将主要开展限定领域专业的机器翻译系统的商品化以及Internet上的机器翻译和具备智能化的机器翻译系统方面的研发工作。
藏文平台、网络和远程教育藏文软件研究室。藏文平台已成为制约藏文信息处理研究工作的主要瓶颈,而基于网络的藏文信息化平台的开发以及在此基础上开发远程教育藏文软件的应用建成为今后一段时期的主要方向。为此,本研究室的建设将对整个藏文信息处理和远程教育具有重要的意义。
藏文计算机辅助教学系统软件研究室。目前计算机辅助教学软件在现代教育中所占的比重越来越为重要,而藏区社会的重点和难点是音像教材的现代化和本地化。为此,加速开展藏文计算机教学软件的研制和开发对藏区教育具有重要的意义。
产业化研发室。任何成果如果不能够转化为产品就很难发挥其社会和经济效益,而产业化研发室的建立将有助于现有成果和今后相关科研成果的快速转化,尽快发挥其效益。
(2)八年内争取成为国家藏文智能信息处理的研究基地或重点实验室。在相关部门的支持下,一方面对现有的专业技术人员进行业务培训,提高业务素质,不断扩大专业技术人员队伍。另一方面增加硬件设施的建设,并充分利用现有设备、技术力量和科研成果优势,开展科技藏汉双语教学系列软件的产业化开发工作。争取在八年内将本实验室建设成为全国藏文智能信息处理研究中心、全国藏文智能信息处理领域专业人才培养基地和全国高科技藏汉双语教学软件的产业化基地。
同时,广泛开展多方位、多层次的技术合作,进一步与北大、清华、中科院、青海教材编译处、五省区藏族教育协作办公室等单位强化科研和技术方面的联系,并积极调动本校计算中心、网络中心、电教中心的研究力量和设备资源,综合形成一个具有国内藏文智能信息处理特色学科的重点实验室。
3、目前的工作重点
目前实验室重点在以下几个方面开展工作:
(1)、<<汉藏英电子词典>>的产业化。本项目是国家863项目&laquo;汉藏科技机器翻译系统&raquo;的一个子项目,包含(基础词典5万词条,物理、化学、数学、计算机等专业词典16万词条),是目前国内外最大的汉藏英互译对照电子词典。已完成相关软件的开发工作。
(2)、藏文字库及输入法的开发。已完成一个藏文白体、黑体字库和相应的输入法设计。
(3)、藏文字处理软件的研究;
(4)、汉藏机器翻译系统的产业化前期准备工作和部分藏文教材的多媒体制作。


转载自:

http://www.qhnu.edu.cn/jgsz/office/kjc/html/shebeiyushiyanshi/zhongdianshiyanshi/200808/16-40.html
您需要登录后才可以回帖 登录 | 注册社区

本版积分规则

小黑屋|手机版|Archiver|格鲁教法集成

GMT+8, 2024-11-28 22:28 , Processed in 0.031490 second(s), 16 queries , Gzip On.

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表