亚洲精品高清久久_免费看黄的软件在线看免费观_黄色短文合集_台湾a级艳片红楼梦

譯雅馨10年翻譯品牌,20000家企業見證的深圳翻譯公司
400-8808-295
18038126442
網站地圖官方微信服務城市
文件翻譯

文件翻譯

10年專業筆譯品牌?

陪同翻譯

陪同翻譯

10年數萬場口譯

證件翻譯

證件翻譯

專業留學移民翻譯

本地化翻譯

本地化翻譯

多語言網站翻譯

小語種翻譯

小語種翻譯

89種語言服務

當前位置:主頁 > 翻譯者手冊

漢、藏、蒙、維多民族語言語音翻譯方法研究

日期:2014-02-28 | 閱讀:
漢語與少數民族語言之間機器翻譯的研究對于促進少數民族地區經濟文化發展具有很重要的意義,目前這方面可投入的人力物力是十分有限的。

漢語與少數民族語言之間機器翻譯的研究對于促進少數民族地區經濟文化發展具有很重要的意義,目前這方面可投入的人力物力是十分有限的。對于漢、藏、蒙、維語言之間互譯來說,基于中間語言的翻譯方法,是一種經濟有效的途徑。介紹了一種基于中間語義表示(IF)實現漢、藏、蒙、維多語言語音翻譯的基本思想,并介紹了面向IF的魯棒的漢語口語解析方法以及基于IF的漢語英語生成方法。

 2014年2月28日,據譯雅馨翻譯公司了解到,我國有56個民族,大多數的民族都有自己獨特的語言。隨著社會的發展,各民族之間的經濟文化交流越來越頻繁,在此過程中,語言的差異是一個客觀現實,由此帶來的相關問題,是制約少數民族地區經濟文化發展一個重要因素,因此,有必要進行少數民族語言與漢語之間的多語言機器翻譯研究,這對促進少數民族地區經濟發展、促進各民族之間文化交流以及民族團結都具有重大的意義。另外,各個少數民族都有自己獨有的風俗文化,對這些風俗文化進行研究、保護和開發,無論從社會還是經濟上,都有著深遠的意義,而語言是這些風俗文化最直接的載體,這也對語言翻譯提出了要求。目前,少數民族語言的機器翻譯研究,雖然取得了一定的成績,但是,由于經濟、文化、資源、歷史等眾多的原因,還停留在起步階段,很多問題都有待進一步研究[12]。少數民族中,藏族、蒙古族和維吾爾族各自擁有本民族的語言,在自然語言處理方面的研究起步也比較早,有了一定的基礎,而且這三個民族地區人口比較多,因此,有必要把漢、藏、蒙、維語言之間的機器翻譯研究作為當前的少數民族語言機器翻譯研究的一個主要任務。目前蒙古文機器翻譯系統有王斯日古楞等人研制的英蒙機器翻譯(English Mongolian Machine Translation,簡稱EMMT)系統,內蒙古大學那順烏日圖等研制的漢蒙機器翻譯系統,這兩個系統目前都尚處于研究階段[12]。藏語的計算機處理目前的研究重點大致包括藏文編碼標準及平臺建設、藏語語法研究、分詞標準、電子詞典建設等階段,也有一些機器翻譯系統 [15]。關于維吾爾族語的計算機處理方面研究也主要集中在維吾爾語的編碼標準及平臺建設方面。

在諸多的機器翻譯實現方法中,有一種基于中間語言的方法,這種方法利用一種人工制定的標準語言作為語言翻譯的中介,即首先把源語言解析為中間語言的表示形式,然后再由這種中間語言生成目標語言。對于一個多語言翻譯系統,如果采用轉換的方法,則不同方向的翻譯需要不同的翻譯模塊,比如英譯漢和漢譯英分別需要一個翻譯模塊。假設有N種語言需要進行互譯,總共則需要N*(N-1)個翻譯模塊,而采用中間語言的方法,由于對每一種語言只需實現將該種語言翻譯成中間語言和把中間語言翻譯成該種語言這兩個模塊,對于N種語言之間的互譯,總共只需要2N個翻譯模塊,這一過程如圖 1所示,因此,采用基于中間語言的翻譯方法進行多語言的互譯,能夠降低系統的復雜性,是一種經濟有效的途徑。

 

語言翻譯模塊
非基于中間語言的方法,包括基于規則的轉換方法和基于語料庫的統計方法?;谝巹t的方法,首先需要對源語言進行分析,然后根據目標語言的特點,把分析結果轉換成目標語言。這一過程中,除了要對源語言進行各方面的研究外,還要對目標語言進行研究,需要懂源語言和目標語言的專業人員編寫大量的規則和建立詞典。而基于語料庫的統計方法,則首先需要收集大量的雙語語料,即一句源語言對應一句目標語言,然后對雙語語料進行對齊,在此基礎之上,進行統計模型的訓練??傊?,無論是基于規則的轉換方法還是基于語料庫的統計方法,都需要投入比較多的人力和物力,而少數民族語言的機器翻譯研究,受到各種條件的限制,可投入的資源特別是人力是很有限的, 因此,采用中間語言作為中介進行翻譯,每個民族只需負責把本民族語言轉換為中間語言和把中間語言產轉換為本民族語言,就可以實現本民族語言和其他語言的互譯,這在一定程度上,能夠節省人力和物力,不失為一種可行的途徑。

早期的中間語言主要有法國的CETA實驗室的“樞軸語言”(pivot language),該中心利用它進行了數學、物理文獻方面的俄-法翻譯系統[16], 2000年日本聯合國大學的Uchida提出了一種UNL(Universal Network Language)語言[19],用來進行多種語言的翻譯。成立于1990年的成立C-STAR(Consortium of Speech Translation Advanced Research),提出了一種中間語義表示格式IF(Interchange Format)[8]。IF是針對特定領域的多語言電話語音同聲翻譯而設計的,目前IF涵蓋的領域包括旅游、就醫、體育比賽等特定場景。C-STAR由11個國家的著名研究機構組成,目前該組織采納的語言包括漢語,英語,日語,德語,韓語,意大利語,法語等多種語言,并且其成員國以及包括的語言正在逐年地增加。我國中科院自動化所模式識別實驗室是C-STAR的中文代表,在2002年3月,他們與韓國電信研究所聯合演示了一個電話對話翻譯的原型系統,該系統面向旅館預定領域,首次實現了漢語-韓語之間的電話雙向翻譯。利用IF作為中介進行語音翻譯的過程如圖 2所示。

 

語言翻譯方法示意

【溫馨提示】如您遇到翻譯難題或者有翻譯需求,可立即撥打全國免長途費咨詢熱線:400-8808-295 我們為您提供解決方案,更多詳情請瀏覽:

譯雅馨翻譯公司網站:http://m.blistin.com

譯雅馨北京翻譯公司:http://www.dtpfy.com

在線預約,獲取專屬優惠報價
您的姓名
您的電話
翻譯類別
在線咨詢
與我們取得聯系
電話咨詢
免費熱線:18038126442
關注微信
返回頂部