摘 要:英語(yǔ)和漢語(yǔ)在很多方面都存在不同,因此在交流中經(jīng)常出現(xiàn)理解錯(cuò)誤的現(xiàn)象。各種英漢翻譯系統(tǒng)的交互體驗(yàn)感都較差,主要表現(xiàn)在用詞不準(zhǔn)確、語(yǔ)法錯(cuò)誤、系統(tǒng)發(fā)音不清楚、翻譯反饋速度遲緩等方面。為此,文中設(shè)計(jì)一種基于 B/S 框架的交互式英漢機(jī)器翻譯系統(tǒng),以期輔助英漢語(yǔ)之間的交流。該系統(tǒng)以 B/S 三層架構(gòu)為基礎(chǔ)設(shè)計(jì)系統(tǒng)框架,在系統(tǒng)硬件部分,主要對(duì)關(guān)鍵的語(yǔ)音識(shí)別硬件、英漢翻譯硬件和翻譯結(jié)果輸出硬件進(jìn)行具體分析;軟件部分主要對(duì)三個(gè)關(guān)鍵程序,即用戶登錄程序、語(yǔ)音識(shí)別程序、英漢翻譯程序進(jìn)行設(shè)計(jì)。系統(tǒng)測(cè)試結(jié)果表明,利用所設(shè)計(jì)系統(tǒng)進(jìn)行翻譯,譯文經(jīng)過專家評(píng)測(cè)后,人工評(píng)測(cè)綜合得分為 3.769分,大于 3.5分限定值,證明系統(tǒng)的翻譯質(zhì)量較高,可滿足用戶需求。
關(guān)鍵詞:交互式翻譯;英漢翻譯;B/S框架;語(yǔ)音識(shí)別;系統(tǒng)設(shè)計(jì);翻譯性能測(cè)試;系統(tǒng)測(cè)試
張啟振; 孫先洪 現(xiàn)代電子技術(shù) 2021-12-15
0 引 言
種族之間最大的不同在于語(yǔ)言體系的不同,這就導(dǎo)致跨種族交流十分困難。英語(yǔ)作為全球通用語(yǔ)言,是外交中最常用的語(yǔ)言,而我國(guó)的母語(yǔ)為漢語(yǔ),英漢語(yǔ)在詞匯、語(yǔ)法、語(yǔ)序、背景文化之間都存在極大的差異,這種差異使得彼此交流變得十分困難[1] 。因此,如何降低英漢語(yǔ)言之間的差異性,實(shí)現(xiàn)順暢交流成為研究的重點(diǎn)。基于上述背景,各種英漢機(jī)器翻譯系統(tǒng)被設(shè)計(jì)并廣泛應(yīng)用。例如,胡永久在規(guī)則策略的基礎(chǔ)上設(shè)計(jì)了一種英漢機(jī)器翻譯系統(tǒng),該系統(tǒng)的關(guān)鍵在于翻譯引擎和機(jī)器字典兩部分。該系統(tǒng)經(jīng)測(cè)試,可提高譯文質(zhì)量和分析效率。邢蕾基于雙層分析的思路提出并設(shè)計(jì)一種英漢機(jī)器翻譯譯文自動(dòng)生成系統(tǒng),實(shí)現(xiàn)了英漢文本之間的自動(dòng)轉(zhuǎn)換。郭永輝等人通過計(jì)算與實(shí)例庫(kù)之間的相似程度來(lái)進(jìn)行機(jī)器翻譯,然后結(jié)合規(guī)則方法,提出基于混合策略的英漢機(jī)器翻譯系統(tǒng)。該系統(tǒng)經(jīng)測(cè)試,具有譯文正確率高和翻譯速度快的特點(diǎn)。
盡管已設(shè)計(jì)出各種英漢翻譯系統(tǒng),但是這些系統(tǒng)的交互體驗(yàn)感都較差,主要表現(xiàn)在用詞不準(zhǔn)確、語(yǔ)法錯(cuò)誤、系統(tǒng)發(fā)音不清楚、翻譯反饋速度遲緩等方面。針對(duì)上述問題,本文設(shè)計(jì)一種有效的交互式英漢機(jī)器翻譯系統(tǒng)具有重要的現(xiàn)實(shí)意義。B/S框架是現(xiàn)代系統(tǒng)設(shè)計(jì)和開發(fā)中常用的框架架構(gòu),具有分布性好、業(yè)務(wù)擴(kuò)展方便、維護(hù)和開發(fā)簡(jiǎn)單、共享性強(qiáng)、成本低等優(yōu)點(diǎn)。文中以 B/S 框架為基礎(chǔ)進(jìn)行交互式英漢機(jī)器翻譯系統(tǒng)設(shè)計(jì)。最后通過功能測(cè)試,證明系統(tǒng)翻譯功能滿足用戶要求,驗(yàn)證了系統(tǒng)的有效性。
1 基于 B/S 框架的交互式英漢機(jī)器翻譯系統(tǒng)設(shè)計(jì)
語(yǔ)言是人與人之間最直接的交流方式,一旦聽不懂對(duì)方的語(yǔ)言,就無(wú)法明白對(duì)方要表達(dá)的意思,也就無(wú)法進(jìn)行交流。以往在很多外交場(chǎng)合,都需要一名翻譯作為雙方溝通的橋梁[2] 。而這種方式受到翻譯自身業(yè)務(wù)水平和職業(yè)素養(yǎng)的直接影響,存在很高的風(fēng)險(xiǎn)性。為此,機(jī)器翻譯系統(tǒng)被設(shè)計(jì)出來(lái)并廣泛應(yīng)用[3] 。針對(duì)上述機(jī)器翻譯系統(tǒng)存在的問題,本文設(shè)計(jì)一種基于 B/S 框架的交互式英漢機(jī)器翻譯系統(tǒng)。
1.1 系統(tǒng)框架設(shè)計(jì)
交互式英漢機(jī)器翻譯系統(tǒng)框架是在 B/S 三層架構(gòu)的基礎(chǔ)上設(shè)計(jì)出來(lái)的。B/S 三層架構(gòu)全稱為瀏覽器/服務(wù)器體系結(jié)構(gòu),是在 C/S 雙層架構(gòu)基礎(chǔ)上發(fā)展而來(lái)的,在很多方面都得到了優(yōu)化[4] 。表 1為 B/S架構(gòu)和 C/S 架構(gòu)具體優(yōu)缺點(diǎn)對(duì)比。
基于 B/S 的交互式英漢機(jī)器翻譯系統(tǒng)框架主要由界面層、業(yè)務(wù)邏輯層、數(shù)據(jù)訪問層 3層組成,如圖 1所示。各層的具體功能如下:界面層:主要負(fù)責(zé)用戶與系統(tǒng)之間的交互[5] 。業(yè)務(wù)邏輯層:負(fù)責(zé)響應(yīng)用戶請(qǐng)求,實(shí)現(xiàn)各種業(yè)務(wù)處理,然后將結(jié)果反饋給用戶,是系統(tǒng)的核心層次。數(shù)據(jù)訪問層:負(fù)責(zé)對(duì)數(shù)據(jù)庫(kù)進(jìn)行讀寫及管理。
1.2 系統(tǒng)硬件設(shè)計(jì)本系統(tǒng)硬件主要分為三部分,包括語(yǔ)音識(shí)別硬件、英漢翻譯硬件和翻譯結(jié)果輸出硬件。下面對(duì)這三部分硬件中的關(guān)鍵元件進(jìn)行分析[6] 。
1.2.1 語(yǔ)音識(shí)別硬件語(yǔ)音識(shí)別硬件是一個(gè)以 STM32F103VET6大容量芯片為載體,搭載若干電路與接口的微處理器,其硬件組成結(jié)構(gòu)如圖 2所示。
STM32F103VET6芯片是一款基于 CM3內(nèi)核的高性能 32位處理器,具有低功率、低電壓,并結(jié)合實(shí)時(shí)功能的極佳性能[7] 。該芯片技術(shù)參數(shù)如表 2所示。此外,該處理器主要硬件還包括話筒、放大濾波電路、液晶顯示器、音頻轉(zhuǎn)換芯片、揚(yáng)聲器等部分[8] ,各部分的作用如下:
1)話筒的作用是收集發(fā)聲者的話語(yǔ); 2)放大濾波電路的作用是對(duì)語(yǔ)音進(jìn)行增大和去噪處理,提高語(yǔ)音信號(hào)質(zhì)量; 3) 液 晶 顯 示 器 的 作 用 是 顯 示 語(yǔ) 音 處 理 過 程 和結(jié)果; 4)音頻轉(zhuǎn)換芯片的作用是將語(yǔ)音轉(zhuǎn)換文本形式或是將翻譯過來(lái)的文本語(yǔ)言轉(zhuǎn)換為目標(biāo)語(yǔ)音; 5)揚(yáng)聲器的作用是將翻譯的目標(biāo)語(yǔ)言播放出來(lái)[9] 。
1.2.2 英漢翻譯硬件
英漢翻譯硬件是本系統(tǒng)的核心和關(guān)鍵硬件,該硬件是一塊用來(lái)進(jìn)行嵌入式系統(tǒng)開發(fā)的電路板。該開發(fā)板上裝載了各種相關(guān)英漢翻譯程序,以便進(jìn)行業(yè)務(wù)處理[10] 。本系統(tǒng)中的開發(fā)板為 DE2?70 開發(fā)板,其結(jié)構(gòu)如圖 3 所示。該方框圖中包括 Cyclone Ⅱ 2C70 FPGA、串行配置設(shè)備、USB Blaster電路、同步動(dòng)靜態(tài)隨機(jī)存儲(chǔ)器、閃速存儲(chǔ)器、SD 卡槽、按鈕開關(guān)、編碼解碼器、主從控制器、收發(fā)器等。
1.2.3 翻譯結(jié)果輸出硬件
翻譯結(jié)果輸出硬件是系統(tǒng)末端部分,主要是將翻譯出來(lái)的目標(biāo)語(yǔ)言進(jìn)行語(yǔ)音輸出和翻譯結(jié)果顯示。在本系統(tǒng)中,翻譯結(jié)果輸出硬件為一個(gè)翻譯輸出機(jī)[11] 。該翻譯輸出機(jī)技術(shù)參數(shù)如表 3所示。
1.3 系統(tǒng)軟件翻譯程序設(shè)計(jì)
基于 B/S 框架的交互式英漢機(jī)器翻譯系統(tǒng)主要包括 3 個(gè)關(guān)鍵程序,即用戶登錄程序、語(yǔ)音識(shí)別程序、英漢翻譯程序[12] ,下面進(jìn)行具體分析。
1.3.1 用戶登錄程序
用戶登錄程序是整個(gè)系統(tǒng)的初始程序,所有用戶都是通過這個(gè)程序進(jìn)入系統(tǒng),進(jìn)行相關(guān)業(yè)務(wù)操作。該程序包括三個(gè)頁(yè)面,即登錄頁(yè)面、新用戶注冊(cè)頁(yè)面及身份密碼驗(yàn)證頁(yè)面。具體過程為:首先用戶根據(jù)登錄窗口進(jìn)入頁(yè)面;如果是未經(jīng)注冊(cè)的新用戶,則需要通過登錄頁(yè)面轉(zhuǎn)入到新用戶注冊(cè)頁(yè)面,輸入相關(guān)信息,進(jìn)行新用戶注冊(cè);注冊(cè)成功后,轉(zhuǎn)回登錄頁(yè)面,輸入驗(yàn)證信息,進(jìn)入到系統(tǒng)中[13] 。系統(tǒng)根據(jù)用戶等級(jí)分配權(quán)限,包括考務(wù)管理員和用戶兩個(gè)權(quán)限等級(jí)。所有用戶只有在確定分配權(quán)限后才能進(jìn)入開發(fā)系統(tǒng),然后進(jìn)行相關(guān)業(yè)務(wù)操作。
1.3.2 語(yǔ)音識(shí)別程序
語(yǔ)音識(shí)別程序是指對(duì)一方用戶發(fā)出的源語(yǔ)言進(jìn)行識(shí)別。具體過程分為四部分,即預(yù)處理、特征提取、模板庫(kù)建立和語(yǔ)音識(shí)別[14] 。
1)預(yù)處理。采集到的一方用戶發(fā)出的源語(yǔ)音受到周圍環(huán)境的影響,質(zhì)量較差,因此需要進(jìn)行預(yù)處理,具體包括去噪、放大、分幀和加窗等操作。
2)特征提取。利用數(shù)字處理技術(shù)對(duì)語(yǔ)音進(jìn)行特征提取,降低后續(xù)識(shí)別難度。提取出來(lái)的特征可以是波形、幅度、能量、頻譜等。
3)模板庫(kù)建立。需要輸入大量語(yǔ)音資料,建立模板庫(kù),以便為識(shí)別提供對(duì)比資料。
4)語(yǔ)音識(shí)別。將提取出來(lái)的特征與模板庫(kù)進(jìn)行測(cè)度匹配,計(jì)算相似度,得出識(shí)別結(jié)果。
1.3.3 英漢翻譯程序
英漢翻譯程序是系統(tǒng)的核心程序,主要任務(wù)是將一方用戶的源語(yǔ)言翻譯成另一方用戶可以理解的目標(biāo)語(yǔ)言,具體過程如圖 4所示[15] 。
2 系統(tǒng)測(cè)試與分析
為測(cè)試所設(shè)計(jì)系統(tǒng)翻譯功能,在 Matlab 平臺(tái)上進(jìn)行系統(tǒng)翻譯仿真測(cè)試。
2.1 系統(tǒng)運(yùn)行環(huán)境
系統(tǒng)測(cè)試與分析在如表 4所示的環(huán)境中進(jìn)行。
2.2 語(yǔ)料庫(kù)
本 翻 譯 系 統(tǒng) 語(yǔ) 料 中 的 資 料 主 要 來(lái) 自 Corpus of Contemporary American English(COCA)和現(xiàn)代漢語(yǔ)平衡語(yǔ)料庫(kù),具體情況如表 5 所示。在該語(yǔ)料庫(kù)中包括由口語(yǔ)轉(zhuǎn)寫而來(lái)的文本,也包括語(yǔ)音文件。
2.3 待翻譯材料
本實(shí)驗(yàn)選取的待翻譯材料來(lái)自一篇演講稿,具體內(nèi)容如圖 5所示。
2.4 評(píng)估方法
本系統(tǒng)的評(píng)估采用人工評(píng)測(cè)的方法,該方法流程如圖 6所示。
該方法是由翻譯專家(在這里選擇 10 名專家)對(duì)本系統(tǒng)翻譯出來(lái)的譯文進(jìn)行兩個(gè)方面的評(píng)測(cè),具體包括可懂度(英文翻譯可以被人理解的程度)和忠實(shí)度(譯文對(duì)原有英文語(yǔ)義的忠實(shí)程度)。這兩個(gè)指標(biāo)共分為 4 個(gè)等級(jí),具體如表 6所示。
對(duì)可懂度和忠實(shí)度各個(gè)等級(jí)進(jìn)行量化,計(jì)算公式為: F = 0.3A + 0.7B 式中:A為可懂度;B為忠實(shí)度;F為得分,分?jǐn)?shù)值大于 3.5 時(shí),認(rèn)為翻譯較為準(zhǔn)確,達(dá)到用戶的翻譯要求。
2.5 系統(tǒng)翻譯結(jié)果
利用本系統(tǒng)對(duì) 2.3 節(jié)待翻譯材料進(jìn)行翻譯,翻譯結(jié)果如圖 7所示。
2.6 系統(tǒng)翻譯性能評(píng)價(jià)結(jié)果
系統(tǒng)翻譯性能評(píng)價(jià)結(jié)果如表 7所示。從表 7可以看出,利用所設(shè)計(jì)系統(tǒng)進(jìn)行翻譯,譯文經(jīng)過專家評(píng)測(cè)后,得到3.769的分?jǐn)?shù),大于3.5限定值,認(rèn)為譯文能準(zhǔn)確地表達(dá)出原文的含義,沒有出現(xiàn)較多的錯(cuò)誤,滿足用戶的需求。
3 結(jié) 語(yǔ)
隨著世界各國(guó)聯(lián)系的加強(qiáng),英語(yǔ)作為國(guó)際通用語(yǔ)言,在很多社交場(chǎng)合的交流中都起到了關(guān)鍵作用。然而,由于我國(guó)漢語(yǔ)與英語(yǔ)語(yǔ)言體系的不同,理解上經(jīng)常出現(xiàn)偏差。為此,本文設(shè)計(jì)一種基于 B/S 框架的交互式 英漢機(jī)器翻譯系統(tǒng)。構(gòu)建由界面層、業(yè)務(wù)邏輯層、數(shù)據(jù)訪問層組成的基于 B/S 的交互式英漢機(jī)器翻譯系統(tǒng)框架,對(duì)語(yǔ)音識(shí)別硬件、英漢翻譯硬件和翻譯結(jié)果輸出硬件等系統(tǒng)硬件進(jìn)行分析,對(duì)用戶登錄程序、語(yǔ)音識(shí)別程序、英漢翻譯程序等系統(tǒng)軟件進(jìn)行分析。經(jīng)測(cè)試與分析,證明該系統(tǒng)的翻譯性能良好,能夠滿足用戶需求。然而,受到時(shí)間和經(jīng)驗(yàn)的限制,系統(tǒng)測(cè)試上還存在不足,僅對(duì)一個(gè)國(guó)家語(yǔ)言的英語(yǔ)翻譯進(jìn)行了測(cè)試,而不同的國(guó)家語(yǔ)言也存在一定的差別,因此有待進(jìn)一步擴(kuò)展測(cè)試,增加系統(tǒng)的適用性。
論文指導(dǎo) >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >