以人(rén)為(wèi)本,本在心;以厚為(wèi)道(dào),道(dào)在行ε∏(xíng)

厚溥·2018年(nián)(第一(yī)批)産•≤學合作(zuò)協同育人(rén): 點擊查看(kàn)申報(bào)指南(nán)

企業(yè)郵箱 中文(wén) English

新聞中心

您的(de)位置:HOME > 新聞中心 > 內(nèi)部周刊
  • 武漢厚溥企業(yè)
  • Wuhan HOPU

人(rén)工(gōng)智能(néng),能(néng)©♠‌$否助人(rén)類重建“巴比倫塔”

發布時(shí)間(jiān):2016-1≥××↑2-20 來(lái)源:


假如(rú)上(shàng)帝真的(de)存在,他(tā)最近(jì™±Ω₽n)可(kě)能(néng)有(yǒu)些(xiē)心事(shì)。
 
在猶太人(rén)的(de)古老(lǎo)傳說(shuō)中,人(rén)類曾©λ試圖修建一(yī)座通(tōng)向天堂的(de)“巴比倫塔&rdquoΩ→§;。為(wèi)阻止這(zhè)個(gè)©>瘋狂的(de)計(jì)劃,上(shàng)帝想出一(yī)個(gè)絕招&mda♦σsh;—賦予不(bù)同族群不(bù)同語言,讓人(rén)們難以溝通(t≈® ♠ōng)。
 
最終,語言的(de)隔閡讓“±↓★₽巴比倫塔”計(jì)劃擱淺。直到(dào)今天,即便信息和€ ♠Ω(hé)交通(tōng)技(jì)術(shù)把世界變成了(le)&l"  dquo;地(dì)球村(cūn)”,語系之間(j£∞"iān)的(de)交流,依然隻能(néng)依靠對(duì)彼此語言的(de)專業(§←"yè)學習(xí)。
 
但(dàn)是(shì)現(xiàn)在,人(rén)工(gōng)智能(néng)在語言翻 ± 譯領域的(de)突飛(fēi)猛進,又(yòu)讓人(rén)們重新看(kàn)到±♥ ↓(dào)了(le)“巴比倫塔”竣工(gōng)的α÷(de)希望。
 
九成六級考生(shēng)不(bù)如(rú)&ldquoγ​;它”
 
這(zhè)段時(shí)間(jiān),機(jī)器(qì)翻譯技(j&♣ì)術(shù)可(kě)謂高(gāo)調。
 
微(wēi)軟剛剛在12月(yuè)13日(rì)放(fàng)出&l¥✘dquo;大(dà)招”——推出實時(shí)語音(yīπγ₽n)翻譯應用(yòng)MicrosoftTransl₩π‍§ator,支持多(duō)人(rén)、多(duō)語言、跨設備交流。國(guó)₩¥‌®內(nèi)企業(yè)并未示弱。上(sφ✔hàng)個(gè)月(yuè)底科(kē)大(dà)訊飛(fēi)在其年(nián)∏↓度發布會(huì)上(shàng)也(yě)展示ε∞了(le)類似的(de)技(jì)術(shù),可(kě)以将中文☆$↕(wén)會(huì)議(yì)演講實時(shí)翻譯↓→成英、日(rì)、韓、維吾爾等多(duō)種語言顯示在大(dà)屏幕上(shàng₹¥)。發布會(huì)上(shàng)推出的(de)語音(yīn)翻αφ≈譯機(jī)“曉譯”還(hái)瞄準了(le)更廣闊σΩ≤的(de)應用(yòng)場(chǎng<™±)景——出國(guó)遊玩(‍<wán)。
 
平時(shí)不(bù)顯山(shān)不(bù)露水(sh ₽®™uǐ)的(de)在線翻譯應用(yòng)也(≈‍ yě)已華麗(lì)升級。今年(nián)9月(yuè),谷歌(g€₽✘ē)翻譯啓用(yòng)了(le)谷歌(gē)神經機(jī)器(qì)翻譯(GNMT)系→¶γ統,在人(rén)工(gōng)智能(néng)界引起騷動。而追溯至去(qù✘λ↓§)年(nián)5月(yuè),則是(shì)百度翻譯發布基于神經網絡的(de)機(jī)≥±>器(qì)翻譯(NMT)系統的(de)時(shí)間(ji©ε÷ān)。
 
機(jī)器(qì)翻譯的(de)高(gāo)調,依賴于人(rén)•¥ 工(gōng)智能(néng)技(jì)術(shù)在這(zhè)一(yī)領域的(de≠λ)顯著進展。
 
百度主任架構師(shī)何中軍介紹,自(zì)上(shà₩☆©ng)世紀40年(nián)代起,基于規則、實例以及統計(jì)的(de)機(jī)¥→×♦器(qì)翻譯方法漸次登場(chǎng)。2014年(♥Ωnián)起,人(rén)工(gōng)神經網絡開< (kāi)始在機(jī)器(qì)翻譯領域引領風(fēng)騷。
 
“最終的(de)翻譯效果就(jiù)是(shì)更§→加流暢了(le)。”科(kē)大(dà)訊飛(fēi)機(jα'ī)器(qì)翻譯研究主管劉俊華告訴科(kē)技(jì)日(rì)報(bào)記者¥σ,科(kē)大(dà)訊飛(fēi)所展示的ε↑(de)會(huì)議(yì)實時(shí)翻譯系統和(hé)&£✔™ldquo;曉譯”翻譯機(jī)便應用(yòng)了(le)基于神經網絡的≠‍♣₹(de)機(jī)器(qì)翻譯方法。
 
若問(wèn)人(rén)工(gōng)智能(néng)的(de)到(dào)來(lái)把機(∑₹♠jī)器(qì)翻譯“提”到(dào)了(le)什(shén)麽水(​‌≥shuǐ)平,何中軍舉出一(yī)道(dào)大(dà)學英語六級翻​✘譯真題。這(zhè)道(dào)題需要(yào)把一(y±™βī)句中文(wén)翻譯成英文(wén),而β←✔百度翻譯應用(yòng)給出的(de)答(dá)案,從(cóng)詞彙和(hé)語法←‌來(lái)看(kàn)都(dōu)挑不(bù)出什(shén)麽毛病。
 
無獨有(yǒu)偶,科(kē)大(dà)訊飛(fēi)在推介其“€×λα曉譯”翻譯機(jī)時(shí)也(yě)曾表示它可(kě)以達到(dào§££)大(dà)學英語六級水(shuǐ)平。“大(dà✘✔)學英語六級的(de)翻譯題目滿分(fēn)為(wèi)15分(fēn),目前機★↓φΩ(jī)器(qì)翻譯答(dá)題可(kě)以達到(dào)11分(fēn)。&rdqu‌' o;劉俊華解釋說(shuō),這(zhè)意味著(zhe)機(jī)器(qì)翻譯技(jì←↓‍®)術(shù)大(dà)概可(kě)以超過90%的(de)英語六級考生(sh☆←✔σēng)。
 
“煉丹爐”取代了(le)“流水(shuǐ)線&rdquo♦¥α•;
 
就(jiù)在兩三年(nián)前,“流暢”和(hé)“自(z₽αì)然”還(hái)是(shì)讓機(jī)器(qì)翻譯研究人(≠ε <rén)員(yuán)感到(dào)頭痛的(de)字眼。那(φ'φnà)時(shí),基于統計(jì)的(de)機(jī)器(qì)翻 δ譯方法是(shì)大(dà)熱(rè)門(mén​σ>π)。
 
短(duǎn)短(duǎn)兩年(nián)多(duō)時(shí)間(jiān)內(nèi$←★∏),基于神經網絡的(de)機(jī)器(qì)翻≥ ∑÷譯系統,就(jiù)在多(duō)個(gè)公開(kāi)測試集上(shàng)超越了§₹φ(le)基于統計(jì)的(de)機(jī)器(qì)翻譯系統。
 
單從(cóng)翻譯步驟來(lái)看(kàn),劉俊華的(de)體(tǐ)會(hu§≈ ÷ì)是(shì),基于神經網絡的(de)機(jī)器(qì)翻譯δβ 比其前任“簡潔了(le)非常多(duō)&rdqu∑Ω←♠o;。比如(rú),要(yào)把一(yī)句中文(wén)翻譯成英文(wén),基于統計(j×&↕ì)的(de)機(jī)器(qì)翻譯方法首先要(yào)對‍≤(duì)句子(zǐ)的(de)詞彙、短(duǎn)語進行(xíng)切分(fēn),↓π✘♥然後分(fēn)别對(duì)每個(gè)單元進行(xíng)翻譯,再把翻€§譯結果組合起來(lái),最後還(hái)要(yào)進行(xíng)調序等等。每"™≠個(gè)步驟都(dōu)對(duì)應著(♦‍φzhe)十分(fēn)複雜(zá)的(de)模型。
 
形象地(dì)說(shuō),如(rú)果基于統計(jì)的(de)方法是(shì)一(yī) ≠₽♦條長(cháng)長(cháng)的(de)流水(shuǐ)線,基于×Ω神經網絡之後隻需一(yī)個(gè)“煉↕×σ♣丹爐”。
 
新方法被稱為(wèi)“從(cóng)端到(dào)端”的(d α✘e)翻譯。“基本的(de)神經機(jī)器(qì)翻譯模型包含‌♥★$兩個(gè)部分(fēn),編碼器(qì)和(hé)解碼器(q±Ωì)。”何中軍解釋說(shuō),編碼器(qì)将源語言句子(zǐ)表示為(wèε←i)一(yī)個(gè)向量,解碼器(qì)根據此向量逐詞産生∏λ‍(shēng)目标譯文(wén)。也(yě)就(jiù)是(shì)說(shuō)™€×>,一(yī)個(gè)句子(zǐ)經過一(yī)次&ld§&"quo;加工(gōng)”就( ♦→↓jiù)能(néng)夠直接輸出目标語言。
 
不(bù)僅翻譯效率得(de)到(dào)了(le)極大(dà)提高(gā'φλ✘o),結果也(yě)更加流暢自(zì)然。這(zhè)是(shì)因為(wèi),神經機>£×(jī)器(qì)翻譯方法是(shì)對(duì)整個(gè)句子(zǐ)進行(xσ♣íng)編碼處理(lǐ),可(kě)以照÷≈(zhào)顧到(dào)詞彙的(de)上(shàng)下(xià)文(wén)信息,因此↑✘ <翻譯出的(de)答(dá)案不(bù)像統計(jì)機(jī) σλ♥器(qì)翻譯方法那(nà)樣生(shēng)硬。
 
正是(shì)“流暢”和(hé)“自≥↑(zì)然”将機(jī)器(×↓↑qì)翻譯技(jì)術(shù)推向更加實際的(deα‍)應用(yòng)。而且在與其他(tā)人(rén)工(gōng)智能(néng)技(jìα )術(shù)相(xiàng)結合後,機(jī)器(qì)翻譯可(kě)以真正觸到(dào)人(r§‌én)們語言不(bù)通(tōng)的(deΩΩσ₽)“痛點”,從(có∏​₹ng)而深度切入商務、旅行(xíng)、學習(xí)等多(duō)個(gè)場(c↑→hǎng)景。
 
例如(rú),無論是(shì)微(wēi)軟的(de)MicrosoftTranslator,還(" hái)是(shì)科(kē)大(dà)訊飛(fēi)的σ≤γ(de)會(huì)議(yì)實時(shí)翻譯系統以及“≈←π曉譯”翻譯機(jī),都(dōu)結合了(le)語音(yīn)識别技(jì)™÷ 術(shù)來(lái)為(wèi)語言交談架起橋梁。而融入了(le)光(guā ★¥>ng)學字符識别(OCR)技(jì)術(s↕&♥ hù)的(de)百度翻譯APP,則可(kě)以在國(guó)外(wài)購(gΩ♦òu)物(wù)或旅遊的(de)場(chǎ®πng)景下(xià),幫助人(rén)們翻譯看(kàn)不(bù)懂(d¥'ǒng)的(de)英文(wén)路(lù)牌、菜單和(hé)說(shuō)明(míng)書(s®♦×hū)等。
 
等待打破“歎息”之牆
 
可(kě)以看(kàn)到(dào),人(rén)工(gōng∏ε α)智能(néng)正在一(yī)點一(yī)點&±™ldquo;捅破”人(rén)與人(rén)之間(jiān‍★ γ)的(de)語言隔閡。有(yǒu)網友(yǒu)戲言,或許不(bù)久後的(de)一(y≤<↓αī)天,揣著(zhe)裝了(le)高(gāo)效語言翻譯APP的(de)手機(§&λjī),鄰居大(dà)媽(mā)也(yě)能(néng)來(lái)一(yī)場(chǎng)≤®說(shuō)走就(jiù)走的(de)世界旅行(xíng)。所有(yǒu)國(guó)家(j"​∞​iā)的(de)學生(shēng)将徹底掙脫外(wà₹♣∑®i)語課的(de)“黑(hēi)暗(àn)統治”。
 
不(bù)過,要(yào)把重建“巴比倫塔&↓★ rdquo;的(de)美(měi)夢寄托給當前、乃至未來(lái)一(yī)∏¶≤↔段時(shí)間(jiān)內(nèi)的(→ de)機(jī)器(qì)翻譯技(jì)術(shù),還(hái)是(shì)有(yǒu)點不•★(bù)太現(xiàn)實。
 
“基于神經網絡的(de)翻譯技(jì)術(shù)雖然帶來(lái)了(le)機(jī↑↓)器(qì)翻譯質量的(de)較大(dà)提高(gāo),但(dàn♠™')是(shì)本身(shēn)還(hái)存γ←φ在諸多(duō)技(jì)術(shù)挑戰。”何中<σ軍說(shuō)。他(tā)把神經網絡比作(zuò)一(yī)個(gè)“黑(h$↑ēi)盒子(zǐ)”,中文(wén)句子(zǐ)進去(qù×®∏),英文(wén)句子(zǐ)出來(lái),但(dàn)是(shì)這(zγ₩ hè)個(gè)“黑(hēi)盒子(zǐ)”為(wèi)何要(yào$₩)這(zhè)麽翻譯,技(jì)術(shε<ù)人(rén)員(yuán)還(hái)難以對(duì)其進行(xíng)合理(lǐ)的'±©(de)解釋。
 
更重要(yào)的(de)是(shì),複雜(zá)、多(duō)變,我們自(zì)己λ ¥<都(dōu)掌握不(bù)住的(de)“人(rén)性”,¥α仍然是(shì)所有(yǒu)人(rén)£&工(gōng)智能(néng)發展的(de)歎息之牆。
 
雖然對(duì)單個(gè)句子(zǐ)的(de)翻譯可(k₹φ£≥ě)以實現(xiàn)流暢和(hé)自(zì)然,但(dàn)是(shì)在整個(gè)篇章(zhε>āng)的(de)上(shàng)下(xià)文(wén)理(lǐ)解方面,機(jī)器(qΩ∞©ì)翻譯并不(bù)給力。一(yī)旦涉及歇後語、詩句、雙關語甚至口語∞π化(huà)的(de)表達,機(jī)器(qì)翻譯更會(huì)毫不(bù)掩飾地(≥>•¶dì)掉鏈子(zǐ)。而對(duì)于如(rú)何将知(zhī)識融合到(dào)機(jī)器(α♦"₩qì)翻譯系統中,讓機(jī)器(qì)πγδ真正“理(lǐ)解”人(rén)類的(de)語言,目前還( ​✔hái)沒有(yǒu)較好(hǎo)的(de)解決方案。
 
從(cóng)另一(yī)個(gè)角度來(lái)看(k‍₽àn),無論是(shì)基于統計(jì)的(de)機(jī)器(qì)翻譯,還(hái)≥®σ是(shì)基于神經網絡的(de)機(jī)器(qì♣π↑)翻譯,都(dōu)以龐大(dà)的(de)語料庫₽∑‍®為(wèi)基礎。然而劉俊華告訴科(kē)技(jì)日(rì)報(bào)記者,雖Ω☆"然中、英等主要(yào)語種的(de)語料相(xiàng)對(duì)充足,一(yī)些λ∑(xiē)小(xiǎo)語種的(de)翻譯,比如(rú)科(★&™kē)大(dà)訊飛(fēi)目前關注的(de)國(guó)內(nèi)少(shǎo✘≥)數(shù)民(mín)族語言的(de)翻譯,×♣依然會(huì)面臨語料短(duǎn)缺的(de)問(wèn)題。
 
“目前的(de)成果可(kě)以證明(míng),神經網絡在語言翻譯領域的(de)應♠™≤φ用(yòng)效果不(bù)錯(cuò),但(dàn)它的(de)潛力還(hái)沒有∏∑↕↓(yǒu)完全發揮出來(lái)。”劉俊華給£♦‍出的(de)方案是(shì),可(kě)以考慮将其他(tā)技(jì)術(shù)路÷↓↓(lù)線與基于神經網絡的(de)機(jī)器(qì)翻譯方法融合起來(lái),使其各施所長(✘¶π✔cháng),實現(xiàn)更好(hǎo)的(de)翻譯效果。↔ε
 
人(rén)工(gōng)智能(néng) ✔ ​會(huì)不(bù)會(huì)取代專業(yè)的(de)同聲傳譯?這(zhè)個Ω$×(gè)簡單的(de)問(wèn)題竟讓機(jī)器(qì)翻譯γ≥領域的(de)專家(jiā)們感到(dào)為(wπαèi)難。何中軍用(yòng)“任重道(dào)遠(¶$yuǎn)”作(zuò)為(wèi)回答(dá),而在劉俊華看(kàn)來(lá £i),對(duì)照(zhào)傳統的(d‌₩✘☆e)翻譯規則——“信、達、雅&rdq₩§uo;,人(rén)工(gōng)智能(nén≠λg)目前僅能(néng)實現(xiàn)“信”,離(lí)後二者尚有€≈ π(yǒu)距離(lí)。
 
這(zhè)麽說(shuō)來(lái),上(shàng)帝或可(kě)放(fàn₹♥g)寬心:就(jiù)算(suàn)人(rén)工(gōng✘↓€←)智能(néng)要(yào)幫助人(rén)類重建“巴比倫塔”,也(yěα↔∑☆)不(bù)過剛剛撿起幾塊磚瓦而已。
 
隻是(shì),未來(lái)呢(ne)?