微軟AI又一里程碑:中翻英機器水準「媲美人類」
【新唐人亞太台 2018 年 03 月 15 日訊】繼在語音辨識和機器閱讀領域取得的“過人”成績,由微軟亞洲研究院與雷德蒙研究院的研究人員組成的團隊今(15)日宣佈,其研發的機器翻譯系統在通用新聞報導測試集newstest2017的中翻英測試集上,達到了可與人工翻譯媲美的水準。這是第一個在新聞報導的翻譯品質和準確率上可以比肩人工翻譯的翻譯系統。
newstest2017新聞報導測試集由產業界和學術界的合作夥伴共同開發,並於去年秋天在WMT17大會上發佈。為了確保翻譯結果準確且達到人類的翻譯水準,微軟研究團隊邀請了雙語語言顧問將微軟的翻譯結果與兩個獨立的人工翻譯結果進行了比較評估。
微軟技術院士,負責微軟語音、自然語言和機器翻譯工作的黃學東稱,這是對自然語言處理領域最具挑戰性任務的一項重大突破。「在機器翻譯方面達到與人類相同的水準是所有人的夢想,我們沒有想到這麼快就能實現。」他表示,「消除語言障礙,代表人們的溝通進步,這非常有意義,值得我們多年來為此付出的努力。」
機器翻譯是科研人員攻堅了數十年的研究領域,曾經很多人都認為機器翻譯根本不可能達到人類翻譯的水準。雖然此次突破意義非凡,但研究人員也提醒大家,這並不代表人類已經完全解決了機器翻譯的問題,只能說明我們離終極目標又更近了一步。微軟亞洲研究院副院長、自然語言計算組負責人周明表示,在WMT17測試集上的翻譯結果達到人類水準很鼓舞人心,但仍有很多挑戰需要我們解決,比如在即時的新聞報導上測試系統等。
微軟機器翻譯團隊研究經理Arul Menezes表示,團隊想要證明的是:當一種語言對(比如中-英)擁有較多的訓練資料,且測試集中包含的是常見的大眾類新聞詞彙時,那麼在人工智慧技術的加持下機器翻譯系統的表現可以與人類媲美。
跨時區跨領域合作,四大技術為創新加持
雖然學術界和產業界的科研人員致力於機器翻譯研究很多年,但近兩年深度神經網路的使用讓機器翻譯的表現取得了很多實質性突破,翻譯結果相較於以往的統計機器翻譯結果更加自然流暢。為了能夠取得中-英翻譯的里程碑式突破,來自微軟亞洲研究院和雷德蒙研究院的三個研究組,進行了跨越中美時區、跨越研究領域的聯合創新。
其中,微軟亞洲研究院機器學習組將他們的最新研究成果 - 對偶學習(Dual Learning)和推敲網路(Deliberation Networks)應用在此次取得突破的機器翻譯系統中。微軟亞洲研究院副院長、機器學習組負責人劉鐵岩介紹道,「這兩個技術的研究靈感其實都來自於我們人類的做事方式。」對偶學習利用的是人工智慧任務的天然對稱性。當我們將其應用在機器翻譯上時,效果就好像是通過自動校對來進行學習 - 當我們把訓練集中的一個中文句子翻譯成英文之後,系統會將相應的英文結果再翻譯回中文,並與原始的中文句子進行比對,進而從這個比對結果中學習有用的回饋資訊,對機器翻譯模型進行修正。而推敲網路則類似於人們寫文章時不斷推敲、修改的過程。通過多輪翻譯,不斷地檢查、改善翻譯結果,從而使翻譯的品質大幅提升。對偶學習和推敲網路的工作發表在NIPS、ICML、AAAI、IJCAI等人工智慧的全球頂級會議上,並且已被其他學者推廣到機器翻譯以外的研究領域。
周明帶領的自然語言計算組多年來一直致力於攻克機器翻譯,這一自然語言處理領域最具挑戰性的研究任務。周明表示:「由於翻譯沒有唯一的標準答案,它更像是一種藝術,因此需要更加複雜的演算法和系統去應對。」自然語言計算組基於之前的研究積累,在此次的系統模型中增加了另外兩項新技術:聯合訓練(Joint Training)和一致性規範(Agreement Regularization),以提高翻譯的準確性。聯合訓練可以理解為用反覆運算的方式去改進翻譯系統,用中英翻譯的句子對去補充反向翻譯系統的訓練資料集,同樣的過程也可以反向進行。一致性規範則讓翻譯可以從左到右進行,也可以從右到左進行,最終讓兩個過程生成一致的翻譯結果。
可以說,兩個研究組分別將各自所在領域的累積與最新發現應用在此次的機器翻譯系統中,從不同角度切入,讓翻譯品質大幅提升。在專案合作過程中,他們每週都會與雷德蒙總部的團隊開會討論,確保技術可以無縫融合,系統可以快速反覆運算。
沒有“正確的”翻譯結果
newstest2017新聞報導測試集包括約2000個句子,由專業人員從線上報紙樣本翻譯而來。微軟團隊對測試集進行了多輪評估,每次評估會隨機挑選數百個句子翻譯。為了驗證微軟的機器翻譯是否與人類的翻譯同樣出色,微軟沒有停留在測試集本身的要求,而是從外部聘請了一群雙語語言顧問,將微軟的翻譯結果與人工翻譯進行比較。
驗證過程之複雜也從另一個側面展現了機器翻譯要做到準確所面臨的複雜性。對於語音辨識等其它人工智慧任務來說,判斷系統的表現是否可與人類媲美相當簡單,因為理想結果對人和機器來說完全相同,研究人員也將這種任務稱為模式識別任務。
然而,機器翻譯卻是另一種類型的人工智慧任務,即使是兩位專業的翻譯人員對於完全相同的句子也會有略微不同的翻譯,而且兩個人的翻譯都不是錯的。那是因為表達同一個句子的“正確的”方法不止一種。 周明表示:「這也是為什麼機器翻譯比純粹的模式識別任務複雜得多,人們可能用不同的詞語來表達完全相同的意思,但未必能準確判斷哪一個比較好。」
複雜性讓機器翻譯成為一個極有挑戰性的問題,但也是一個極有意義的問題。劉鐵岩認為,我們不知道哪一天機器翻譯系統才能在翻譯任何語言、任何類型的文本時,都能在“信、達、雅”等多個維度上達到專業翻譯人員的水準。不過,他對技術的進展表示樂觀,因為每年微軟的研究團隊以及整個學術界都會發明大量的新技術、新模型和新演算法,「我們可以預測的是,新技術的應用一定會讓機器翻譯的結果日臻完善。」
研究團隊還表示,此次技術突破將被應用到微軟的商用多語言翻譯系統產品中,從而説明其它語言或詞彙更複雜、更專業的文本實現更準確、更地道的翻譯。此外,這些新技術還可以被應用在機器翻譯之外的其他領域,催生更多人工智慧技術和應用的突破。
相關新聞
-
六科技巨頭自研AI晶片 台積電拿大單.台廠看旺
2023-11-25 15:59:38輝達新一代AI晶片推出,微軟、亞馬遜、Google等六大科技業者,也投入自主研發AI晶片,而外包訂單幾乎由台積電包辦,3奈米製程,明年下半年逐步成為業界主流,也讓台廠明年的業績有機會樂觀看待。
-
AI晶片自研趨勢 六大科技巨頭下單台積電
2023-11-21 12:57:35全球多家科技大廠,大力投入AI人工智慧,輝達新一代AI晶片推出,另外微軟、亞馬遜、谷歌等六大科技譯者,投入自主研發AI晶片,外包訂單幾乎由晶圓代工龍頭台積電包辦,3奈米製程,明年下半年逐步成為業界主流,也讓2024年台廠業績有機會樂觀看待。
-
避中共 微軟將頂尖AI專家撤離中國
2023-06-12 17:21:05英國《金融時報》報導,美國科技巨頭微軟公司已經決定將在中國的頂尖AI專家調往加拿大,以確保他們的安全。
-
AI變現?微軟Copilot本週上線 企業版11月登場
2023-09-30 15:15:48再來看到,AI即將變現嗎?微軟推出的AI輔助功能Copilot,整合到Word、Excel與Powepoint,可以簡化工作流程,將正式上線,而企業版本,則是會在11月全面推出。
-
阿特曼轉入微軟 OpenAI風波延燒
2023-11-21 11:30:31OpenAI執行長阿特曼17日遭解職,19日傳出董事會商議邀請回歸。不過談判破局,董事會決議由Twitch前執行長希爾擔任OpenAI臨時執行長。最新消息,超過700名的OpenAI員工已簽署了一封公開信,敦促OpenAI董事會所有成員辭職,不然,這些員工將會辭職。
-
AI推升7大科技股總市值!德國GDP的三倍
2023-07-10 17:43:32人工智慧話題持續延燒,也牽引標普500指數走向,而帶動大部分漲幅的,就是被稱作美股「七蛟龍」的蘋果、微軟、Alphabet、亞馬遜與Meta,還有兩家新進者輝達和特斯拉,今年總市值增長60%,來到11兆美元,約新台幣344兆元,這數字幾乎是德國GDP的三倍。就在上週,蘋果市值飆升至3兆美元以上,摩根士丹利也預測,微軟將成為下一個市值達到3兆美元的大型科技股,另外,輝達今年的股價也飆升近200%,擠進1兆美元俱樂部。
-
OpenAI傳售現有股票 公司估值達900億美元
2023-09-27 17:31:17AI聊天機械人ChatGPT去年底上線後爆紅後,近日傳出開發商OpenAI,正和投資人洽談股票出售。根據外媒報導,洽談中的OpenAI股份,對公司估值高達 900 億美元,比今年初籌資3億美元時的300億美元估值,成長約兩倍。OpenAI向投資人表示,預期今年營收達10億美元,明年營收約數十億美元。目前微軟公司持有49%的股權。不過,這起交易可能是員工賣出手上持有的股份,而非由OpenAI發行新股來增資,但條件也有可能會改變。
-
六大科技巨頭自研AI晶片 台積電拿大單
2023-11-21 17:24:03台股今天盤中大漲近200點,AI概念股表現亮眼;因為輝達新一代AI晶片推出,微軟、亞馬遜、谷歌等六大科技業者,也投入自主研發AI晶片,外包訂單幾乎由晶圓代工龍頭台積電包辦,3奈米製程,明年下半年逐步成為業界主流,也讓2024年台廠業績有機會樂觀看待。
-
AI軍備競賽開打 微軟首款AI晶片採台積5奈米
2023-11-16 17:14:43AI軍備競賽正式開打,微軟推出首款AI晶片,專為大型語言模型所設計,宣告正式加入自研晶片行列,不僅如此,微軟持續深化與輝達合作,強強聯手推出「AI代工服務」。
-
OpenAI阿特曼開除不到1天 傳微軟施壓回歸
2023-11-20 12:38:47OpenAI執行長奧特曼,17日遭解職,但開除不到一天,就傳出OpenAI董事會商議讓阿特曼回歸。外媒報導指出,知情人士表示,主要投資者包括微軟、老虎全球管理和興盛資本,正向OpenAI施壓要讓阿特曼回歸。不過阿特曼可能會要求公司治理方式改變,甚至撤換部分董事會成員;如果沒有回任,可能跟離職的戰友,共同成立新的AI研發公司。外媒報導,19號,阿特曼現身在Open AI總部,與暫代執行長職務的穆拉蒂開會。外界推估,開會內容可能與要求阿特曼重回公司復職有關。
-
微軟自研AI晶片Maia問世 台積電5奈米操刀
2023-11-18 15:12:35AI軍備競賽正式開打,微軟推出首款AI晶片,專為大型語言模型所設計,宣告正式加入自研晶片行列。
-
AI變現?微軟Copilot本週上線 企業版11月登場
2023-09-26 17:25:04 -
OpenAI執行長確定換人!Twitch前CEO希爾接任
2023-11-20 19:49:01OpenAI執行長阿特曼17日遭解職,19日傳出董事會商議邀請回歸。不過談判破局,董事會決議由Twitch前執行長希爾擔任OpenAI臨時執行長。
-
科技巨頭吹自研AI晶片風 台積電大贏家
2023-11-21 19:19:34輝達新一代AI晶片推出,微軟、亞馬遜、谷歌等六大科技業者,也投入自主研發AI晶片,外包訂單幾乎由晶圓代工龍頭台積電包辦,3奈米製程,明年下半年逐步成為業界主流,也讓2024年台廠業績有機會樂觀看待。
-
阿特曼回OpenAI破局 Twitch前CEO希爾接任
2023-11-20 17:10:08OpenAI執行長阿特曼17日遭解職,19日傳出董事會商議回歸。不過談判確定破局,董事會決議由Twitch前執行長希爾擔任OpenAI臨時執行長。
-
30年來首改版! 微軟在鍵盤加入「AI按鍵」
2024-01-05 17:51:22微軟稍早在官方落格宣布,Windows鍵盤將迎接自1994年來最大的變化,微軟決定在鍵盤中加入「啟動」AI Copilot專用按鍵,也是這30年來鍵盤布局首次出現改變。外界認為,2024為AI電腦年,微軟將在CES大會上,展示Win 11及Copilot鍵盤電腦,積極布局旗下AI產品生態系。
-
卡麥隆憂AI武器化風險 再次發出AI威脅警告
2023-07-24 19:45:40曾執導《終結者》《鐵達尼號》和《阿凡達》的好萊塢著名導演詹姆斯‧卡麥隆,最近也談到了人工智慧可能帶來的危害。一起來看看。
-
黃仁勳243億在台灣建AI研發中心 聘千名員工
2023-05-30 08:29:06輝達執行長黃仁勳近日訪台,台灣經濟部表示,2021年通過輝達申請人工智慧創新研發中心計畫,總經費約新台幣243億元,經濟部補助67億元,將在台灣成立AI研發中心,新聘1000名員工,也會與國內大學合作培育人才。計畫執行期間為2022年3月到2027年3月,為期5年。
-
AI成長趨勢明確!台積電CoWoS產能逐年翻倍
2023-08-17 17:17:46外資摩根大通預期,AI需求下半年持續強勁,產業趨勢明確下,台積電積極擴充CoWoS先進封裝產能,外界預估,明年底前產能擴大到至每月2.8萬片。
-
美國禁令升級版!傳華為、中芯將被獨立管制
2023-10-17 17:12:59為了防堵中共發展先進晶片,美國禁令再升級!傳出多家中國晶片設計公司,將被列入實體清單等貿易黑名單,而華為和中芯國際將可能被獨立管制。