關(guān)注AI丨微軟首創(chuàng)中對英機(jī)器翻譯

                時間:2018年04月08日信息來源:不詳 點(diǎn)擊: 【字體:

                        隨著 AI 的發(fā)展現(xiàn)狀及趨勢,語言的翻譯也越來越成熟,口語的翻譯多不是問題,但不同語系的文字的翻譯,尤其像中文翻譯成英文,多年來一直是一大挑戰(zhàn)。微軟致力這一領(lǐng)域的研究有年樂凱二膠,以先進(jìn)的神經(jīng)網(wǎng)絡(luò)深層機(jī)器學(xué)習(xí),日前宣布了簡體中文自動翻譯英文的系統(tǒng),并在網(wǎng)絡(luò)開放 250 字的實驗。我知道了以后,就迫不急待的用了兩段文字試驗。
                        下面是第一段中翻英的對照結(jié)果。文稿是去年初寫給北京《數(shù)字印刷》雜志最后一篇告別文稿的第一段。
                        對我這樣年紀(jì)的人來說,時間過得越來越快書刊印刷,不知不覺已經(jīng)在《數(shù)字印刷》寫七年了。每篇雖然僅有一頁,莫不盡力簡述國外的技術(shù)與市場概念。出版與印刷是文化的延伸,國外的營運(yùn)方式未必適用國內(nèi)的環(huán)境,但如果能帶給國內(nèi)業(yè)界朋友對照參考,任務(wù)就算有所交代了。
                        For people my age陜西北人, time is getting faster and quicker, unknowingly has been in the “digital printing” written for seven years. Each article, although only one page,does not try to describe the foreign technology and market concepts. Publishing and printing is the extension of culture, foreign operations may not be applicable to the domestic environment北人集團(tuán), but if you can bring to the domestic industry friend reference, the task even if there is an account. 曼羅蘭
                        上一段翻譯的還算得體,但有一個瑕疵,就是中文的“莫不”兩個反意字的正面意思,翻譯成 “does not” 一個反意字包裝貿(mào)易,意思正好相反。最后一句“任務(wù)就算有所交代了”,翻譯的也很些勉強(qiáng)。
                        我選用這一段話的用意,在語句略帶感性,而微軟系統(tǒng)是以新聞類敘述語句為基礎(chǔ),所以試驗中出現(xiàn)狀況并不意外。下面一段也是我以前在同一刊物寫的文稿色序,是直接的敘述,類似新聞?wù)Z句,翻譯的就比第一段通順。
                        紙本書復(fù)蘇 的另一原因,是電子書售價的提高,電子書與紙本書同樣價格顯影,讀者就自然舍電子而取紙本了。去年出版社與亞馬遜協(xié)商的結(jié)果,電子書可以由出版社自行定價,為了推銷紙本書故意抬高電子書價格,使紙本書的銷售增加。亞馬遜更進(jìn)一步,把一些大眾化的紙本書大幅降價乳品包裝,低于電子書,致2015前五個月平裝紙本書的銷售,增加了8.4%。
                        Another reason for the revival of the paper book is the increase in the price of E-books, the same prices for e-books and paper books. Last year, publishers and Amazon negotiated the results紙品包裝, E-books can be priced by the publishers themselves, in order to promote the paper book deliberately raise the price of e-books, so that the sales of paper books increased. Amazon went a step further by slashing some popular paper prices below E-books, adding 8.4% to the sales of paperback books for the first five months of 2015. 收購
                        這一系統(tǒng)的研發(fā),是從網(wǎng)絡(luò)報紙擷取 2000 句語句作為樣本包裝印刷,經(jīng)反復(fù)系統(tǒng)測試,把翻譯出來的結(jié)果與人翻譯的結(jié)果比較,同時也邀請雙語專家核對翻譯的結(jié)果,所以新聞性的敘述文稿,目前應(yīng)能通順的翻譯。公布的研究報告說方正,翻譯出錯的機(jī)率平均在 5%,不正確用詞、不正確文法、缺字、名稱混淆,是四種主要出錯的地方,所以系統(tǒng)仍有改善的空間。
                        AI 用在很多地方都超越人的智慧或能力,但說機(jī)器翻譯的比人更好愛克發(fā),在邏輯上有些說不通,如果翻譯的與人同樣的好,所謂 Human Parity,就應(yīng)是達(dá)到目標(biāo),所以翻譯的好與不好還是由人來評定。微軟為此聘用了中英雙語專家作裁判耗材,把翻譯的結(jié)果與原文在語意上比較,打一個分?jǐn)?shù),然后把這些分?jǐn)?shù)統(tǒng)計處理,把在統(tǒng)計上沒有顯著差異的,認(rèn)為是跟人的翻譯相等。但專家與專家不同包裝材料,打分?jǐn)?shù)就像批改作文,所以同樣程序重復(fù)多次,減少人為的偏差。
                        中文計算機(jī)的發(fā)展,幾十年一路走來,從輸入法的百家爭鳴飲料包裝,到單筆字型在計算機(jī)畫面顯示、在印字機(jī)印出,發(fā)展到多種精美印刷字體,改變了出版與印刷的生態(tài)。計算機(jī)進(jìn)一步辨識字型、辨識語音,減少人力打字輸入,暢通人與計算機(jī)互動失業(yè),中文計算機(jī)處理遂進(jìn)入新的境界。但中文計算機(jī)處理的最高境界,語意辨識,懂得一個詞匯、一句話的內(nèi)涵意思,形同文化與技術(shù)的復(fù)雜結(jié)合,最為困難乳品包裝,而微軟的中對英的機(jī)器翻譯,卻克服了這一困難。 愛普生
                        微軟的中對英機(jī)器翻譯系統(tǒng),是微軟的 AI 研究中心,特別是結(jié)合亞洲研究中心的一群中國專家,共同研發(fā)的成果。微軟技術(shù)院士黃學(xué)東說科印報告,雖然此次突破意義非凡,但研究人員也提醒大家,這并不代表人類已經(jīng)完全解決了機(jī)器翻譯的問題,只能說明我們離終極目標(biāo)又更近了一步。話雖如此,這仍是了不起的成就標(biāo)準(zhǔn)及認(rèn)證,意義深遠(yuǎn)自不待言。
                (作者:佚名 編輯:昆明印刷)
                網(wǎng)友評論
                亚洲高清无码东京热,亚洲高清无码中文成人在线,无码av免费一道本在线,国产很黄很色又免费的视频