神經(jīng)機器翻譯如何革新軟件開發(fā)
今天,我們將討論神經(jīng)機器翻譯(NMT)以及它如何在軟件本地化中發(fā)揮關鍵作用。如果您對NMT和后期編輯翻譯如何在確保質(zhì)量的同時加快軟件本地化過程感興趣,請繼續(xù)閱讀!
什么是神經(jīng)機器翻譯(NMT)?
但在我們繼續(xù)討論之前,讓我們定義一下神經(jīng)機器翻譯(NMT)。與之前的機器翻譯不同,NMT在神經(jīng)網(wǎng)絡下運行在翻譯文本時使用人工智能。神經(jīng)網(wǎng)絡模仿人腦的方式。神經(jīng)元進行機器學習,并快速翻譯幾種語言,因為每個網(wǎng)絡用于不同的過程。這使得翻譯過程非常高效。
過去的機器翻譯是在基于規(guī)則或基于統(tǒng)計的編程下運行的,所以當它預測翻譯句子的序列時,輸出會更加嚴格,包含更多的不準確性。NMT系統(tǒng)不會遇到同樣的問題,因為它們可以被訓練來處理人工翻譯的大量數(shù)據(jù)。這是原因之一營銷人員使用大數(shù)據(jù)來幫助翻譯內(nèi)容.
由于NMT是如此先進,許多人擔心他們會取代人類翻譯。然而,像任何技術一樣,它們并不完美。據(jù)報道NMT“幻覺”因為即使翻譯的文本聽起來很自然,它也可能在其補充的信息中出錯。
例如,在翻譯文本中,由于NMT如何處理來自互聯(lián)網(wǎng)或以前關于該主題的會議的數(shù)據(jù),它包含錯誤的日期或不準確的信息。這就是為什么科學家稱這種現(xiàn)象為“幻覺”。這也是為什么翻譯行業(yè)的許多專家建議在您使用NMT翻譯或本地化內(nèi)容時加入后期編輯翻譯。
為什么軟件本地化對于任何尋求進入新市場的軟件公司都很重要
不管很多人怎么想,互聯(lián)網(wǎng)的語言不是英語。多年來,隨著越來越多的市場出現(xiàn)在互聯(lián)網(wǎng)上,由于我們?nèi)蚧蛿?shù)字化的經(jīng)濟,互聯(lián)網(wǎng)變得更加多語言化。
正因為如此,各行各業(yè)的許多公司已經(jīng)開始讓他們的業(yè)務更多地使用幾種語言,這并不奇怪。我們列出了一些支持這些說法的數(shù)據(jù)和信息:
到處72億人口中有3.6億人以英語為母語,僅化妝世界人口的5%。(Twistedsifter)
76%的在線買家說他們更喜歡用母語閱讀產(chǎn)品信息。(CSA研究)
據(jù)報道,日本用戶不太可能接觸非日語內(nèi)容七分之一的人說他們在瀏覽互聯(lián)網(wǎng)時每周都會使用在線翻譯工具。(數(shù)據(jù)報告)
關于十分之六的哥倫比亞用戶表示他們每周都會使用翻譯工具據(jù)報道,拉丁美洲人在瀏覽互聯(lián)網(wǎng)時可能會使用在線翻譯工具。(數(shù)據(jù)報告)
網(wǎng)上找到的中文內(nèi)容只是虛構(gòu)的2.8%,盡管中國有大約9.8899億互聯(lián)網(wǎng)用戶。(翻譯人員)
如果您要將您的軟件翻譯或本地化到這四個國家美國、德國、中國和日本將讓你的企業(yè)獲得全球經(jīng)濟銷售額的50%,增加80%的全球購買力。(翻譯)
盡管人口的英語水平很高,80%的瑞典網(wǎng)上購物者仍然喜歡用瑞典語購物,而不是英語。(Oneskyapp)
由于這個原因,許多軟件公司投資于本地化他們的軟件和業(yè)務,因為它提供了機會。
什么是軟件本地化?它是針對目標市場調(diào)整應用程序或軟件的用戶界面。這不僅僅是翻譯內(nèi)容,而是讓它看起來自然,就像是以英語為母語的人創(chuàng)作的。這是通過根據(jù)目標用戶的文化和語言偏好創(chuàng)建內(nèi)容來實現(xiàn)的。
在過去,軟件本地化需要花費大量的時間來確保其質(zhì)量。即使公司開始使用機器翻譯,僅僅依靠它也不是一個選擇,因為它的輸出包含一些不準確和誤譯。
但隨著NMT的崛起,許多人正在尋求在軟件行業(yè)使用這種新技術來快速本地化軟件,并確保其人工智能程序的質(zhì)量。這些進步的發(fā)展導致了在機器翻譯后期編輯方面教育和培訓翻譯人員的興起,我們將在本文的后面討論。
翻譯人員如何使用NMT加速軟件本地化
由于其先進的神經(jīng)網(wǎng)絡系統(tǒng),許多軟件公司使用神經(jīng)機器翻譯,因為它們可以為專門的行業(yè)和市場研究情緒分析量身定制。你可以使用免費的神經(jīng)翻譯引擎,比如谷歌翻譯、微軟翻譯和DeepL Pro。由NMT翻譯后,你需要后期編輯檢查和編輯翻譯文本中的任何不一致和錯誤。
這個過程被稱為機器翻譯后期編輯(MTPE)。它是指內(nèi)容首先由機器翻譯引擎翻譯,然后由人類翻譯或語言學家編輯。一些人認為這是翻譯行業(yè)日益增長的需求的“電子人解決方案”,因為MTPE融合了人類技能和機器效率,以最快和最具成本效益的方式實現(xiàn)高質(zhì)量的翻譯。
當您使用神經(jīng)機器翻譯器時,企業(yè)通常使用兩種形式的MTPE:
輕度后期編輯–這意味著編輯進行校對并修正語法錯誤。文檔在最低級別進行編輯。它們通常是供內(nèi)部使用的,或者是短期使用的,這就是為什么它是急需的。
全面后期編輯–編輯進行更徹底的校對和編輯,以確保翻譯文本的準確性。文字看起來更自然,語氣也更有凝聚力。它還考慮了文本的文化和語言方面,這在機器翻譯時經(jīng)常會丟失。對于軟件本地化,我們建議您進行全文編輯,因為本地化的內(nèi)容必須盡可能自然。當你本地化你的軟件時,在MTPE使用NMT時,有四件事要注意:
選擇合適的NMT發(fā)動機使用。
訓練你的NMT引擎,讓它能夠處理你要翻譯或本地化的內(nèi)容。
雇用本地翻譯進行后期編輯機器翻譯。
預編輯源文本并簡化它,因為當文本不復雜時,NMT效果更好。
關于軟件本地化你應該知道的7個技巧
在我們的研究中,我們列出了本地化軟件時必須考慮的七件事。
1.國際化編碼至關重要
內(nèi)部化是當你去掉一些與軟件相關的元素,比如地點或語言。它包括通過檢查您的應用程序框架來考慮i18n代碼,以查看本地化軟件是否支持它,從而使軟件適應您的目標市場。
2.使用動態(tài)用戶界面擴展
根據(jù)您的目標語言,您可能需要改變UI的格式,使文本從右到左或從上到下可讀。使用動態(tài)用戶界面擴展可以確保文本適合您的iOS,無論使用何種語言。
3.準備字符串提取和資源文件程序
在將它們重新插入代碼之前,您需要進行字符串提取和本地化。Unicode有助于對語言的腳本進行編碼。提取字符串后,您可以通過NMT引擎對其進行處理,并讓本地翻譯人員對其進行本地化和后期編輯。只需確保當您提取字符串時,它位于與您使用的本地化管理軟件兼容的資源文件中。
4.試用本地化管理工具
如果您已經(jīng)決定自己本地化您的軟件,我們建議您尋找您可以使用的本地化管理工具和平臺,這樣它將更容易管理,并且您可以更好地實現(xiàn)您的敏捷軟件開發(fā)策略。
以下是您可以使用的著名本地化管理平臺列表:
洛卡利斯
自作聰明
克勞丁
定位
智能貓
Wordbee
詩歌編輯
5.進行本地化測試
就像使用工具和雇傭?qū)I(yè)人員對你的軟件進行質(zhì)量保證一樣,你也需要做本地化測試。
這意味著您需要做以下事情來確保本地化軟件的質(zhì)量:
做驗證測試,嘗試你的軟件的基礎。
計劃您的測試,以及您將如何根據(jù)您收集到的信息來處理您的分析。
我們建議您進行初始測試階段,評估您的軟件的特定用例,并進行回歸測試以確定它是否有任何錯誤。
完成所有這些后,您將需要創(chuàng)建一個報告來記錄并為將來的項目提供參考。
6. 擁有本地用戶測試員
您的目標用戶是您是否成功本地化軟件的最佳評判者。正因為如此,在你發(fā)布你的軟件之前,你要讓本地用戶測試它。作為你的目標地區(qū)的樣本大小將提供對你的軟件的用戶界面和UX的洞察,比如工作的區(qū)域和需要更多改進的部分。
你得到的反饋會讓你更好地了解你的目標用戶,以及你的業(yè)務或軟件如何更好地幫助他們。
7.聘請NMT軟件本地化專業(yè)人士
如果你不能對你的軟件進行本地化,你可以雇傭軟件本地化和NMT方面的專家。外包任務軟件本地化的風險似乎很大,但這是保證其質(zhì)量的最有效的方法之一。您可能沒有時間或資源獨自完成所有的事情,所以將任務委托給MTPE的軟件本地化專業(yè)機構(gòu)是您的最佳選擇。
當選擇您將外包軟件本地化的代理或團隊時:
檢查他們的證件。比如他們做軟件本地化做了多少年?他們是否通過ISO認證提供MTPE服務?
提前計劃。創(chuàng)建一個策略,投入時間和金錢來本地化你的軟件項目。
分配外包名單。讓你公司的人被指派與你的外包合作伙伴一起工作,并與他們一起工作,以確保你和你的合作伙伴之間沒有溝通障礙。
有管理程序。這意味著創(chuàng)建一種有效的方法來收集和發(fā)送反饋,以確保項目不會被延遲,并且軟件被正確地本地化。
最后的想法
對于任何尋求國際擴張的軟件公司來說,他們必須提供一種以上語言的軟件。有了NMT,翻譯和本地化內(nèi)容的速度比以往任何時候都快。然而,像任何技術一樣,它并不完美。
通過在軟件本地化中實施MTPE流程,您可以充分利用NMT解決方案和本地翻譯人員的專業(yè)知識。希望本文提供的提示和建議在您開始本地化軟件時會有所幫助。
- 上一篇
什么是生成式AI?
生殖人工智能最近鬧得沸沸揚揚。該術語用于指代任何類型的人工智能系統(tǒng),這些系統(tǒng)依賴于無監(jiān)督或半監(jiān)督的學習算法來創(chuàng)建新的數(shù)字圖像、視頻、音頻和文本。根據(jù)麻省理工學院的說法,生成式人工智能是過去十年人工智能領域最有前途的進展之一。
- 下一篇
了解邊緣計算及其對當今企業(yè)的重要性
到 2025年,邊緣計算市場預計將達到 2740 億美元,主要集中在物聯(lián)網(wǎng)、公共云服務以及專利和標準等領域。大部分貢獻都得到了將數(shù)據(jù)中心轉(zhuǎn)移到云端的企業(yè)的支持。這使企業(yè)能夠從