欧美色在线视频播放 视频,国产精品亚洲精品日韩已方,日本特级婬片中文免费看,亚洲 另类 在线 欧美 制服

<td id="8pdsg"><strong id="8pdsg"></strong></td>
<mark id="8pdsg"><menu id="8pdsg"><acronym id="8pdsg"></acronym></menu></mark>
<noscript id="8pdsg"><progress id="8pdsg"></progress></noscript>

    首頁(yè) >> 人工智能 >

    使用機(jī)器學(xué)習(xí)翻譯丟失的語(yǔ)言

    2021-02-09 13:50:51 來(lái)源: 用戶(hù): 

    最近的研究表明,已經(jīng)不再存在的大多數(shù)語(yǔ)言 都不再使用。數(shù)十種這些死語(yǔ)也 被認(rèn)為是丟失或“解密”的 ,也就是說(shuō),我們對(duì)它們的語(yǔ)法,詞匯或語(yǔ)法了解不足,無(wú)法真正理解其文本。

    語(yǔ)言的流失不僅僅是一種學(xué)術(shù)上的好奇心;沒(méi)有他們,我們會(huì)錯(cuò)過(guò)與講他們的人有關(guān)的一整套知識(shí)。不幸的是,它們中的大多數(shù)記錄極少,科學(xué)家無(wú)法使用Google Translate之類(lèi)的機(jī)器翻譯算法來(lái)解密它們。有些語(yǔ)言沒(méi)有經(jīng)過(guò)深入研究的“相對(duì)”語(yǔ)言可與之進(jìn)行比較,并且通常缺少諸如空格和標(biāo)點(diǎn)符號(hào)之類(lèi)的傳統(tǒng)分隔符。(為說(shuō)明起見(jiàn),想像一下用這種語(yǔ)言寫(xiě)出的外國(guó)語(yǔ)言的解釋。)

    烏加特語(yǔ)的示例。圖片來(lái)源:Rama via Wikimedia,CC-BY-SA-2.0-FR

    但是,麻省理工學(xué)院 計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)的研究人員最近在該領(lǐng)域取得了重大進(jìn)展:一種新系統(tǒng)已被證明能夠自動(dòng)解密一種丟失的語(yǔ)言,而無(wú)需對(duì)其與其他語(yǔ)言的關(guān)系有深入的了解。他們還表明,他們的系統(tǒng)本身可以確定語(yǔ)言之間的關(guān)系,并用它來(lái)證實(shí)最近的學(xué)術(shù)研究,這表明伊比利亞語(yǔ)言實(shí)際上與巴斯克語(yǔ)無(wú)關(guān)。

    該團(tuán)隊(duì)的最終目標(biāo)是使該系統(tǒng)能夠使用幾千個(gè)單詞來(lái)解密數(shù)十年來(lái)一直躲藏在語(yǔ)言學(xué)家手中的語(yǔ)言。

    該系統(tǒng)由麻省理工學(xué)院教授里賈納·巴茲萊(Regina Barzilay)牽頭,它依賴(lài)于以歷史語(yǔ)言學(xué)為基礎(chǔ)的幾種原理,例如,語(yǔ)言通常僅以某些可預(yù)測(cè)的方式發(fā)展。例如,雖然一種給定的語(yǔ)言很少添加或刪除整個(gè)聲音,但是很可能會(huì)發(fā)生某些聲音替換。母語(yǔ)中帶有“ p”的單詞可能會(huì)在其后代語(yǔ)言中變?yōu)?ldquo; b”,但是由于明顯的發(fā)音差距,變?yōu)?ldquo; k”的可能性較小。

    通過(guò)整合這些和其他語(yǔ)言限制,Barzilay和MIT博士生羅嘉明 開(kāi)發(fā)了一種解密算法 ,該算法可以處理可能的轉(zhuǎn)換的巨大空間以及輸入中引導(dǎo)信號(hào)的稀缺性。該算法學(xué)習(xí)將語(yǔ)言聲音嵌入多維空間,在該多維空間中,發(fā)音的差異反映在相應(yīng)矢量之間的距離中。這種設(shè)計(jì)使他們能夠捕獲語(yǔ)言變化的相關(guān)模式,并將其表達(dá)為計(jì)算約束。生成的模型可以將古代語(yǔ)言中的單詞進(jìn)行細(xì)分,并將其映射到相關(guān)語(yǔ)言中的對(duì)應(yīng)單詞。

    該項(xiàng)目建立在Barzilay和Luo去年寫(xiě)的一篇論文的基礎(chǔ)上, 該論文解密了Ugaritic和Linear B的死語(yǔ)言,后者以前需要數(shù)十年的時(shí)間才能被人類(lèi)解碼。但是,與該項(xiàng)目的主要區(qū)別在于,該團(tuán)隊(duì)知道這些語(yǔ)言分別與希伯來(lái)語(yǔ)和希臘語(yǔ)的早期形式有關(guān)。

    在新系統(tǒng)中,算法之間可以推斷語(yǔ)言之間的關(guān)系。這個(gè)問(wèn)題是解密中最大的挑戰(zhàn)之一。對(duì)于線(xiàn)性B,花了數(shù)十年的時(shí)間才發(fā)現(xiàn)正確的已知后代。對(duì)于伊比利亞人而言,學(xué)者們?nèi)詿o(wú)法就相關(guān)語(yǔ)言達(dá)成一致:有些人主張巴斯克語(yǔ),而另一些人則反駁了這一假設(shè),并聲稱(chēng)伊比利亞人與任何??已知語(yǔ)言均無(wú)關(guān)。

    該算法可以評(píng)估兩種語(yǔ)言之間的接近度。實(shí)際上,當(dāng)對(duì)已知語(yǔ)言進(jìn)行測(cè)試時(shí),它甚至可以準(zhǔn)確地識(shí)別語(yǔ)言族。該團(tuán)隊(duì)將他們的算法應(yīng)用于考慮了巴斯克(Basque)的伊比利亞人,以及不太可能來(lái)自羅曼史,日耳曼語(yǔ),突厥語(yǔ)和烏拉爾語(yǔ)系的候選人。盡管巴斯克語(yǔ)和拉丁語(yǔ)比其他語(yǔ)言更接近伊比利亞語(yǔ),但它們?nèi)匀幌嗖钐?,因此不能被認(rèn)為是相關(guān)的。

    在將來(lái)的工作中,該小組希望將工作擴(kuò)展到將文本與已知語(yǔ)言的相關(guān)單詞相關(guān)聯(lián)的行為之外,這種方法稱(chēng)為“基于同源的解密”。這種范例假定存在這樣一種已知的語(yǔ)言,但是以伊比利亞人為例表明,情況并非總是如此。團(tuán)隊(duì)的新方法將涉及識(shí)別單詞的語(yǔ)義,即使他們不知道如何閱讀它們。

    “例如,我們可以識(shí)別文檔中所有涉及人或地點(diǎn)的信息,然后可以根據(jù)已知的歷史證據(jù)對(duì)其進(jìn)行進(jìn)一步調(diào)查,” Barzilay說(shuō)。“這些“實(shí)體識(shí)別”方法如今已廣泛用于各種文本處理應(yīng)用程序中,并且具有很高的準(zhǔn)確性,但是關(guān)鍵的研究問(wèn)題是,在沒(méi)有任何古代語(yǔ)言培訓(xùn)數(shù)據(jù)的情況下,該任務(wù)是否可行?”

      免責(zé)聲明:本文由用戶(hù)上傳,與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!

     
    分享:
    最新文章
    站長(zhǎng)推薦