欧美色在线视频播放 视频,国产精品亚洲精品日韩已方,日本特级婬片中文免费看,亚洲 另类 在线 欧美 制服

<td id="8pdsg"><strong id="8pdsg"></strong></td>
<mark id="8pdsg"><menu id="8pdsg"><acronym id="8pdsg"></acronym></menu></mark>
<noscript id="8pdsg"><progress id="8pdsg"></progress></noscript>

    1. 首頁 >人工智能 > 正文

    未來指導(dǎo)的增量式變壓器可同時進(jìn)行翻譯

    同步翻譯是機器翻譯的一種,在閱讀源句子時會生成輸出。它可以用于實時字幕或同聲傳譯。但是,當(dāng)前策略的計算速度較低,并且缺乏來自未來源信息的指導(dǎo)。最近提出的一種方法稱為“未來引導(dǎo)式增量變壓器”,可以克服這兩個缺點。

    它使用平均嵌入層來匯總消耗的源信息并避免費時的重新計算。通過知識提煉嵌入一些未來信息,可以增強預(yù)測能力。結(jié)果表明,與當(dāng)前使用的模型相比,訓(xùn)練速度可提高約28倍。在漢英和德英同聲翻譯任務(wù)上,翻譯質(zhì)量也得到了提高。

    同步翻譯(ST)在閱讀源句子時同步開始翻譯,并且在許多在線場景中使用。先前的wait-k策略簡潔明了,在ST中取得了良好的效果。但是,wait-k策略面臨兩個缺點:由于重新計算了隱藏狀態(tài)而導(dǎo)致的培訓(xùn)速度較慢,并且缺乏用于指導(dǎo)培訓(xùn)的未來源信息。對于較低的訓(xùn)練速度,我們提出一種具有平均嵌入層(AEL)的增量式變壓器,以加快訓(xùn)練期間隱藏狀態(tài)的計算速度。對于將來的培訓(xùn),我們建議使用傳統(tǒng)的Transformer作為增量Transformer的老師,并嘗試通過知識提煉無形地將一些將來的信息嵌入模型中。我們對漢英和德英同聲翻譯任務(wù)進(jìn)行了實驗,并與wait-k策略進(jìn)行了比較以評估該方法。我們的方法可以有效地將不同k條件下的訓(xùn)練速度平均提高約28倍,并在模型中隱式嵌入一些預(yù)測能力,從而獲得比wait-k基線更好的翻譯質(zhì)量。

    標(biāo)簽:

    免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場無關(guān)。財經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險自擔(dān)。 如有侵權(quán)請聯(lián)系刪除!