欧美色在线视频播放 视频,国产精品亚洲精品日韩已方,日本特级婬片中文免费看,亚洲 另类 在线 欧美 制服

<td id="8pdsg"><strong id="8pdsg"></strong></td>
<mark id="8pdsg"><menu id="8pdsg"><acronym id="8pdsg"></acronym></menu></mark>
<noscript id="8pdsg"><progress id="8pdsg"></progress></noscript>

    首頁(yè) >> 人工智能 >

    具有自適應(yīng)深度學(xué)習(xí)的交互式表格提取系統(tǒng)

    2021-10-20 16:39:27 來(lái)源: 用戶: 

    從 PDF 或圖像文檔中提取諸如表格之類的復(fù)雜結(jié)構(gòu)是一項(xiàng)艱巨的任務(wù)。當(dāng)前的系統(tǒng)無(wú)法處理跨不同文檔類型和來(lái)源的現(xiàn)有表格格式多樣性。因此,最近的一篇論文建議在用戶標(biāo)記的示例上微調(diào)表提取模型。

    首先,深度學(xué)習(xí)模型提取表結(jié)構(gòu)。提供了一些針對(duì)不同文檔類型進(jìn)行預(yù)訓(xùn)練的基礎(chǔ)模型權(quán)重供用戶選擇。然后,用戶會(huì)獲得有關(guān)要標(biāo)記哪些頁(yè)面的建議。因此,所需的標(biāo)記數(shù)據(jù)的大小被最小化。

    用戶可以修改表格并提交頁(yè)面進(jìn)行微調(diào)。定制的模型適用于整個(gè)文本集合。某些組件(如表格邊框)的標(biāo)簽會(huì)自動(dòng)改善其他組件(如單元格邊框)的結(jié)果。該系統(tǒng)允許根據(jù)個(gè)人需求和期望調(diào)整表格。

    從 PDF 和圖像文檔中提取表格是現(xiàn)實(shí)世界中無(wú)處不在的任務(wù)。由于(1)表格樣式多種多樣,(2)缺乏代表這種多樣性的訓(xùn)練數(shù)據(jù)以及(3)表格固有的模糊性和主觀性,使用單個(gè)開箱即用模型難以實(shí)現(xiàn)完美的提取質(zhì)量最終用戶之間的定義。同時(shí),由于注釋表數(shù)據(jù)的昂貴性質(zhì),從頭開始構(gòu)建自定義模型可能很困難。我們?cè)噲D通過(guò) TableLab 解決這些挑戰(zhàn),通過(guò)提供一個(gè)系統(tǒng),用戶和模型可以無(wú)縫協(xié)作,以快速定制高質(zhì)量的提取模型,并為用戶的文檔集合提供幾個(gè)帶標(biāo)簽的示例,其中包含帶有表格的頁(yè)面。

    給定一個(gè)輸入文檔集合,TableLab 首先通過(guò)對(duì)提取模型中的嵌入進(jìn)行聚類來(lái)檢測(cè)具有相似結(jié)構(gòu)(模板)的表。文檔集合通常包含使用有限的模板集或類似結(jié)構(gòu)創(chuàng)建的表格。然后它選擇一些已經(jīng)使用預(yù)訓(xùn)練的基礎(chǔ)深度學(xué)習(xí)模型提取的代表性表格示例。通過(guò)易于使用的用戶界面,用戶可以對(duì)這些選擇提供反饋,而不必識(shí)別每個(gè)錯(cuò)誤。然后,TableLab 應(yīng)用此類反饋對(duì)預(yù)訓(xùn)練模型進(jìn)行微調(diào),并將微調(diào)模型的結(jié)果返回給用戶。用戶可以選擇迭代地重復(fù)這個(gè)過(guò)程,直到獲得一個(gè)性能令人滿意的定制模型。文檔集合通常包含使用有限的模板集或類似結(jié)構(gòu)創(chuàng)建的表格。

    然后它選擇一些已經(jīng)使用預(yù)訓(xùn)練的基礎(chǔ)深度學(xué)習(xí)模型提取的代表性表格示例。通過(guò)易于使用的用戶界面,用戶可以對(duì)這些選擇提供反饋,而不必識(shí)別每個(gè)錯(cuò)誤。然后,TableLab 應(yīng)用此類反饋對(duì)預(yù)訓(xùn)練模型進(jìn)行微調(diào),并將微調(diào)模型的結(jié)果返回給用戶。用戶可以選擇迭代地重復(fù)這個(gè)過(guò)程,直到獲得一個(gè)性能令人滿意的定制模型。

    文檔集合通常包含使用有限的模板集或類似結(jié)構(gòu)創(chuàng)建的表格。然后它選擇一些已經(jīng)使用預(yù)訓(xùn)練的基礎(chǔ)深度學(xué)習(xí)模型提取的代表性表格示例。通過(guò)易于使用的用戶界面,用戶可以對(duì)這些選擇提供反饋,而不必識(shí)別每個(gè)錯(cuò)誤。然后,TableLab 應(yīng)用此類反饋對(duì)預(yù)訓(xùn)練模型進(jìn)行微調(diào),并將微調(diào)模型的結(jié)果返回給用戶。用戶可以選擇迭代地重復(fù)這個(gè)過(guò)程,直到獲得一個(gè)性能令人滿意的定制模型。

    用戶對(duì)這些選擇提供反饋,而不必識(shí)別每一個(gè)錯(cuò)誤。然后,TableLab 應(yīng)用此類反饋對(duì)預(yù)訓(xùn)練模型進(jìn)行微調(diào),并將微調(diào)模型的結(jié)果返回給用戶。用戶可以選擇迭代地重復(fù)這個(gè)過(guò)程,直到獲得一個(gè)性能令人滿意的定制模型。用戶對(duì)這些選擇提供反饋,而不必識(shí)別每一個(gè)錯(cuò)誤。然后,TableLab 應(yīng)用此類反饋對(duì)預(yù)訓(xùn)練模型進(jìn)行微調(diào),并將微調(diào)模型的結(jié)果返回給用戶。用戶可以選擇迭代地重復(fù)這個(gè)過(guò)程,直到獲得一個(gè)性能令人滿意的定制模型。

      免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!

     
    分享:
    最新文章
    站長(zhǎng)推薦