欧美色在线视频播放 视频,国产精品亚洲精品日韩已方,日本特级婬片中文免费看,亚洲 另类 在线 欧美 制服

<td id="8pdsg"><strong id="8pdsg"></strong></td>
<mark id="8pdsg"><menu id="8pdsg"><acronym id="8pdsg"></acronym></menu></mark>
<noscript id="8pdsg"><progress id="8pdsg"></progress></noscript>

    首頁 >> 人工智能 >

    從圖像的文本描述推斷空間關(guān)系

    2021-10-28 16:25:55 來源: 用戶: 

    從文本描述自動(dòng)生成圖像在藝術(shù)生成或計(jì)算機(jī)輔助設(shè)計(jì)等領(lǐng)域?qū)⑹且豁?xiàng)有用的任務(wù)。為了生成逼真的圖像,有必要推斷實(shí)體之間的空間關(guān)系。

    當(dāng)前數(shù)據(jù)集包括與圖片中的邊界框相關(guān)聯(lián)的主題、對(duì)象和關(guān)系三元組。但是,它們需要手動(dòng)注釋。因此,最近在arXiv.org上進(jìn)行的一項(xiàng)研究的作者提出了一種從圖像的文本描述中提取空間關(guān)系的方法。

    創(chuàng)建了一個(gè)公開可用的數(shù)據(jù)集,該數(shù)據(jù)集包含成對(duì)的圖像和標(biāo)題以及描述中的標(biāo)記以及主題和對(duì)象的邊界框。該方法可以成功地從標(biāo)題中推斷出相對(duì)于給定主題的對(duì)象的大小和位置。它比使用手動(dòng)生成的三元組的系統(tǒng)更好地定位對(duì)象。

    從文本描述生成圖像需要一定水平的語言理解和關(guān)于被描述的物理實(shí)體的空間關(guān)系的常識(shí)知識(shí)。在這項(xiàng)工作中,我們專注于推斷實(shí)體之間的空間關(guān)系,這是基于文本組成場(chǎng)景過程中的關(guān)鍵步驟。更具體地說,給定一個(gè)標(biāo)題,其中包含對(duì)主題的提及以及該主題的邊界框的位置和大小,我們的目標(biāo)是預(yù)測(cè)標(biāo)題中提到的對(duì)象的位置和大小。以前的工作沒有使用標(biāo)題文本信息,而是手動(dòng)提供的主題和對(duì)象之間的關(guān)系。事實(shí)上,使用的評(píng)估數(shù)據(jù)集包含手動(dòng)注釋的本體三元組但沒有標(biāo)題,這使得該練習(xí)不切實(shí)際:需要手動(dòng)步驟;并且系統(tǒng)沒有利用字幕中更豐富的信息。在這里,我們提出了一個(gè)使用完整字幕和字幕關(guān)系(REC-COCO)的系統(tǒng),這是一個(gè)源自MS-COCO的數(shù)據(jù)集,可以直接評(píng)估來自字幕的空間關(guān)系推理。我們的實(shí)驗(yàn)表明:(1)可以直接從標(biāo)題中推斷出相對(duì)于給定主題的對(duì)象的大小和位置;(2)使用全文允許比使用手動(dòng)注釋關(guān)系更好地放置對(duì)象。我們的工作為系統(tǒng)鋪平了道路,在給定標(biāo)題的情況下,決定需要描繪哪些實(shí)體以及它們各自的位置和大小,以便生成最終圖像。一個(gè)源自MS-COCO的數(shù)據(jù)集,它允許直接評(píng)估來自字幕的空間關(guān)系推理。我們的實(shí)驗(yàn)表明:(1)可以直接從標(biāo)題中推斷出相對(duì)于給定主題的對(duì)象的大小和位置;(2)使用全文允許比使用手動(dòng)注釋關(guān)系更好地放置對(duì)象。我們的工作為系統(tǒng)鋪平了道路,在給定標(biāo)題的情況下,決定需要描繪哪些實(shí)體及其各自的位置和大小,然后生成最終圖像。一個(gè)源自MS-COCO的數(shù)據(jù)集,它允許直接評(píng)估來自字幕的空間關(guān)系推理。我們的實(shí)驗(yàn)表明:(1)可以直接從標(biāo)題中推斷出相對(duì)于給定主題的對(duì)象的大小和位置;(2)使用全文允許比使用手動(dòng)注釋關(guān)系更好地放置對(duì)象。我們的工作為系統(tǒng)鋪平了道路,在給定標(biāo)題的情況下,決定需要描繪哪些實(shí)體以及它們各自的位置和大小,以便生成最終圖像。(2)使用全文允許比使用手動(dòng)注釋關(guān)系更好地放置對(duì)象。我們的工作為系統(tǒng)鋪平了道路,在給定標(biāo)題的情況下,決定需要描繪哪些實(shí)體及其各自的位置和大小,然后生成最終圖像。(2)使用全文允許比使用手動(dòng)注釋關(guān)系更好地放置對(duì)象。我們的工作為系統(tǒng)鋪平了道路,在給定標(biāo)題的情況下,決定需要描繪哪些實(shí)體及其各自的位置和大小,然后生成最終圖像。

      免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!

     
    分享:
    最新文章
    站長(zhǎng)推薦