開放生成式人工智能
生成式人工智能具有巨大的潛力,可以徹底改變商業(yè)模式、創(chuàng)造新機(jī)遇并提高員工的工作效率。據(jù)麥肯錫稱,超過四分之一的公司領(lǐng)導(dǎo)者表示,生成式人工智能是董事會(huì)層面的議程項(xiàng)目,而 79% 的受訪者已經(jīng)使用過生成式人工智能。
這些技術(shù)已經(jīng)影響到了軟件行業(yè)——IDC 發(fā)現(xiàn),40% 的 IT 高管認(rèn)為生成式 AI“將使我們能夠創(chuàng)建更具創(chuàng)新性的軟件”,而 GBK Collective 估計(jì),78% 的公司預(yù)計(jì)將在未來三到五年內(nèi)使用 AI 進(jìn)行軟件開發(fā)。根據(jù)游戲開發(fā)者大會(huì)的研究,大約一半的視頻游戲公司已經(jīng)在其工作流程中使用了生成式 AI。
所有這些信號(hào)都表明,生成式人工智能的使用正在增長(zhǎng)。然而,擁有適當(dāng)技能來自己組裝生成式人工智能應(yīng)用程序的開發(fā)人員數(shù)量有限。對(duì)于想要構(gòu)建和運(yùn)營(yíng)自己的生成式人工智能服務(wù)而不是使用提供商服務(wù)的企業(yè)來說,集成對(duì)于更有效地利用公司數(shù)據(jù)至關(guān)重要。
對(duì)于許多公司來說,生成式人工智能與大型語言模型 (LLM) 和ChatGPT等服務(wù)密不可分。這些工具接受文本輸入,將其轉(zhuǎn)換為服務(wù)可以理解的語義查詢,然后根據(jù)其訓(xùn)練數(shù)據(jù)提供響應(yīng)。對(duì)于簡(jiǎn)單的查詢,ChatGPT響應(yīng)就足夠了。但對(duì)于企業(yè)來說,這種級(jí)別的一般知識(shí)還不夠。
為了解決這個(gè)問題,需要使用像檢索增強(qiáng)生成 (RAG) 這樣的技術(shù)。RAG 涵蓋了公司如何獲取數(shù)據(jù)、使其可供查詢,然后將該信息傳遞給 LLM 以供納入。這些數(shù)據(jù)可以以多種格式存在,從公司知識(shí)庫(kù)或產(chǎn)品目錄到PDF或其他文檔中的文本。必須收集數(shù)據(jù)并將其轉(zhuǎn)換為向量,將數(shù)據(jù)編碼為保留語義信息和關(guān)系的數(shù)值。
此過程涉及一個(gè)稱為分塊的過程 - 將文本拆分成離散單元,然后可以用向量表示。這里有幾種可行的方法,從查看單個(gè)單詞到句子或段落。您使用的數(shù)據(jù)塊越小,占用的容量和成本就越大;相反,每個(gè)塊越大,您最終得到的數(shù)據(jù)就越不準(zhǔn)確。數(shù)據(jù)分塊仍然是一個(gè)非常新的領(lǐng)域,最佳實(shí)踐仍在開發(fā)中,因此您可能需要嘗試您的方法才能獲得最佳結(jié)果。
標(biāo)簽: