開放生成式人工智能
生成式人工智能具有巨大的潛力,可以徹底改變商業(yè)模式、創(chuàng)造新機遇并提高員工的工作效率。據(jù)麥肯錫稱,超過四分之一的公司領(lǐng)導者表示,生成式人工智能是董事會層面的議程項目,而 79% 的受訪者已經(jīng)使用過生成式人工智能。
這些技術(shù)已經(jīng)影響到了軟件行業(yè)——IDC 發(fā)現(xiàn),40% 的 IT 高管認為生成式 AI“將使我們能夠創(chuàng)建更具創(chuàng)新性的軟件”,而 GBK Collective 估計,78% 的公司預計將在未來三到五年內(nèi)使用 AI 進行軟件開發(fā)。根據(jù)游戲開發(fā)者大會的研究,大約一半的視頻游戲公司已經(jīng)在其工作流程中使用了生成式 AI。
所有這些信號都表明,生成式人工智能的使用正在增長。然而,擁有適當技能來自己組裝生成式人工智能應用程序的開發(fā)人員數(shù)量有限。對于想要構(gòu)建和運營自己的生成式人工智能服務而不是使用提供商服務的企業(yè)來說,集成對于更有效地利用公司數(shù)據(jù)至關(guān)重要。
對于許多公司來說,生成式人工智能與大型語言模型 (LLM) 和ChatGPT等服務密不可分。這些工具接受文本輸入,將其轉(zhuǎn)換為服務可以理解的語義查詢,然后根據(jù)其訓練數(shù)據(jù)提供響應。對于簡單的查詢,ChatGPT響應就足夠了。但對于企業(yè)來說,這種級別的一般知識還不夠。
為了解決這個問題,需要使用像檢索增強生成 (RAG) 這樣的技術(shù)。RAG 涵蓋了公司如何獲取數(shù)據(jù)、使其可供查詢,然后將該信息傳遞給 LLM 以供納入。這些數(shù)據(jù)可以以多種格式存在,從公司知識庫或產(chǎn)品目錄到PDF或其他文檔中的文本。必須收集數(shù)據(jù)并將其轉(zhuǎn)換為向量,將數(shù)據(jù)編碼為保留語義信息和關(guān)系的數(shù)值。
此過程涉及一個稱為分塊的過程 - 將文本拆分成離散單元,然后可以用向量表示。這里有幾種可行的方法,從查看單個單詞到句子或段落。您使用的數(shù)據(jù)塊越小,占用的容量和成本就越大;相反,每個塊越大,您最終得到的數(shù)據(jù)就越不準確。數(shù)據(jù)分塊仍然是一個非常新的領(lǐng)域,最佳實踐仍在開發(fā)中,因此您可能需要嘗試您的方法才能獲得最佳結(jié)果。
標簽: