ChatGPT的Strawberry更新可以讓聊天機(jī)器人自行進(jìn)行研究
ChatGPT是我最常用的生成式AI聊天機(jī)器人,而且我碰巧也為Plus訂閱付費(fèi),盡管免費(fèi)套餐可以讓我訪問聊天機(jī)器人的大部分功能。我還碰巧使用了GPT-4o,這是OpenAI最新、最好的ChatGPT模型。但我不能說我對(duì)GPT-4o能為我做的事情完全滿意,我迫不及待地希望OpenAI能修復(fù)它。
我最討厭GPT-4o的地方是它產(chǎn)生反應(yīng)的速度。這些反應(yīng)可能是錯(cuò)誤的,需要糾正。我希望它能慢一點(diǎn),推理一下。
當(dāng)我告訴聊天機(jī)器人它犯了一個(gè)或幾個(gè)錯(cuò)誤時(shí),它并不總是立即糾正這些錯(cuò)誤。也就是說,糾正的結(jié)果仍然是錯(cuò)誤的。從它那里獲取正確的信息可能需要幾次提醒。當(dāng)我告訴它信息不準(zhǔn)確時(shí),它并不總是會(huì)進(jìn)行互聯(lián)網(wǎng)搜索。
我試著堅(jiān)持下去,因?yàn)樗虝?huì)了我如何更好地與人工智能聊天機(jī)器人互動(dòng),同時(shí)我等待OpenAI改進(jìn)GPT-4o?,F(xiàn)在我聽說了所謂的Strawberry升級(jí),我迫不及待地想讓OpenAI將其部署到ChatGPT中。它不能消除所有的幻覺,但如果傳言屬實(shí),Strawberry可能會(huì)賦予ChatGPT推理的能力。
Strawberry代號(hào)源自路透社的一份報(bào)道,該報(bào)道基于一份據(jù)稱至少可追溯至5月份的OpenAI內(nèi)部文件。
據(jù)消息人士透露,Strawberry是一項(xiàng)正在進(jìn)行中的工作,甚至在OpenAI內(nèi)部也處于保密狀態(tài)。Strawberry模型將讓ChatGPT提前規(guī)劃并自主可靠地瀏覽互聯(lián)網(wǎng),以進(jìn)行“深度研究”操作。
這對(duì)ChatGPT用戶來說是個(gè)好消息。我希望從ChatGPT互動(dòng)中獲得“深入研究”,尤其是那些可能需要多次復(fù)雜的互聯(lián)網(wǎng)搜索的問題。
據(jù)路透社報(bào)道,Strawberry是ChatGPTQ*的演化版本,后者是SamAltn被解雇前后出現(xiàn)在網(wǎng)上的內(nèi)部代號(hào),當(dāng)時(shí)被形容為AI的重大突破。
報(bào)告指出,今年早些時(shí)候,有兩位消息人士見證了ChatGPT的Q*版本實(shí)際運(yùn)行。該模型回答了當(dāng)前聊天機(jī)器人“無法解決”的“棘手科學(xué)和數(shù)學(xué)問題”。另一位消息人士稱,OpenAI測(cè)試的AI在MATH數(shù)據(jù)集上得分超過90%,但目前尚不清楚這是否是同一個(gè)Strawberry項(xiàng)目。
彭博社的一篇報(bào)道似乎證實(shí)了路透社的報(bào)道,該報(bào)道詳細(xì)介紹了本周OpenAI的一次內(nèi)部全體會(huì)議,該公司在會(huì)上演示了一個(gè)具有“類人推理”能力的項(xiàng)目。目前尚不清楚這是否是Strawberry。
OpenAI還為員工提供了一套新的AI模型分類系統(tǒng)。第1級(jí)是現(xiàn)在可以通過ChatGPT等方式體驗(yàn)的AI類型。第5級(jí)是能夠執(zhí)行整個(gè)組織工作的AI。
有趣的是,第人工智能可以花幾天時(shí)間為用戶采取行動(dòng)。第四級(jí)人工智能可以自行創(chuàng)新。
彭博社的報(bào)道中沒有出現(xiàn)Strawberry的代號(hào)。但路透社看到的Strawberry文件中似乎確實(shí)出現(xiàn)了上述的Level3代號(hào):
該文件稱,OpenAI為Strawberry瞄準(zhǔn)的功能之一是執(zhí)行長期任務(wù)(LHT),指的是需要模型提前規(guī)劃并在較長時(shí)間內(nèi)執(zhí)行一系列操作的復(fù)雜任務(wù),第一位消息人士解釋說。
OpenAI正在用一個(gè)神秘的“深度研究”數(shù)據(jù)集訓(xùn)練這些模型。結(jié)果將是一個(gè)ChatGPT版本,它可以通過計(jì)算機(jī)使用代理(CUA)自主研究網(wǎng)絡(luò),然后根據(jù)研究結(jié)果采取行動(dòng)。
OpenAI希望在軟件和機(jī)器學(xué)習(xí)工程師的工作上測(cè)試這些模型。這實(shí)際上可能導(dǎo)致人工智能訓(xùn)練和開發(fā)未來的人工智能變體,從而走向AGI或通用人工智能。目前這只是我個(gè)人的猜測(cè)。但正如報(bào)告所指出的,AGI是當(dāng)前人工智能研究的圣杯。
路透社還介紹了Strawberry的訓(xùn)練方式。這不僅僅是盡可能多地吸收數(shù)據(jù)。OpenAI還使用了一種后訓(xùn)練方法來改進(jìn)人工智能。該技術(shù)使用“微調(diào)”,即人類向人工智能提供反饋的過程。
此外,Strawberry與斯坦福大學(xué)2022年開發(fā)的一種方法類似。它被稱為“自學(xué)推理機(jī)”或STaR。這允許人工智能通過創(chuàng)建自己的數(shù)據(jù)來訓(xùn)練自己,使其具備更高的智能。
Strawberry何時(shí)才能投入大眾消費(fèi)?路透社稱,OpenAI近幾個(gè)月來一直在告訴開發(fā)者和其他各方,它“即將”發(fā)布具有改進(jìn)推理能力的人工智能。雖然目前還不清楚今年我們是否會(huì)獲得任何ChatGPT升級(jí),但人工智能行業(yè)的發(fā)展速度非???。OpenAI被迫盡快部署新的創(chuàng)新。
如果Strawberry變成ChatGPT5,我不會(huì)感到驚訝,但我再次猜測(cè)。我還準(zhǔn)備在等待下一次升級(jí)的同時(shí)繼續(xù)糾正GPT-4o。
標(biāo)簽: