上周,在微軟高管在接受德國媒體采訪時(shí)透露該系統(tǒng)將于本周推出后,,謠言進(jìn)一步活躍起來。
這位高管還建議該系統(tǒng)將是多模式的,,也就是說不僅能夠生成文本,,還能夠生成其他媒體。
許多人工智能研究人員認(rèn)為,集成文本,、音頻和視頻的多模態(tài)系統(tǒng)為構(gòu)建更強(qiáng)大的人工智能系統(tǒng)提供了最佳途徑,。
GPT-4確實(shí)是多模態(tài)的,但介質(zhì)比一些人預(yù)測(cè)的要少,。
OpenAI表示,,該系統(tǒng)可以接受文本和圖像輸入,并發(fā)出文本輸出,。
該公司表示,,該模型同時(shí)解析文本和圖像的能力使其能夠解釋更復(fù)雜的輸入。
在下面的示例中,,您可以看到系統(tǒng)解釋模因和不尋常的圖像:
進(jìn)入GPT-4是一段漫長(zhǎng)的旅程,,OpenAI,以及一般的AI語言模型,,在最近幾個(gè)月迅速成為主流之前,,幾年來緩慢建立勢(shì)頭。
描述GPT的原始研究論文于2018年發(fā)表,,GPT-2于2019年宣布,,GPT-3于2020年宣布。
這些模型是在龐大的文本數(shù)據(jù)集上訓(xùn)練的,,其中大部分是從互聯(lián)網(wǎng)上抓取的,,這些數(shù)據(jù)集是為統(tǒng)計(jì)模式而挖掘的。
然后,,這些模式用于預(yù)測(cè)哪個(gè)單詞緊隨另一個(gè)單詞,。
這是一種相對(duì)簡(jiǎn)單的描述機(jī)制,但最終結(jié)果是靈活的系統(tǒng),,可以生成,、總結(jié)和改寫寫作,以及執(zhí)行其他基于文本的任務(wù),,如翻譯或生成代碼,。
OpenAI最初推遲了其GPT模型的發(fā)布,因?yàn)閾?dān)心它們會(huì)被用于惡意目的,,如生成垃圾郵件和錯(cuò)誤信息,。
但在2022年底,該公司推出了ChatGPT——一種基于GPT-3.5的對(duì)話聊天機(jī)器人,,任何人都可以訪問,。
ChatGPT的推出引發(fā)了科技界的狂熱,微軟很快推出了自己的AI聊天機(jī)器人Bing(Bing搜索引擎的一部分),,谷歌爭(zhēng)先恐后地追趕,。
正如預(yù)測(cè)的那樣,,這些人工智能語言模型的廣泛可用性帶來了問題和挑戰(zhàn)。
美東時(shí)間11月6日,,OpenAI的開發(fā)者大會(huì)上,,一系列新的宣布讓整個(gè)科技界為之震撼。
2023-11-08 10:05:18OpenAI對(duì)創(chuàng)業(yè)公司有何影響