“我們從未與通用人工智能如此接近”，復(fù)旦黃萱菁解析ChatGPT

發(fā)布時(shí)間：2023-03-14 文章來(lái)源：本站瀏覽次數(shù)：2110

“我們歷來(lái)沒(méi)有覺(jué)得本人與通用人工智能如此接近，這是我從事人工智能研討這么多年以來(lái)興奮的時(shí)期，”在昨晚舉行的復(fù)旦科創(chuàng)先鋒論壇上，復(fù)旦大學(xué)計(jì)算機(jī)學(xué)院教授、博士生導(dǎo)師黃萱菁如此形容ChatGPT橫空出世后她的心情。作為國(guó)內(nèi)早從事人工智能、自然言語(yǔ)處置和信息檢索的學(xué)者之一，她做出的判別是：AI可能會(huì)像工業(yè)反動(dòng)和信息反動(dòng)一樣，引領(lǐng)我們走向下一個(gè)時(shí)期。

活動(dòng)現(xiàn)場(chǎng)，黃萱菁發(fā)表了主題為“邁向大范圍言語(yǔ)模型”的演講，她從言語(yǔ)模型的定義開(kāi)端娓娓道來(lái)：“言語(yǔ)模型就是言語(yǔ)的規(guī)律。首先是語(yǔ)法，我們無(wú)論學(xué)習(xí)漢語(yǔ)還是英語(yǔ)等言語(yǔ)，都是從語(yǔ)法開(kāi)端學(xué)起，但是光有語(yǔ)法，我們?nèi)匀缓茈y捕捉客觀世界紛繁復(fù)雜的言語(yǔ)現(xiàn)象，由于言語(yǔ)并不會(huì)嚴(yán)厲依照語(yǔ)法去表達(dá)。這個(gè)時(shí)分，我們就需求運(yùn)用到數(shù)學(xué)‘武器’——概率，在各種言語(yǔ)現(xiàn)象中間去尋覓規(guī)律。假如經(jīng)過(guò)對(duì)句子停止概率剖析，我們就能曉得什么是正確的辨認(rèn)結(jié)果。這個(gè)概率模型就稱(chēng)為言語(yǔ)模型�！�

由于句子在諸多情形下可能包含宏大的詞匯量，招致傳統(tǒng)概率言語(yǔ)模型所需的計(jì)算資源爆炸式增長(zhǎng)。所謂大范圍言語(yǔ)模型就是含有巨量參數(shù)，可以承受很長(zhǎng)一段時(shí)間窗口的言語(yǔ)文字。2017年開(kāi)端呈現(xiàn)了一個(gè)模型叫做Transformer，成為如今預(yù)鍛煉模型的基石，也是大范圍言語(yǔ)模型的基石。

據(jù)黃萱菁引見(jiàn)，傳統(tǒng)的預(yù)鍛煉模型有兩種思緒，第一種思緒是以BERT為例的了解模型，另一種思緒是以ChatGPT的前身GPT為代表的產(chǎn)生式模型。當(dāng)然也有一些工作嘗試把了解模型和產(chǎn)生式模型分離起來(lái)。曾經(jīng)很長(zhǎng)一段時(shí)間了解式的模型被運(yùn)用的比擬多，而產(chǎn)生式模型則需求更高的算力和更長(zhǎng)的窗口，不斷到有了GPT-3之后，大家才曉得它如此之強(qiáng)悍，而ChatGPT還具有了很強(qiáng)的了解人類(lèi)上下文的才能。

“我們生活在一個(gè)飛速變化的時(shí)期，每個(gè)禮拜都有新的模型發(fā)布，預(yù)鍛煉+微調(diào)的方式是前ChatGPT時(shí)期的范式，諸如Google、Open AI這樣的大廠商將本身開(kāi)發(fā)的大模型開(kāi)源，供下游應(yīng)用者在這些模型上停止參數(shù)的微調(diào)，以獲得優(yōu)良的表現(xiàn)。”她表示，當(dāng)言語(yǔ)模型變得更大的時(shí)分，一方面廠商出于商業(yè)緣由逐步舍棄開(kāi)源，另一方面用戶(hù)也缺乏足夠的計(jì)算資源運(yùn)用大模型，“這樣的狀況之下，一個(gè)新的范式終橫空出世：應(yīng)用大范圍言語(yǔ)模型的涌現(xiàn)才能。當(dāng)模型的參數(shù)范圍還不太大的時(shí)分，你看不到它的強(qiáng)大，當(dāng)?shù)竭_(dá)某一個(gè)臨界值時(shí)，這個(gè)模型就會(huì)十分強(qiáng)大。”

記者理解到，作為ChatGPT背后的中心技術(shù)，大言語(yǔ)模型能夠展示出強(qiáng)大的學(xué)習(xí)才能。而現(xiàn)有研討標(biāo)明，模型范圍和數(shù)據(jù)量越大，性能越好。當(dāng)模型和數(shù)據(jù)范圍到達(dá)一定水平時(shí)，模型將取得涌現(xiàn)才能。

具有強(qiáng)大才能后，ChatGPT終究會(huì)給我們帶來(lái)哪些改動(dòng)？微軟CEO薩提亞·納德拉承受媒體采訪(fǎng)時(shí)曾說(shuō)，內(nèi)燃機(jī)帶來(lái)了低價(jià)的動(dòng)力，互聯(lián)網(wǎng)技術(shù)減少了信息傳送的本錢(qián)，而ChatGPT會(huì)讓信息的整合、轉(zhuǎn)譯、流通變得愈加低價(jià)。

在黃萱菁看來(lái)，ChatGPT能夠視作是人工智能的基座，就像“大腦”一樣，“在肉眼可見(jiàn)的將來(lái)，善用AI的人將和不用AI的人在工作效率上會(huì)產(chǎn)生宏大差距，因而我鼓舞大家多去運(yùn)用和熟習(xí)與AI停止溝通。在將來(lái)一段時(shí)間內(nèi)，ChatGPT還缺乏以完整替代某一個(gè)崗位，但將大大促進(jìn)各個(gè)范疇的消費(fèi)效率，我們希望AI是協(xié)助人類(lèi)的工具，而不是取代人類(lèi)的機(jī)器�！�

她同時(shí)表示，“我們發(fā)現(xiàn)ChatGPT才能如今的強(qiáng)大性能都是在現(xiàn)有的機(jī)器學(xué)習(xí)框架下能夠解釋的，并沒(méi)有一些很玄的東西，我置信今年除了OpenAI，國(guó)內(nèi)外會(huì)有很多機(jī)構(gòu)，包括大學(xué)和企業(yè)等，在ChatGPT模型方面會(huì)有大的打破。”

上一條：1.5萬(wàn)人參與、最小參賽...

下一條：ChatGPT背后的35...