“我們從未與通用人工智能如此接近”,復(fù)旦黃萱菁解析ChatGPT |
發(fā)布時(shí)間:2023-03-14 文章來(lái)源:本站 瀏覽次數(shù):2110 |
“我們歷來(lái)沒(méi)有覺(jué)得本人與通用人工智能如此接近,這是我從事人工智能研討這么多年以來(lái)興奮的時(shí)期,”在昨晚舉行的復(fù)旦科創(chuàng)先鋒論壇上,復(fù)旦大學(xué)計(jì)算機(jī)學(xué)院教授、博士生導(dǎo)師黃萱菁如此形容ChatGPT橫空出世后她的心情。作為國(guó)內(nèi)早從事人工智能、自然言語(yǔ)處置和信息檢索的學(xué)者之一,她做出的判別是:AI可能會(huì)像工業(yè)反動(dòng)和信息反動(dòng)一樣,引領(lǐng)我們走向下一個(gè)時(shí)期。 活動(dòng)現(xiàn)場(chǎng),黃萱菁發(fā)表了主題為“邁向大范圍言語(yǔ)模型”的演講,她從言語(yǔ)模型的定義開(kāi)端娓娓道來(lái):“言語(yǔ)模型就是言語(yǔ)的規(guī)律。首先是語(yǔ)法,我們無(wú)論學(xué)習(xí)漢語(yǔ)還是英語(yǔ)等言語(yǔ),都是從語(yǔ)法開(kāi)端學(xué)起,但是光有語(yǔ)法,我們?nèi)匀缓茈y捕捉客觀世界紛繁復(fù)雜的言語(yǔ)現(xiàn)象,由于言語(yǔ)并不會(huì)嚴(yán)厲依照語(yǔ)法去表達(dá)。這個(gè)時(shí)分,我們就需求運(yùn)用到數(shù)學(xué)‘武器’——概率,在各種言語(yǔ)現(xiàn)象中間去尋覓規(guī)律。假如經(jīng)過(guò)對(duì)句子停止概率剖析,我們就能曉得什么是正確的辨認(rèn)結(jié)果。這個(gè)概率模型就稱(chēng)為言語(yǔ)模型! 由于句子在諸多情形下可能包含宏大的詞匯量,招致傳統(tǒng)概率言語(yǔ)模型所需的計(jì)算資源爆炸式增長(zhǎng)。所謂大范圍言語(yǔ)模型就是含有巨量參數(shù),可以承受很長(zhǎng)一段時(shí)間窗口的言語(yǔ)文字。2017年開(kāi)端呈現(xiàn)了一個(gè)模型叫做Transformer,成為如今預(yù)鍛煉模型的基石,也是大范圍言語(yǔ)模型的基石。 據(jù)黃萱菁引見(jiàn),傳統(tǒng)的預(yù)鍛煉模型有兩種思緒,第一種思緒是以BERT為例的了解模型,另一種思緒是以ChatGPT的前身GPT為代表的產(chǎn)生式模型。當(dāng)然也有一些工作嘗試把了解模型和產(chǎn)生式模型分離起來(lái)。曾經(jīng)很長(zhǎng)一段時(shí)間了解式的模型被運(yùn)用的比擬多,而產(chǎn)生式模型則需求更高的算力和更長(zhǎng)的窗口,不斷到有了GPT-3之后,大家才曉得它如此之強(qiáng)悍,而ChatGPT還具有了很強(qiáng)的了解人類(lèi)上下文的才能。 “我們生活在一個(gè)飛速變化的時(shí)期,每個(gè)禮拜都有新的模型發(fā)布,預(yù)鍛煉+微調(diào)的方式是前ChatGPT時(shí)期的范式,諸如Google、Open AI這樣的大廠商將本身開(kāi)發(fā)的大模型開(kāi)源,供下游應(yīng)用者在這些模型上停止參數(shù)的微調(diào),以獲得優(yōu)良的表現(xiàn)。”她表示,當(dāng)言語(yǔ)模型變得更大的時(shí)分,一方面廠商出于商業(yè)緣由逐步舍棄開(kāi)源,另一方面用戶(hù)也缺乏足夠的計(jì)算資源運(yùn)用大模型,“這樣的狀況之下,一個(gè)新的范式終橫空出世:應(yīng)用大范圍言語(yǔ)模型的涌現(xiàn)才能。當(dāng)模型的參數(shù)范圍還不太大的時(shí)分,你看不到它的強(qiáng)大,當(dāng)?shù)竭_(dá)某一個(gè)臨界值時(shí),這個(gè)模型就會(huì)十分強(qiáng)大。” 記者理解到,作為ChatGPT背后的中心技術(shù),大言語(yǔ)模型能夠展示出強(qiáng)大的學(xué)習(xí)才能。而現(xiàn)有研討標(biāo)明,模型范圍和數(shù)據(jù)量越大,性能越好。當(dāng)模型和數(shù)據(jù)范圍到達(dá)一定水平時(shí),模型將取得涌現(xiàn)才能。 具有強(qiáng)大才能后,ChatGPT終究會(huì)給我們帶來(lái)哪些改動(dòng)?微軟CEO薩提亞·納德拉承受媒體采訪(fǎng)時(shí)曾說(shuō),內(nèi)燃機(jī)帶來(lái)了低價(jià)的動(dòng)力,互聯(lián)網(wǎng)技術(shù)減少了信息傳送的本錢(qián),而ChatGPT會(huì)讓信息的整合、轉(zhuǎn)譯、流通變得愈加低價(jià)。 在黃萱菁看來(lái),ChatGPT能夠視作是人工智能的基座,就像“大腦”一樣,“在肉眼可見(jiàn)的將來(lái),善用AI的人將和不用AI的人在工作效率上會(huì)產(chǎn)生宏大差距,因而我鼓舞大家多去運(yùn)用和熟習(xí)與AI停止溝通。在將來(lái)一段時(shí)間內(nèi),ChatGPT還缺乏以完整替代某一個(gè)崗位,但將大大促進(jìn)各個(gè)范疇的消費(fèi)效率,我們希望AI是協(xié)助人類(lèi)的工具,而不是取代人類(lèi)的機(jī)器! 她同時(shí)表示,“我們發(fā)現(xiàn)ChatGPT才能如今的強(qiáng)大性能都是在現(xiàn)有的機(jī)器學(xué)習(xí)框架下能夠解釋的,并沒(méi)有一些很玄的東西,我置信今年除了OpenAI,國(guó)內(nèi)外會(huì)有很多機(jī)構(gòu),包括大學(xué)和企業(yè)等,在ChatGPT模型方面會(huì)有大的打破。” |
|