阿里達(dá)摩院結(jié)合高德發(fā)布多模態(tài)天文文本預(yù)鍛煉模型MGeo |
發(fā)布時(shí)間:2023-02-22 文章來源:本站 瀏覽次數(shù):1982 |
2月21日,達(dá)摩院結(jié)合高德發(fā)布業(yè)界首個(gè)多模態(tài)天文文本預(yù)鍛煉模型MGeo,其可充沛了解地圖上的每一個(gè)元素,并精準(zhǔn)完成地圖搜索、天文位置剖析等任務(wù)。MGeo是阿里通義模型系列旗下的新模型,目前已在魔搭社區(qū)開放。 天文文本信息處置是導(dǎo)航軟件、物流以及批發(fā)等行業(yè)的根底。但是,目前傳統(tǒng)天文文本AI算法關(guān)于天文信息的了解仍局限在經(jīng)緯度以及經(jīng)緯度的遠(yuǎn)近上,無法像人類一樣了解地圖上的元素,該辦法難以精準(zhǔn)表示景區(qū)、園區(qū)、商業(yè)街等大型天文實(shí)體的詳細(xì)外形,以及不同地圖元素之間復(fù)雜的臨近、包含等關(guān)系。 針對(duì)上述問題,達(dá)摩院結(jié)合高德提出天文文本多模態(tài)模型,運(yùn)用對(duì)立MLM預(yù)鍛煉、句子對(duì)預(yù)鍛煉及多模態(tài)預(yù)鍛煉三大技術(shù),并用多任務(wù)預(yù)鍛煉將這三種預(yù)鍛煉任務(wù)停止動(dòng)態(tài)組合,終鍛煉得到合適于多類天文文本任務(wù)的預(yù)鍛煉底座MGeo。該模型具有豐厚的天文學(xué)問,能像人類一樣跨模態(tài)了解地圖與天文文本的信息,相關(guān)研討成果已被EMNLP、AAAI等國(guó)際頂級(jí)會(huì)議收錄。 MGeo像人類一樣具備跨模態(tài)了解才能,可辨認(rèn)地圖元素之間的位置關(guān)系 據(jù)悉,高德基于MGeo研發(fā)了全新的模型,不只顯著進(jìn)步泛化語義的表示才能,還可精確辨認(rèn)不同地圖元素之間的位置關(guān)系,有效提升用戶的搜索體驗(yàn)。例如,當(dāng)用戶在杭州輸入“星光薈對(duì)面中國(guó)美術(shù)”時(shí),MGeo能依據(jù)位置關(guān)系精確定位到中國(guó)美術(shù)學(xué)院象山校區(qū),而傳統(tǒng)BERT模型則給出了錯(cuò)誤定位結(jié)果;此外,在用戶書寫有誤的狀況下,該模型也能匹配正確的結(jié)果。該才能已逐漸在高德灰度上線。 在四平市搜索“傭兵小區(qū)”,高德可精確定位“擁軍社區(qū)” 達(dá)摩院言語技術(shù)實(shí)驗(yàn)室擔(dān)任人黃非表示:“天文信息與AI的交融已是業(yè)界公認(rèn)的趨向,但傳統(tǒng)AI比方文本處置在天文信息應(yīng)用場(chǎng)景中有一定局限性 ,我們需求讓AI學(xué)習(xí)人類關(guān)于空間信息的了解范式,例如,經(jīng)過地圖中的天文實(shí)體以及他們之間的關(guān)系來斷定天文文本中各個(gè)元素的歸屬以及指向! 作為早投入預(yù)鍛煉言語模型研討的團(tuán)隊(duì)之一,達(dá)摩院研發(fā)了阿里通義AliceMind,該體系涵蓋預(yù)鍛煉模型、多言語預(yù)鍛煉模型、超大中文預(yù)鍛煉模型等,具備閱讀了解、機(jī)器翻譯、對(duì)話問答、文檔處置等多種才能,該模型體系已斬獲36項(xiàng)國(guó)際賽事冠軍。 |
|