推特等公司要價太高,OpenAI 和 Cohere 等 AI 公司轉(zhuǎn)向組成數(shù)據(jù) |
發(fā)布時間:2023-07-22 文章來源:本站 瀏覽次數(shù):2048 |
7 月 20 日消息,人工智能公司 Cohere 首席執(zhí)行官 Aiden Gomez 近來透露,因為 Reddit、Twitter 等公司的數(shù)據(jù)收集要價太高,包括微軟、OpenAI 和 Cohere 在內(nèi)的 AI 公司,已運用組成數(shù)據(jù)來練習(xí) AI 模型。 Gomez 表示組成數(shù)據(jù)能夠適用于許多練習(xí)場景,僅僅目前尚未全面推廣。 IT之家在此附上 Gomez 舉的一個例子:假如某個企業(yè)想在高等數(shù)學(xué)中練習(xí)一個模型,能夠創(chuàng)立兩個人工智能模型,分別扮演教師和學(xué)生的人物,并讓它們評論三角學(xué)之類的話題。人工首要擔(dān)任調(diào)查,假如看到有什么過錯,能夠進行糾正。 IT之家注: 組成數(shù)據(jù)(synthetic data)是經(jīng)過計算機技術(shù)人工生成的數(shù)據(jù),而不是由實在事件產(chǎn)生的數(shù)據(jù)。 但組成數(shù)據(jù)具備“可用性”,能夠在數(shù)學(xué)上或統(tǒng)計學(xué)上反映原始數(shù)據(jù)的屬性,因此能夠作為原始數(shù)據(jù)的替代品來練習(xí)、測試并驗證大模型。 |
|