推特等公司要價太高,OpenAI 和 Cohere 等 AI 公司轉(zhuǎn)向組成數(shù)據(jù) |
發(fā)布時間:2023-07-22 文章來源:本站 瀏覽次數(shù):2052 |
7 月 20 日消息,人工智能公司 Cohere 首席執(zhí)行官 Aiden Gomez 近來透露,因為 Reddit、Twitter 等公司的數(shù)據(jù)收集要價太高,包括微軟、OpenAI 和 Cohere 在內(nèi)的 AI 公司,已運用組成數(shù)據(jù)來練習 AI 模型。 Gomez 表示組成數(shù)據(jù)能夠適用于許多練習場景,僅僅目前尚未全面推廣。 IT之家在此附上 Gomez 舉的一個例子:假如某個企業(yè)想在高等數(shù)學中練習一個模型,能夠創(chuàng)立兩個人工智能模型,分別扮演教師和學生的人物,并讓它們評論三角學之類的話題。人工首要擔任調(diào)查,假如看到有什么過錯,能夠進行糾正。 IT之家注: 組成數(shù)據(jù)(synthetic data)是經(jīng)過計算機技術人工生成的數(shù)據(jù),而不是由實在事件產(chǎn)生的數(shù)據(jù)。 但組成數(shù)據(jù)具備“可用性”,能夠在數(shù)學上或統(tǒng)計學上反映原始數(shù)據(jù)的屬性,因此能夠作為原始數(shù)據(jù)的替代品來練習、測試并驗證大模型。 |
|