成年人国产黄色免费播放器|91AV另类电影在线免费观看|一区二区AV啊好爽|国产Av网站美女主福利|ay在线中文字幕无码|日韩AV毛片电影|欧美国产人人视频在线观看|久久人妻色欲岛国第一网站|一级黄色片一级黄色片|免费五级黄高潮片下载

  1. 首頁
  2. 資訊
  3. 市場
  4. 麻省理工學(xué)院和MIT-IBM沃森人工智能實(shí)驗(yàn)室開發(fā)新技術(shù) 可在部署基礎(chǔ)模型之前評估其可靠性

麻省理工學(xué)院和MIT-IBM沃森人工智能實(shí)驗(yàn)室開發(fā)新技術(shù) 可在部署基礎(chǔ)模型之前評估其可靠性

蓋世汽車

蓋世汽車訊 基礎(chǔ)模型是大規(guī)模深度學(xué)習(xí)模型,已在大量通用、未標(biāo)記的數(shù)據(jù)上進(jìn)行了預(yù)訓(xùn)練,可應(yīng)用于各種任務(wù),例如生成圖像或回答客戶問題。這些模型是ChatGPT和DALL-E等人工智能工具的支柱,但它們可能會提供錯誤或誤導(dǎo)性的信息,在安全攸關(guān)的情況下(例如行人接近自動駕駛汽車)這些錯誤信息可能造成嚴(yán)重后果。

麻省理工學(xué)院和MIT-IBM沃森人工智能實(shí)驗(yàn)室開發(fā)新技術(shù) 可在部署基礎(chǔ)模型之前評估其可靠性

(圖片來源:麻省理工學(xué)院)

據(jù)外媒報(bào)道,為了幫助防止出現(xiàn)此類錯誤,麻省理工學(xué)院(MIT)和MIT-IBM沃森人工智能實(shí)驗(yàn)室(MIT-IBM Watson AI Lab)的研究人員開發(fā)出一種技術(shù),可以在將基礎(chǔ)模型部署到特定任務(wù)之前評估其可靠性。

研究人員考慮通過一組彼此略有不同的基礎(chǔ)模型來實(shí)現(xiàn)這一目標(biāo),然后利用其算法來評估每個模型學(xué)習(xí)到的關(guān)于同一測試數(shù)據(jù)點(diǎn)的表示(representation)的一致性。如果這些表示一致,則意味著模型可靠。

與最先進(jìn)的基線方法相比,這種技術(shù)能夠更好地體現(xiàn)在各種下游分類任務(wù)中基礎(chǔ)模型的可靠性。人們可以利用這種技術(shù)來決定是否可以在特定環(huán)境中應(yīng)用模型,而無需在真實(shí)數(shù)據(jù)集上進(jìn)行測試。當(dāng)數(shù)據(jù)集可能因隱私問題而無法訪問時(例如在醫(yī)療保健環(huán)境中),這可能特別有用。此外,該技術(shù)還可用于根據(jù)可靠性評分對模型進(jìn)行排名,從而使用戶能夠?yàn)槠淙蝿?wù)選擇最佳模型。

研究人員Navid Azizan表示:“所有模型都可能出錯,但知道自己什么時候出錯的模型更有用。對于這些基礎(chǔ)模型來說,量化不確定性或可靠性的問題更具挑戰(zhàn)性,因?yàn)樗鼈兊某橄蟊硎倦y以進(jìn)行比較。這種方法允許人們量化表示模型(representation model)對于各種給定輸入數(shù)據(jù)的可靠性?!?/p>

來源:第一電動網(wǎng)

作者:蓋世汽車

本文地址:http://www.idc61.net/news/shichang/238257

返回第一電動網(wǎng)首頁 >

收藏
65
  • 分享到:
發(fā)表評論
新聞推薦
熱文榜
日排行
周排行
第一電動網(wǎng)官方微信

反饋和建議 在線回復(fù)

您的詢價(jià)信息
已經(jīng)成功提交我們稍后會聯(lián)系您進(jìn)行報(bào)價(jià)!

第一電動網(wǎng)
Hello world!
-->