怎樣解決AI的小數(shù)據(jù)問題-創(chuàng)新互聯(lián)

本篇文章給大家分享的是有關(guān)怎樣解決AI的小數(shù)據(jù)問題,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

創(chuàng)新互聯(lián)成立十年來,這條路我們正越走越好,積累了技術(shù)與客戶資源,形成了良好的口碑。為客戶提供網(wǎng)站設(shè)計制作、做網(wǎng)站、網(wǎng)站策劃、網(wǎng)頁設(shè)計、國際域名空間、網(wǎng)絡(luò)營銷、VI設(shè)計、網(wǎng)站改版、漏洞修補等服務(wù)。網(wǎng)站是否美觀、功能強大、用戶體驗好、性價比高、打開快等等,這些對于網(wǎng)站建設(shè)都非常重要,創(chuàng)新互聯(lián)通過對建站技術(shù)性的掌握、對創(chuàng)意設(shè)計的研究為客戶提供一站式互聯(lián)網(wǎng)解決方案,攜手廣大客戶,共同發(fā)展進步。

解決AI的小數(shù)據(jù)問題對深度學習算法,如果沒有足夠多的數(shù)據(jù)進行訓練,有兩種方法可以解決這個問題:生成合成數(shù)據(jù),或者開發(fā)可利用小數(shù)據(jù)展開工作的 AI 模型。
眾所周知,深度學習需要數(shù)據(jù),其模型訓練都是在大量標記數(shù)據(jù)的基礎(chǔ)上進行的,比如,利用數(shù)以百萬計的動物標記圖像訓練 AI 學會識別。但大量標記數(shù)據(jù)對某些應(yīng)用來說并不適用,在這種情況下,從頭開始訓練一個 AI 模型,即使可能,也充滿了困難。
一個潛在的解決方案是用合成數(shù)據(jù)擴充真實數(shù)據(jù)集。這在自動駕駛領(lǐng)域得到了廣泛的應(yīng)用。自動駕駛汽車在逼真的模擬環(huán)境中行駛數(shù)百萬英里,會面臨暴風雪以及行人突發(fā)行為等各種情況,而針對這些情況,我們很難獲取到真實數(shù)據(jù)。

圍繞數(shù)據(jù)問題的另一種解決方案是開發(fā)能夠基于小數(shù)據(jù)集進行學習的 AI 模型。一種名為遷移學習(transfer learning)的方法已在計算機視覺任務(wù)中得到應(yīng)用。該方法使用預(yù)先訓練的 AI 算法來執(zhí)行一個有大量標記數(shù)據(jù)的任務(wù)(如識別圖像中的汽車),然后將該知識轉(zhuǎn)移到另一個數(shù)據(jù)很少的不同任務(wù)上(如識別卡車)。使用預(yù)先訓練的模型就像包餃子時使用現(xiàn)成的餃子皮,免去了和面的步驟。

雖然預(yù)先訓練的模型在計算機視覺領(lǐng)域已經(jīng)取得了長足的發(fā)展,但在自然語言處理(NLP)領(lǐng)域,由于缺乏標記數(shù)據(jù),到目前為止,一直是一項極具挑戰(zhàn)的工作。不過,一種名為自我監(jiān)督預(yù)訓練(self-supervised pre-training)的方法在自然語言處理領(lǐng)域中逐漸流行起來。

所謂自我監(jiān)督預(yù)訓練,首先要根據(jù)網(wǎng)絡(luò)上的大量數(shù)據(jù)訓練 AI 模型。例如,OpenAI 進行了一項計算極其密集的任務(wù):用 800 萬個網(wǎng)頁作為訓練數(shù)據(jù),訓練一個基于給定文本預(yù)測下一文本詞匯的 AI 模型。這一方法被稱為自我監(jiān)督學習,因為這里不涉及“標簽”:AI 通過基于句子中的其他單詞預(yù)測一個隱藏的單詞來學習語言。

另一個典型的例子是谷歌 BERT,其 AI 語言模型不僅可以根據(jù)前文內(nèi)容進行預(yù)測,還可以基于后文展開,也就是說該模型采用了雙向語言模型的方式,能夠更好的融合前后文的知識。

由 Yann LeCun 領(lǐng)導的 Facebook AI 研究部門一直都看好自我監(jiān)督。比如,他們首先會訓練出一個語言模型,然后進行預(yù)訓練,并對其進行微調(diào)以進行仇恨言論的識別。Facebook 還開源了其自我監(jiān)督語音識別模型,很好地解決了小型研究項目對人工標記文本的需求問題。非英語語言的標注訓練數(shù)據(jù)往往數(shù)量有限,針對這個問題, Facebook 開源了代碼 wav2vec,這對非英語語言的語音識別尤其有用。

以上就是怎樣解決AI的小數(shù)據(jù)問題,小編相信有部分知識點可能是我們?nèi)粘9ぷ鲿姷交蛴玫降摹OM隳芡ㄟ^這篇文章學到更多知識。更多詳情敬請關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司行業(yè)資訊頻道。

網(wǎng)站欄目:怎樣解決AI的小數(shù)據(jù)問題-創(chuàng)新互聯(lián)
文章分享:http://bm7419.com/article0/dpcoio.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站導航App開發(fā)、ChatGPT、網(wǎng)站制作、面包屑導航、建站公司

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

商城網(wǎng)站建設(shè)