17行Python代碼做情感分析?你也可以的

2021-02-04    分類: 網站建設

17行代碼跑最新NLP模型?你也可以!

  • 本次作者評測所需(防嚇退)
  1. 一臺可以上網的電腦
  2. 基本的python代碼閱讀能力,用于修改幾個模型參數
  3. 對百度中文NLP最新成果的濃烈興趣
  • 訓練模型:Senta情感分析模型基本簡介
  1. Senta是百度NLP開放的中文情感分析模型,可以用于進行中文句子的情感分析,輸出結果為{正向/中性/負向}中的一個,關于模型的結構細節(jié),請查看Senta----github.com/PaddlePaddle/Paddlehub/demo/senta 
  • 本示例代碼選擇的是Senta-BiLSTM模型。
  • 模型來源:Paddlehub簡介
  1. PaddleHub是基于PaddlePaddle開發(fā)的預訓練模型管理工具,可以借助預訓練模型更便捷地開展遷移學習工作。 
  • 本次評測中只使用了預訓練模型,沒有進行fine-tune
  • 代碼運行環(huán)境:百度 AI studio

總結

1.模型計算耗時較小,使用體驗不錯。

2.成語情感分析方面,我專門挑選的是一些比較難從字面理解的,容易混淆情感的成語(比如差強人意被判定為消極),這些也是高考??嫉膬热?。雖然最后模型正確率只有一般,但是我認為是可以接受的,適當增加成語語句作為訓練語料會使模型"更懂"中文。

大家有興趣的可以試一試一些比較容易從字面理解情感的成語,我覺得得分會比本次評測的結果要好。

3.轉折語句情感分析本身也是對模型的一種挑戰(zhàn),實測效果為65分,個人覺得模型對于像“但是”,“雖然”這樣的詞語沒有足夠的attention,因為這些轉折詞背后的語義往往才是最影響整個句子的情感的,最終評分65分,個人認為模型在這方面表現一般。

4.評分最好看的是具體場景情感分析,大概預訓練語料中有大量的淘寶評價?像殺馬特 20 科比 這些小字眼是判定情感的關鍵,而模型也確實捕捉到并判斷出來了,這點比較讓我驚喜。

分享文章:17行Python代碼做情感分析?你也可以的
本文地址:http://www.bm7419.com/news20/99070.html

成都網站建設公司_創(chuàng)新互聯,為您提供面包屑導航、ChatGPT、企業(yè)建站、營銷型網站建設關鍵詞優(yōu)化、網站建設

廣告

聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯

成都做網站