導讀:在日前的中文語言理解權(quán)威評測基準CLUE評測中,阿里的AI模型就拿到了雙料冠軍。
AI人工智能是現(xiàn)在的熱門,很多服務都上了AI客服,如何讓AI用最少的樣本來理解自然語言是個難題,國內(nèi)還有中文語言理解的需要。在日前的中文語言理解權(quán)威評測基準CLUE評測中,阿里的AI模型就拿到了雙料冠軍。
日前, 中文語言理解權(quán)威評測基準CLUE公布了小樣本學習評測榜單FewCLUE的最新結(jié)果,阿里巴巴在大模型和無參數(shù)限制模型兩項賽事中雙雙刷新榜單最好紀錄,僅次于“人類”,并在極少(一個類別僅十余個)樣本條件下,超過了新聞文本分類上的人類識別精確度。
這證明了AI小樣本學習在NLP任務上具備超越人類的能力。
FewCLUE是CLUE最新推出的一項中文小樣本學習評測榜單,包括大模型和無參數(shù)限制模型雙賽道,用來評估預訓練模型是否能夠通過小樣本學習來掌握特定的自然語言處理任務?;谶@項評估,科研人員可以更精準的衡量預訓練模型的泛化性和準確率。
眾所周知,預訓練模型在特定自然語言處理任務上要取得高精度的成本非常高,科研人員進而轉(zhuǎn)向攻關小樣本學習技術(shù),希望用較低的成本實現(xiàn)可觀的識別精確度。
據(jù)悉,阿里云機器學習平臺PAI和和達摩院共同提出了一種大模型+小樣本的聯(lián)合方案,在大規(guī)模通用預訓練基礎之上,將億級知識圖譜融入預訓練模型,打造了強大的底座KGBert,結(jié)合Fuzzy-PET少樣本學習,在多個任務上比預訓練微調(diào)技術(shù)提升近25%了準確率,甚至在一個小樣本學習任務上的精準度超過了人類。
例如,在智能客服場景下的用戶需求識別,僅需人工標注幾十條樣本,就能讓需求識別的準確率達到90%。
值得一提的是,這項小樣本學習技術(shù)已在阿里巴巴的實際場景落地且有很好的業(yè)務表現(xiàn),目前阿里云智能客服云小蜜僅用20條樣本就可以做到快速冷啟動,實現(xiàn)精準問答,準確率超過80%,并在政務、金融、通用線多個業(yè)務場景落地。開發(fā)者可基于PAI直接調(diào)用行業(yè)解決方案,也可以二次開發(fā)打造自己的模型。
阿里云PAI是國際領先的機器學習平臺,過去幾年陸續(xù)打破多項國內(nèi)外AI記錄:2019年10月,英文多輪閱讀榜單QuAC取得第一;2020年3月,中文CLUE分類榜單取得第一;2020年8月,英文SuperGLUE取得國內(nèi)第一,世界第二。
“我們希望通過算法與工程的協(xié)同設計構(gòu)建端到端的大規(guī)模AI工程能力,用云上AI平臺PAI服務各行各業(yè)。”阿里巴巴副總裁、阿里云計算平臺負責人賈揚清表示:“目前,PAI支持從數(shù)據(jù)標注、模型設計、分布式訓練、模型管理和模型服務等AI資產(chǎn)管理的各方面需求,全面提升AI落地企業(yè)應用的效率?!?/p>