人工智能NLP 引擎
主要研究自然語言處理研究領域的算法和應用實踐。涉及語義解析、意圖識別、FAQ 問答、多輪對話、知識圖譜等關鍵技術,研究內容包括分詞、向量表示、分類等文本預處理技術,以及將自然語言處理核心算法應用落實到智能客服、NLP 引擎、航天空管交互等實際場景中,團隊研發(fā)的 AI 產品已經跟國內企業(yè)、研究所開展了長期合作并動態(tài)跟蹤,獲得了廣泛的一致好評。
人工智能 NLP 引擎項目是基于多語種分詞、多語種情緒識別、詞句關系分析、意圖識別、文本聚類等自然語言處理技術實現(xiàn)對海量錄音文本的知識挖掘,識別重要信息。為錄音服務行業(yè)下游業(yè)務的分析人員提供分析思路,以便得到多維度、多形式分析結果,將發(fā)現(xiàn)轉換為可落地的業(yè)務決策,這些數(shù)據(jù)驅動的業(yè)務決策,包括客戶體驗、座席行為、產品改進、風險監(jiān)測等多個方面,幫助企業(yè)改善用戶體驗、降低成本、提升效率、提升業(yè)績、降低風險等。
1.多語種分詞。分詞指的是將一個字序列切分成一個一個單獨的詞,是將連續(xù)的字序列按照一定的規(guī)范重新組合成詞序列的過程。文本在入庫時調用接口進行了分詞,分詞可用于模型的匹配和熱詞的統(tǒng)計。
2.詞句關系分析。根據(jù)詞句關系接口識別的中心詞,然后用中心詞進行詞頻的統(tǒng)計,對于目標樣本,統(tǒng)計出高頻中心詞用來概括目標樣本中主要描述的對話內容。
3.意圖識別。識別出客戶語句的意圖,以便進行相應的功能操作、信息推薦等。
4.多語種情緒識別。情緒識別是對包含主觀信息的文本進行情感傾向性判斷,正向或者負向(如果能提供訓練數(shù)據(jù)集,可以識別更多種類的情緒)。為客戶之聲下游任務的口碑分析、話題監(jiān)控、輿情分析等應用提供幫助。目前支持中文、粵語的情緒識別。根據(jù)情緒標識,用情緒進行搜索和統(tǒng)計分析。
5.文本聚類。文本聚類將一大段文本中心詞和中心詞的關聯(lián)詞、近義詞生成一個圖,用于可視化文本的內容。
6.自定義分詞、意圖。對分詞分詞、意圖種類進行增刪、擴展、微調等。
西安電子科技大學
2022-10-20