葡京娱乐场-富盈娱乐场开户

|
西安電子科技大學(xué)
西安電子科技大學(xué) 教育部
  • 16 高校采購信息
  • 179 科技成果項目
  • 1 創(chuàng)新創(chuàng)業(yè)項目
  • 0 高校項目需求

基于語義智能的網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理

2024-10-10 14:04:16
云上高博會 http://www.a00n.com
所屬領(lǐng)域:
社會服務(wù)
項目成果/簡介:

(一)項目背景

網(wǎng)絡(luò)信息魚龍混雜,“標(biāo)題黨”、“網(wǎng)絡(luò)暴力”、“人肉搜索”、“流量造假”等問題層出不窮。為了營造良好網(wǎng)絡(luò)生態(tài),保障公民、法人和其他組織的合法權(quán)益,維護(hù)國家安全和公共利益,構(gòu)建天朗氣清的網(wǎng)絡(luò)空間,國家互聯(lián)網(wǎng)信息辦公室于2019年12月15日發(fā)布《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》。規(guī)定明確了網(wǎng)絡(luò)信息內(nèi)容服務(wù)使用者和生產(chǎn)者、平臺,不得開展網(wǎng)絡(luò)暴力、人肉搜索、深度偽造、流量造假、操縱賬號等違法活動。

本項目從網(wǎng)絡(luò)信息監(jiān)管部門實際需求出發(fā),依托中文語義智能處理相關(guān)技術(shù),打造網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理綜合執(zhí)法平臺,助力凈化網(wǎng)絡(luò)生態(tài)。

(二)項目簡介

本項目以政府、企業(yè)、社會、網(wǎng)民等多元主體參與網(wǎng)絡(luò)生態(tài)治理的需求為導(dǎo)向,以《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》相關(guān)內(nèi)容為指導(dǎo),針對互聯(lián)網(wǎng)海量的信息內(nèi)容,以人工智能、自然語言處理、知識圖譜、復(fù)雜網(wǎng)絡(luò)為理論基礎(chǔ),依托多模態(tài)語義理解相關(guān)技術(shù),打造基于語義智能的網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理綜合執(zhí)法平臺,實現(xiàn)網(wǎng)絡(luò)輿情風(fēng)險語義詞源識別、結(jié)合分布式智能搜索和多模態(tài)信息識別技術(shù)完成互聯(lián)網(wǎng)內(nèi)容日常巡查、融合數(shù)據(jù)挖掘與追蹤溯源技術(shù)實施動態(tài)電子信息取證、基于音視頻識別及語義分析實現(xiàn)多場景智能約談、應(yīng)用深度學(xué)習(xí)和知識圖譜技術(shù)為網(wǎng)信執(zhí)法提供了智能裁量的尺度和參考等,從而為網(wǎng)信管理部門依法依規(guī)治理提供了全覆蓋、透明、高效的工作環(huán)境。

(三)關(guān)鍵技術(shù)

1.分布式智能搜索技術(shù)

基于WebMagic的分布式爬蟲系統(tǒng),通過全面巡查和定向巡查相結(jié)合的方式,面向全網(wǎng)主流平臺的各類文本、圖片、音頻和視頻的多模態(tài)數(shù)據(jù)進(jìn)行7*24小時的實時信息采集。范圍覆蓋全網(wǎng),涉及主題豐富、模態(tài)全面:抖音、快手、好看視頻等平臺的視頻信息;微博、頭條、人民號、澎湃新聞等平臺的文本和圖片信息;喜馬拉雅等平臺的音頻信息。基于Elasticsearch的分布式搜索引擎,通過對多模態(tài)數(shù)據(jù)的索引構(gòu)建,實現(xiàn)對數(shù)據(jù)源的分布式存儲與實時檢索,包括Elasticsearch 分布式集群設(shè)計模塊、垂直領(lǐng)域(網(wǎng)信)個性化詞典構(gòu)建模塊、數(shù)據(jù)索引模塊、數(shù)據(jù)搜索模塊、智能推薦模塊。

2.領(lǐng)域知識圖譜構(gòu)建技術(shù)

項目團隊通過知識抽取、知識表示、知識融合、知識加工等過程構(gòu)建了全量網(wǎng)信法規(guī)案例知識圖譜。該圖譜包含全量網(wǎng)信相關(guān)法規(guī)70部、法律條文1717條、執(zhí)法案例9403件;其中,法律法規(guī)主要通過國家法律法規(guī)數(shù)據(jù)庫獲取;案例主要來自裁判文書網(wǎng)、北大法寶等數(shù)據(jù)庫中的判決文書及執(zhí)法案例。

該圖譜支持類案檢索和智能裁量,是網(wǎng)信執(zhí)法的智能工具。類案檢索:可基于用戶輸入或描述的案例簡介或文書,抽取案件關(guān)系,借助知識圖譜和自然語言處理技術(shù),通過匹配案例的案由和參考法規(guī)等檢索出相似案例。智能裁量:通過對引入法規(guī)和案例知識圖譜的混合神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí),不斷對裁量模型進(jìn)行優(yōu)化、自評估和自學(xué)習(xí),實現(xiàn)對案件的裁量參考。

3.自然語言處理技術(shù)

網(wǎng)絡(luò)有害文本信息檢測。通過自然語言處理技術(shù)精準(zhǔn)高效識別各類場景下色情、邪教、低俗庸俗、違法廣告、封建迷信、暴力血腥、游戲賭博等違規(guī)文本內(nèi)容,提前防御內(nèi)容風(fēng)險。通過采用關(guān)鍵詞組合策略和基于機器學(xué)習(xí)、深度學(xué)習(xí)的多分類檢測模型,實現(xiàn)對有害文本的智慧篩查。

網(wǎng)絡(luò)有害音頻信息檢測。構(gòu)建有害音頻的特征庫:將音頻進(jìn)行采樣數(shù)字化后,對該數(shù)字信號進(jìn)行分幀,通過語音模型得到語音的動態(tài)特性和靜態(tài)特性,構(gòu)建音頻特征庫。實現(xiàn)音頻特征的相似比對:包括涉及鬼叫、喊麥等違規(guī)聲音;涉及歪唱、調(diào)侃、諷刺等歌曲識別。基于音頻轉(zhuǎn)寫的有害音頻內(nèi)容識別:訓(xùn)練基于卷積神經(jīng)網(wǎng)絡(luò)的聲學(xué)模型和基于循環(huán)神經(jīng)網(wǎng)絡(luò)的語言模型實現(xiàn)語音轉(zhuǎn)寫,轉(zhuǎn)寫的文本通過自然語言處理技術(shù)識別有害信息,包括涉及色情、淫穢、挑逗等涉黃音頻;涉及侮辱、詆毀等辱罵音頻等。

4.計算機視覺技術(shù)

基于圖像識別模型組的有害圖片篩查技術(shù):通過圖像內(nèi)容特征識別,精準(zhǔn)高效識別各類場景下色情、邪教、低俗庸俗、違法廣告、封建迷信、暴力血腥、游戲賭博等違規(guī)內(nèi)容。主要包括基于殘差網(wǎng)絡(luò)的色情、游戲賭博、暴力血腥等圖片識別,基于高維殘差網(wǎng)絡(luò)的有害場景識別,基于物品特征的宗教、封建迷信識別等。

基于視頻識別模型組的有害視頻篩查技術(shù):基于殘差網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)等對視頻內(nèi)容進(jìn)行細(xì)粒度解析,精準(zhǔn)高效識別各類場景下色情、邪教、低俗庸俗、違法廣告、封建迷信、暴力血腥、游戲賭博等違規(guī)內(nèi)容,提前防御內(nèi)容風(fēng)險,提高審核效率,凈化網(wǎng)絡(luò)環(huán)境。

基于語義智能的網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理平臺首頁

互聯(lián)網(wǎng)內(nèi)容日常巡查系統(tǒng)頁面

網(wǎng)信法規(guī)案例知識圖譜

項目階段:

原理樣機

會員登錄可查看 合作方式、專利情況及聯(lián)系方式

掃碼關(guān)注,查看更多科技成果

取消
大发888扑克场下载| 百家乐官网棋牌交| 恒丰百家乐官网的玩法技巧和规则| 太仓市| 足球盘口| 大发888 大发888官网| 宝龙百家乐的玩法技巧和规则| 娱乐场百家乐大都| 博E百百家乐官网的玩法技巧和规则| 百家乐官网赌场现金网平台排名| 百家乐官网庄家优势| 百家乐官网娱乐皇冠世界杯| 百家乐官网视频网络游戏| 百家乐官网现场新全讯网| 百家乐官网出千赌具| K7百家乐的玩法技巧和规则 | 百家乐官网真人游戏娱乐网| 金宝博百家乐官网娱乐城| 网上赌百家乐官网可信吗| 百家乐官网龙虎的投注法| 百家乐官网赌机破解| 百家乐官网真钱游戏下载| 百家乐官网好赌吗| 百家乐官网在线赌场娱乐网规则 | 状元百家乐的玩法技巧和规则| 恒丰百家乐的玩法技巧和规则| 百家乐筹码套装包邮| 大发888官方下载| 大发888赢钱最多的| 德州扑克玩法说明| 大庆市| 百家乐官网设备电子路| 澳门百家乐官网赢钱秘诀| 百家乐官网的桌布| 大发888娱乐城 真钱bt| 百家乐官网园选| 24分金| 和政县| 百家乐赢钱好公式| 至尊百家乐官网娱乐网| 大发888dafabet|