基于本體的數字出版物語義標注優化方法
2022-08-12 16:32:31
云上高博會
http://www.a00n.com
所屬領域:
新一代信息技術
項目成果/簡介:
本專利系統所要解決的技術問題正是對上述存在的技術不足,提出了一種基于本體的數字岀版物語義標注優化方法。其公開了在語義分析與標注方法中,進行段落分詞,其中,段落分詞包括字符串匹配分詞、最短路徑分詞和詞義分詞法等
一、項目分類
關鍵核心技術突破
二、成果簡介
現階段關于數字出版物內容提煉標注技術大多是根據基本詞庫及內容上下文進行抽取的,沒有結合出版物的領域背景,從而降低了標注在特定領域的準確性,導致信息可達性降低、傳播效率降低。
本專利系統所要解決的技術問題正是對上述存在的技術不足,提出了一種基于本體的數字岀版物語義標注優化方法。其公開了在語義分析與標注方法中,進行段落分詞,其中,段落分詞包括字符串匹配分詞、最短路徑分詞和詞義分詞法等;然后進行語義標注,即為文本中的詞分配詞性信息(例如名詞、動詞等);最后,進行段落-維度結構化關聯,將段落在語義空間上的點坐標表示出來。
因此,本發明相對于上述該文獻實際解決的技術問題是:如何提高標注的準確性和檢索的準確性。本專利系統對數字出版內容進行知識化加工,優化了現有的語義標注方法。
應用范圍:
隨著計算機、通訊以及網絡技術的發展,互聯網數字內容資源爆炸式增長,傳統出版業務與數字出版業務并重發展的格局逐步形成。數字出版強調內容數字化、生產模式和運作流程的數字化、傳播載體的數字化閱讀和消費形態的數字化。數字岀版業務中最為核心的工作就是內容資源的整合與利用。
武漢理工大學聯合時代出版傳媒股份有限公司,面向國家新聞出版行業發展的重大需求和普遍問題,立足自主創新,對知識資源統一組織、知識資源語義加工、知識資源精準推送等數字出版智能服務關鍵技術進行攻關與應用,形成專利:基于本體的數字出版物語義標注優化方法。
本專利已廣泛應用于出版社、期刊社和互聯網知識服務企業,覆蓋全國20個省/直轄市,服務于全國1700多家出版機構,有效降低平臺用戶信息獲取成本,緩解信息過載問題,提升用戶的消費體驗。目前,全國已有1570家期刊社加入到該計劃中,有效提髙其傳播力,加強科研誠信建設(見“附件2-1應用評價”)。
效益分析:
1、經濟效益
數字出版智能服務平臺在該專利的支撐下,提升了用戶內容檢索和標注信息主動服務的交互體驗,用戶知識服務的感知價值逐步提升,導致內容消費用戶快速增加、內容消費金額不斷增長,形成了知識服務增收和內容產品(即書報刊等出版物)增收兩大收入來源。
其中,知識服務增收由專利權人(平臺方)和出版機構分成,專利權人分成占40%,數字出版智能服務平臺2019-2020兩年產生的知識服務增收分別為87173.23萬元、90607. 87萬元,所以兩年新增利潤為34869. 29萬元、36243. 15萬元。內容產品(即書報刊等出版物)增收專利權人不分成,由出版機構獨享。
2、社會效益
1)科技創新體系建設。在項目成果的基礎上,武漢理工大學建設有國家數字傳播創新人才培養示范基地、國家新聞出版署出版融合發展(武漢)重點實驗室、國家出版融合數據共享研發基地、湖北省數字出版工程技術研究中心等科研機構,形成大數據知識服務和媒介融合領域產學研一體化的科研創新集群。時代出版傳媒股份有限公司作為牽頭單位建設的“教育資源動態數字出版重點實驗室”成功入選原國家新聞岀版廣電總局岀版融合發展重點實驗室和安徽省重點實驗室。
2)保障文化安全輿論安全。以此專利及相關專利技術構建起數字出版智能服務平臺,為新聞出版機構的融合轉型提供整體解決方案,壯大主流輿論陣地,堅守意識形態安全。其中,武漢•國家出版融合數據共享研發基地等數據中心的建設,實現了全國新聞出版行業大數據的共享存貯,為保障國家文化安全、網絡信息安全、大數據安全奠定堅實基礎。
3)提高公共文化服務水平。本專利的實施從新聞出版機構的供給側出發,依托其專業生產、垂直細分和場景應用等優勢,以紙質書報刊為介質,將優質、多形態的知識資源與受眾的理想需求進行對接,拓展了服務端深度和廣度。同時,項目的實施重點在教育領域多方整合教育資源,利用教輔參考教材等書刊的線上衍生知識服務,使得公眾能夠享受到更加公平、髙效、優質、便捷的公共文化服務,有效促進教育公平。
4)助力科技抗疫。基于本專利的技術支撐研發出的數字出版智能服務平臺入選科技部“科學抗疫一一先進技術成果信息共享服務平臺”、工信部《中國信息消費助力疫情防控案例入選名單》(中信推聯盟發(2020)5號)和武漢市《東湖高新區首批科技企業抗疫創新應用案例與技術產品訂單》。在本次新冠疫情防控期間,武漢理工數字傳播工程有限公司聯合天津出版集團、中文天地出版傳媒集團股份有限公司、浙江出版集團、廣東時代傳媒、長江出版傳媒等多家出版單位,將總價值為1600萬元基于K12教材教輔的在線知識資源與服務全部以公益免費的方式發放給全國小學一年級至髙中三年級的學生與家長,保障全國中小學生“停課不停學”。
知識產權類型:
發明專利
知識產權編號:
ZL201510156576.1
技術成熟度:
可以量產
技術先進程度:
達到國內領先水平
成果獲得方式:
與企業合作
掃碼關注,查看更多科技成果