中版集團數字傳媒有限公司“大數據內容知識挖掘與分析平臺”運用了語義網本體構建、搭建了經濟、歷史、心理學、中醫養生、一帶一路、絲路“系列”等專業領域的知識圖譜,基于自然語言處理技術自動深度結構化內容數據并挖掘內在價值,形成具有領域知識標簽的最小片段知識單元,這些知識單元可以根據產品設計的需要進行重組,以為產品及服務模式創新提供更科學更精準的內容支撐。
該平臺是公司知識內容大數據的生產平臺,徹底打破了原有圖書內容的結構,充分挖掘數據價值。目前已構建的歷史領域知識標簽達17000余個,經濟領域知識標簽達19000余個,心理學、中醫、一帶一路領域知識標簽達千8000余種,絲路“系列”知識標簽24000余個。已經數據化、知識化的知識單元達200余萬條,初步實現了知識內容數量規模化、知識內容顆粒精細化以及知識內容關聯化,內容數據化的實現為未來實現出版行業大數據分析、業務模式創新提供重要動能。