點擊上方圖片鏈接回看年會視頻
11月26-27日,由中國社會科學(xué)院信息化研究中心、北京國脈互聯(lián)信息顧問有限公司、舟山國脈集團(tuán)有限公司聯(lián)合主辦的年度改革創(chuàng)新研討盛會(第16年)——“2020智慧中國年會”在北京召開,以“十四五前瞻與智治社會建設(shè)”為主題,共有來自全國部委、省、市、區(qū)縣電子政務(wù)、智慧城市、大數(shù)據(jù)主管領(lǐng)導(dǎo)、行業(yè)專家、企業(yè)代表、主流媒體千余人參會。
本文系國脈集團(tuán)產(chǎn)品經(jīng)理鐘乙喬于11月26日下午在“2020智慧中國年會”上的“新基建賦能數(shù)字社會——數(shù)字經(jīng)濟(jì)篇”分論壇上的演講,演講主題為“數(shù)據(jù)母體-數(shù)字基建底座”,內(nèi)容通過現(xiàn)場速記整理,未經(jīng)本人審核。
「國脈集團(tuán)產(chǎn)品經(jīng)理 鐘乙喬」
<--------------------以下為演講內(nèi)容------------------>
各位領(lǐng)導(dǎo)、各位嘉賓,大家下午好,我是網(wǎng)脈科技產(chǎn)品經(jīng)理鐘乙喬,前面各位領(lǐng)導(dǎo)講了關(guān)于數(shù)字新基建的一些看法、思路和運行方式,作為數(shù)字經(jīng)濟(jì)的一個底層,接下來我給大家介紹數(shù)據(jù)母體——數(shù)字基建底座。
一、建設(shè)背景
(一)數(shù)據(jù)治理的難點痛點
在數(shù)字新基建的發(fā)展環(huán)境下,我們長期關(guān)注數(shù)據(jù)治理這個重要關(guān)注點。只有做好數(shù)據(jù)治理才能把新基建的最基層工作做好,數(shù)據(jù)治理的難點、痛點主要體現(xiàn)在以下幾方面。
一是數(shù)據(jù)標(biāo)準(zhǔn)化低,很多業(yè)務(wù)公司、技術(shù)公司在創(chuàng)建一些數(shù)據(jù)庫或者一些表字段時,對于字段的規(guī)范、長度和類型都沒有做到極致的標(biāo)準(zhǔn)化。
二是數(shù)據(jù)交換成本高,正因為數(shù)據(jù)不標(biāo)準(zhǔn),這些問題就導(dǎo)致做數(shù)據(jù)交換的時候成本比較大。比如實際項目需要外部接口或者底層數(shù)據(jù)去交換的時候,就要花大量的時間和人力做對接,甚至完成對接以后的結(jié)果并不是非常理想。
三是底層數(shù)據(jù)重視程度低,業(yè)務(wù)數(shù)據(jù)的基礎(chǔ)庫和數(shù)據(jù)元池存在著缺失。
四是跨行業(yè)數(shù)據(jù)融合困難,發(fā)生跨業(yè)務(wù)數(shù)據(jù)融合時非常困難。數(shù)據(jù)之間無法完成精準(zhǔn)的供需匹配。
這些都導(dǎo)致多網(wǎng)并存、信息孤島、二次錄入、數(shù)據(jù)壁壘的現(xiàn)象存在。
(二)數(shù)據(jù)標(biāo)準(zhǔn)化影響數(shù)據(jù)應(yīng)用質(zhì)量
在規(guī)劃方面,很多大型項目在開展的前期缺乏數(shù)據(jù)規(guī)劃,缺乏系統(tǒng)性的框架結(jié)構(gòu);
在標(biāo)準(zhǔn)依據(jù)方面,數(shù)據(jù)標(biāo)準(zhǔn)的依據(jù)標(biāo)準(zhǔn)都是不一的,有些使用了國家標(biāo)準(zhǔn),有些使用了行業(yè)標(biāo)準(zhǔn),有些甚至沒有使用任何標(biāo)準(zhǔn),這導(dǎo)致了數(shù)據(jù)定義各異;
在應(yīng)用方面,我們對于業(yè)務(wù)字段和技術(shù)字段會產(chǎn)生一些歧義,同樣的字段名稱在不同的業(yè)務(wù)和技術(shù)體系當(dāng)中代表的意思不同,可能造成邏輯關(guān)系脫節(jié)現(xiàn)象。
所以要做好數(shù)據(jù)標(biāo)準(zhǔn)化,做好字段的標(biāo)準(zhǔn)化,對象定義的標(biāo)準(zhǔn)化,代碼的標(biāo)準(zhǔn)化,還有業(yè)務(wù)指標(biāo)的標(biāo)準(zhǔn)化等。
(三)統(tǒng)一規(guī)范的數(shù)據(jù)元是數(shù)據(jù)標(biāo)準(zhǔn)化的基礎(chǔ)
數(shù)據(jù)元是數(shù)據(jù)的最小的單元,它的質(zhì)量好壞直接影響對語義的認(rèn)知,在我們的數(shù)據(jù)傳遞、流通、交換、融合、共享當(dāng)中,它都是最底層的、最基礎(chǔ)的要求,數(shù)據(jù)元是數(shù)據(jù)的“底層建筑”、在數(shù)據(jù)體系中具有基礎(chǔ)地位,數(shù)據(jù)母體是新基建的底層。
(四)政策要求做好數(shù)據(jù)化標(biāo)準(zhǔn)工作
近年來,國家及地方相關(guān)政府主管部門接踵發(fā)布各自領(lǐng)域數(shù)據(jù)元標(biāo)準(zhǔn)和數(shù)據(jù)元目錄,如國家標(biāo)準(zhǔn)化委員會《電子政務(wù)數(shù)據(jù)元標(biāo)準(zhǔn)》、北京《法人基礎(chǔ)信息數(shù)據(jù)元目錄規(guī)范》、安徽《公共信息用信息數(shù)據(jù)元目錄》、遼寧《漁業(yè)信息化基礎(chǔ)數(shù)據(jù)元》、湖南《地名數(shù)據(jù)元規(guī)范》等。
二、數(shù)據(jù)母體
(一)產(chǎn)品概念
數(shù)據(jù)母體是基于公共數(shù)據(jù)元與電子政務(wù)主題詞的數(shù)據(jù)治理綜合服務(wù)平臺。它提供高質(zhì)量標(biāo)準(zhǔn)化的服務(wù),為數(shù)據(jù)治理與數(shù)據(jù)質(zhì)量再造提供綜合性解決方案,構(gòu)建全球數(shù)據(jù)體系的語言詞典——數(shù)據(jù)元字典。
數(shù)據(jù)母體主要從“軟件、數(shù)據(jù)、咨詢、服務(wù)”四個方面為數(shù)據(jù)治理提供服務(wù)。軟件方面,我們有數(shù)據(jù)治理的綜合服務(wù)平臺、數(shù)據(jù)標(biāo)準(zhǔn)發(fā)源地和數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)檢測場、標(biāo)準(zhǔn)化數(shù)據(jù)的加工工具、原始數(shù)據(jù)質(zhì)量的診斷工具;數(shù)據(jù)方面,收錄了國家出臺的標(biāo)準(zhǔn)文件,收錄了電子政務(wù)主題詞、公共數(shù)據(jù)元,還有標(biāo)準(zhǔn)術(shù)語和標(biāo)準(zhǔn)分類等,為數(shù)據(jù)治理提供一套標(biāo)準(zhǔn)政務(wù)數(shù)據(jù)設(shè)施,為異構(gòu)數(shù)據(jù)間的共享、轉(zhuǎn)換、互操作、質(zhì)量管理、內(nèi)容加工與服務(wù)等提供基礎(chǔ);咨詢方面,當(dāng)用戶有需求,我們從行業(yè)領(lǐng)域、時間維度為用戶去梳理應(yīng)該涉及的最基層的標(biāo)準(zhǔn),還包含一些指標(biāo)評估等的咨詢服務(wù);服務(wù)方面,我們提供數(shù)據(jù)服務(wù)和產(chǎn)品服務(wù),也可以數(shù)據(jù)+產(chǎn)品組合的方式來做好數(shù)據(jù)治理。
(二)框架結(jié)構(gòu)
框架結(jié)構(gòu)圖
產(chǎn)品框架結(jié)構(gòu)主要分為數(shù)據(jù)來源、存儲層、功能層及應(yīng)用場景。其中數(shù)據(jù)來源主要為國家標(biāo)準(zhǔn)文件、行業(yè)標(biāo)準(zhǔn)文件及其他;存儲層包含公共數(shù)據(jù)元池、電子政務(wù)主題詞庫、數(shù)據(jù)模型庫及標(biāo)準(zhǔn)數(shù)據(jù)元池;功能層主要包含池庫定制、數(shù)據(jù)比對、數(shù)據(jù)清洗、數(shù)據(jù)元關(guān)聯(lián)分析、標(biāo)準(zhǔn)設(shè)計、模型應(yīng)用等功能;主要的應(yīng)用場景包含標(biāo)準(zhǔn)查詢、數(shù)據(jù)建模、質(zhì)量分析及數(shù)據(jù)檢測。
(三)運行邏輯
運行邏輯是依托于數(shù)據(jù)母體當(dāng)中的數(shù)據(jù),經(jīng)過清晰比對,把標(biāo)準(zhǔn)數(shù)據(jù)存入到公共數(shù)據(jù)元池當(dāng)中,通過對數(shù)據(jù)的定義和業(yè)務(wù)的定義來對應(yīng)用場景做設(shè)定,構(gòu)建數(shù)據(jù)模型。再將這些數(shù)據(jù)分層分級分類,形成數(shù)據(jù)集市以供用戶按需選擇。另一方面,通過規(guī)則配置對用戶原有數(shù)據(jù)進(jìn)行質(zhì)量檢測,將結(jié)果生成診斷的報告,附加咨詢梳理服務(wù)給出對原有數(shù)據(jù)情況的整改建議。
實例:在政務(wù)大廳或者網(wǎng)上辦事的時候,有些材料會寫來源渠道是共享還是自備,共享和自備的前提是底層數(shù)據(jù)要統(tǒng)一和規(guī)范,也就是說大家所獲取到的材料名稱必須與實際數(shù)據(jù)庫里的數(shù)據(jù)名稱一致,不能出現(xiàn)歧義,不然數(shù)據(jù)無法共享。
(二)產(chǎn)品優(yōu)勢
1.數(shù)據(jù)量全:目前已收錄國家發(fā)布的標(biāo)準(zhǔn)文件1764份,公共數(shù)據(jù)元372883條,范疇目錄190個、范疇表政務(wù)主題詞24151個,行業(yè)主題詞16180個,標(biāo)準(zhǔn)術(shù)語1909個、分類編碼1304個,區(qū)劃地址63895個(部分細(xì)化到省市縣區(qū)街道樓道)。
2.顆粒度細(xì):收錄的數(shù)據(jù)細(xì)化到了數(shù)據(jù)元標(biāo)識符、數(shù)據(jù)元類型、數(shù)據(jù)元表示、標(biāo)準(zhǔn)文件標(biāo)準(zhǔn)號、版本(年代)號、ICS編碼、CCS編碼、發(fā)布機(jī)構(gòu)。
3.自定義配置:數(shù)據(jù)維度、領(lǐng)域可配置、數(shù)據(jù)模型可配置、清洗規(guī)則可配置、診斷報告可配置。
(三)應(yīng)用場景
1.快速建模生成數(shù)據(jù)元基礎(chǔ)庫。基于場景需求定制,特別是各地政府對數(shù)據(jù)元采集、整理、建庫的規(guī)劃需求,通過標(biāo)準(zhǔn)數(shù)據(jù)元組合,可快速建模形成法人、船舶等各行業(yè)數(shù)據(jù)元基礎(chǔ)庫。
2.輔助構(gòu)建標(biāo)準(zhǔn)核心數(shù)據(jù)元池。核心數(shù)據(jù)元池建立,是各地政府信息資源標(biāo)準(zhǔn)化的基礎(chǔ)。根據(jù)實際需求,梳理出核心數(shù)據(jù)元,并通過數(shù)據(jù)元清洗比對、標(biāo)準(zhǔn)化處理和智能標(biāo)注關(guān)聯(lián),構(gòu)建標(biāo)準(zhǔn)的核心數(shù)據(jù)元池。
3.行業(yè)數(shù)據(jù)元評估清洗標(biāo)準(zhǔn)化。助力提升數(shù)據(jù)元質(zhì)量、規(guī)范數(shù)據(jù)交換底層。
4.事項梳理標(biāo)準(zhǔn)數(shù)據(jù)表單建設(shè)。平臺支持標(biāo)準(zhǔn)數(shù)據(jù)元自由組合、關(guān)聯(lián)、建模,可協(xié)助快速創(chuàng)建和生成標(biāo)準(zhǔn)數(shù)據(jù)表單,且數(shù)據(jù)元標(biāo)準(zhǔn)規(guī)范統(tǒng)一,也有助于“多表合一”,提升事項梳理效率和標(biāo)準(zhǔn)化程度。
5.軟件質(zhì)量問題與標(biāo)準(zhǔn)化檢測。借助相關(guān)數(shù)據(jù)元標(biāo)準(zhǔn)、體系、方法,可在一定程度上輔助軟件系統(tǒng)在研制和維護(hù)過程中形成適用于各領(lǐng)域系統(tǒng)數(shù)據(jù)質(zhì)量問題的高效預(yù)防措施和最佳解決方案。
6.基于數(shù)據(jù)服務(wù)創(chuàng)建應(yīng)用模型。通過大數(shù)據(jù)分析應(yīng)用、自定義報表,實現(xiàn)數(shù)據(jù)的可視化展示;通過組織畫像、個人畫像等數(shù)據(jù)多維度分析,清晰了解業(yè)務(wù)對象的現(xiàn)狀與需求。
三、產(chǎn)品價值
(一)全要素建立數(shù)據(jù)資源體系
“數(shù)據(jù)母體”支持海量數(shù)據(jù)元存儲,用戶可根據(jù)需要批量導(dǎo)入數(shù)據(jù)元到其專項數(shù)據(jù)庫或系統(tǒng),對其數(shù)據(jù)元資產(chǎn)進(jìn)行存儲,并利用平臺提供的數(shù)據(jù)元目錄、數(shù)據(jù)元資產(chǎn)統(tǒng)計、數(shù)據(jù)元清洗、數(shù)據(jù)元校驗、智能關(guān)聯(lián)等模塊,有效管控數(shù)據(jù)元。
(二)全階段推進(jìn)數(shù)據(jù)標(biāo)準(zhǔn)落地
“數(shù)據(jù)母體”收錄千余份涵蓋國際、國家、地區(qū)、行業(yè)權(quán)威的數(shù)據(jù)元及數(shù)據(jù)元值域的標(biāo)準(zhǔn)規(guī)范、數(shù)據(jù)字典等,并持續(xù)擴(kuò)充,借助數(shù)據(jù)元標(biāo)準(zhǔn)化處理,推動數(shù)據(jù)元標(biāo)準(zhǔn)落地;用戶對數(shù)據(jù)元標(biāo)準(zhǔn)的選擇、反饋,也有助于各行業(yè)數(shù)據(jù)元標(biāo)準(zhǔn)的優(yōu)化改造,并進(jìn)一步提升數(shù)據(jù)元“上層建筑”數(shù)據(jù)、信息資源、事項等的標(biāo)準(zhǔn)化。
(三)全流程提升數(shù)據(jù)質(zhì)量
依托“數(shù)據(jù)母體”,對數(shù)據(jù)元進(jìn)行標(biāo)準(zhǔn)化檢測評估和可視化統(tǒng)計分析等,有助于從數(shù)據(jù)元層面排查、追溯和定位數(shù)據(jù)質(zhì)量問題發(fā)生的癥結(jié)所在,包括數(shù)據(jù)元名稱同義重復(fù)、值域格式不規(guī)范、數(shù)據(jù)元與其值域不關(guān)聯(lián)等;基于問題有針對性地對數(shù)據(jù)元進(jìn)行清洗比對、標(biāo)準(zhǔn)化、智能標(biāo)注關(guān)聯(lián)等,可有效提升數(shù)據(jù)元及數(shù)據(jù)質(zhì)量。
(四)全方面打造共享開放應(yīng)用
“數(shù)據(jù)母體”支持?jǐn)?shù)據(jù)元消費者、提供者、服務(wù)者、運營者等注冊入駐,并提供豐富的API和多樣化數(shù)據(jù)采集方式,實現(xiàn)數(shù)據(jù)元產(chǎn)業(yè)鏈內(nèi)外各類資源不斷集聚;平臺用戶基于交易和支付系統(tǒng),可進(jìn)行數(shù)據(jù)元相關(guān)資源與服務(wù)流通,促進(jìn)數(shù)據(jù)元資源應(yīng)用變現(xiàn)與服務(wù)創(chuàng)新。
四、核心服務(wù)
(一)數(shù)據(jù)元質(zhì)量檢測服務(wù)
利用數(shù)據(jù)母體,根據(jù)預(yù)先配置的規(guī)則、算法和度量指標(biāo)等,對客戶擁有的數(shù)據(jù)元資產(chǎn)進(jìn)行在線質(zhì)量檢測,包括數(shù)據(jù)元同義重復(fù)、標(biāo)準(zhǔn)化程度等,并可視化呈現(xiàn)檢測結(jié)果;同時根據(jù)客戶需要,可由專業(yè)咨詢?nèi)藛T提供深度數(shù)據(jù)元質(zhì)量檢測評估分析報告與相關(guān)改進(jìn)、優(yōu)化方案等服務(wù)。
(二)數(shù)據(jù)元池庫定制服務(wù)
根據(jù)客戶需求,通過標(biāo)準(zhǔn)數(shù)據(jù)元選取組合、清洗比對、智能標(biāo)注關(guān)聯(lián)及數(shù)據(jù)元目錄編制、模型創(chuàng)建等,快速構(gòu)建各種領(lǐng)域、行業(yè)、主題的標(biāo)準(zhǔn)數(shù)據(jù)元基礎(chǔ)庫、核心數(shù)據(jù)元池和核心數(shù)據(jù)字典,且支持通過API開放相關(guān)數(shù)據(jù)庫授權(quán)服務(wù)。
(三)數(shù)據(jù)元建模服務(wù)
提供大量數(shù)據(jù)元模板,用戶可自主選購自己需要的標(biāo)準(zhǔn)數(shù)據(jù)元模板;當(dāng)標(biāo)準(zhǔn)數(shù)據(jù)元模板無法滿足需求時,用戶可借助數(shù)據(jù)元公共服務(wù)平臺、以標(biāo)準(zhǔn)字段自定義創(chuàng)建契合自身業(yè)務(wù)需求和業(yè)務(wù)應(yīng)用的數(shù)據(jù)元模型。
(四)數(shù)據(jù)元在線標(biāo)準(zhǔn)設(shè)計服務(wù)
針對不同行業(yè)、不同主體,基于現(xiàn)有權(quán)威國際/國家/地區(qū)/行業(yè)數(shù)據(jù)元標(biāo)準(zhǔn)和標(biāo)準(zhǔn)數(shù)據(jù)元,結(jié)合實際應(yīng)用場景、行業(yè)特色和客戶需求,在線設(shè)計、整理、編目、編制符合需求的各種領(lǐng)域/行業(yè)、主題的數(shù)據(jù)元標(biāo)準(zhǔn);提供數(shù)據(jù)元標(biāo)準(zhǔn)導(dǎo)出、整理成符合相關(guān)格式規(guī)范的數(shù)據(jù)元標(biāo)準(zhǔn)文件等服務(wù).
五、應(yīng)用案例
數(shù)據(jù)母體已經(jīng)在多省市,多個地區(qū),項目上實際應(yīng)用。
浙江省—— “最多跑一次”全省事項數(shù)據(jù)串梳理
深圳市——政務(wù)信息資源目錄白皮書(2017)及核心數(shù)據(jù)字典項目
浙江省——全省核心標(biāo)準(zhǔn)數(shù)據(jù)元池建設(shè)
海南省——法人庫、人口庫基礎(chǔ)數(shù)據(jù)元\擴(kuò)展數(shù)據(jù)元信息梳理
公安部——大數(shù)據(jù)時代基礎(chǔ)信息采集錄入規(guī)范研究
南寧市——政務(wù)信息資源目錄梳理服務(wù)項目
舟山市——舟山市民生基礎(chǔ)信息數(shù)據(jù)標(biāo)準(zhǔn)和交換規(guī)范編制
上海徐匯區(qū)——政務(wù)信息資源目錄體系建設(shè)
北京西城區(qū)——大數(shù)據(jù)資源目錄梳理服務(wù)項目
佛山三水區(qū)——政務(wù)信息資源資產(chǎn)清單梳理
···
數(shù)據(jù)母體產(chǎn)品今天就介紹到這里,謝謝大家。
2020智慧中國年會新聞專場
掃描二維碼直接進(jìn)入
注:獲取更多會議資訊及嘉賓演講資料,歡迎登錄“2020智慧中國年會官網(wǎng)”,或關(guān)注“國脈數(shù)字智庫”公眾號。