數字轉型、治理(lǐ)先行

數據治理(lǐ)(Data Governance)是組織中涉及數據使用(yòng)的一整套管理(lǐ)行為(wèi)。由企業數據治理(lǐ)部門發起并推行,關于如何制定和實施針對整個企業内部數據的商業應用(yòng)和技(jì )術管理(lǐ)的一系列政策和流程。

數據治理(lǐ)不是一蹴而就的,它是一個漫長(cháng)而持續的過程,沒有一針頂破天的訣竅,也沒有立竿見影的途徑。隻有将數據治理(lǐ)變成一種常态化機制,就如同我們每天吃飯、睡覺一樣,形成一種習慣、一種文(wén)化、持之以恒、不忘初心、不懈努力,才能(néng)達到預期目标。


為(wèi)什麽要做數據治理(lǐ)?

答(dá):要建立數據标準,提升數據質(zhì)量,實現數據資産統一管理(lǐ)。

問:為(wèi)什麽要建立數據标準、提升數據質(zhì)量,不做會怎樣?

答(dá):數據質(zhì)量問題比較多(duō),無法提供準确的數據報表,影響業務(wù)效率,無法支撐企業的數字化轉型。

問:都影響到了哪些數據報表、哪些業務(wù)?

答(dá):XX報表不準确、統計口徑不一緻、系統之間數據孤島,數據集成困難……

問:為(wèi)什麽會造成數據報表不準确,口徑不一緻,系統集成難?

答(dá):因為(wèi)數據标準一緻,數據源的數據質(zhì)量差。

采用(yòng)咨詢常用(yòng)的5Why分(fēn)析法,似乎已經得出了數據治理(lǐ)的現狀和目标。将其總結下:通過數據治理(lǐ)實現企業數據的标準化、提高數據質(zhì)量、提升業務(wù)處理(lǐ)的效率,為(wèi)數據分(fēn)析提供準确的數據支撐,賦能(néng)業務(wù),助力企業實現數字化轉型。

但是,仔細分(fēn)析這樣的調研結果是浮于表面的,圍繞數據的問題在原地打轉,沒有将為(wèi)什麽要做數據治理(lǐ)真正想透。

數據要産生價值,需要一個合理(lǐ)的“業務(wù)目标”,數據治理(lǐ)的所有活動應該圍繞真實的業務(wù)目标而開展,建立數據标準、提升數據質(zhì)量隻是手段,而不是目标。因此數據治理(lǐ)的第一步不是分(fēn)析數據問題,而是分(fēn)析業務(wù)問題,找到企業的核心業務(wù)訴求,定義數據治理(lǐ)的目标和範圍。


數據治理(lǐ)主要目标

針對企業目前在數據管理(lǐ)方面存在的問題,需要對企業數據架構進行規劃,構建企業數據管控體(tǐ)系,實現數據全生命周期的統一管理(lǐ),建立數據标準與規範,提供全面、統一的數據服務(wù),靈活支撐業務(wù),為(wèi)企業精(jīng)細化管理(lǐ)提供保障,為(wèi)企業發展創造價值,提升企業運營與管理(lǐ)能(néng)力,打造企業核心競争力。

數據架構規劃定義了數據标準、改造數據環境、規範數據模型、規範數據源、建立了标準的數據管控體(tǐ)系、形成了與管理(lǐ)層和決策層相結合的數據管控組織。其規劃的目标如下:

  • 分(fēn)析業務(wù)運作(zuò)模式的本質(zhì),歸類整理(lǐ)包括業務(wù)表單、統計報表等在内的業務(wù)實體(tǐ)。

  • 建立包含基本數據集、信息分(fēn)類編碼和數據模型等在内的數據架構。

  • 建立業務(wù)信息分(fēn)布矩陣,使數據源分(fēn)析定位到業務(wù)活動層面。

  • 形成規範的數據标準,标準化定義數據。

  • 以科(kē)學(xué)的方法識别出有價值的分(fēn)域主數據,形成系統的主數據管理(lǐ)。

  • 建立數據管控體(tǐ)系和政策,對數據生命周期各個環節進行有效的評價和考核。


數據治理(lǐ)方案概略

企業數據架構的目标就是打破信息孤島,實現企業信息數據共享;應用(yòng)與數據分(fēn)離,實現數據從部門到企業的提升;建立數據轉換為(wèi)價值的體(tǐ)系,讓數據發揮出企業核心資源的效用(yòng),實現數據的增值。

數據規劃的總體(tǐ)指導思路是:以企業組織架構、業務(wù)信息以及現有的數據管控體(tǐ)系等内容,參考行業較好實踐以及國(guó)際參考模型(如TOGAF集成信息模型、FEA數據模型),形成企業數據規劃報告,包括劃分(fēn)業務(wù)主題域,進行數據分(fēn)類、識别相關實體(tǐ)、構建數據模型,規範主數據與編碼規則,建立數據管控體(tǐ)系,構建數據管控平台。

其中:數據管控體(tǐ)系必須從組織、标準、規程和技(jì )術保障四個方面建立。明确的數據管控組織架構和角色職能(néng)劃分(fēn)可(kě)以有效地保障數據規程的落地;數據标準是數據管理(lǐ)的基礎;數據管理(lǐ)規程定義了數據管理(lǐ)應當遵循的規範;技(jì )術平台的建設和優化為(wèi)數據規範管理(lǐ)提供支撐。這四方面構成了完整的數據管控體(tǐ)系,保證數據管理(lǐ)有标準、有制度、有稽核、有手續、有手段、有檢查、有考核,使得各項數據管理(lǐ)工作(zuò)能(néng)夠得到有效落實,達到數據準确、完整的目标,并能(néng)夠提供有效的增值服務(wù)。


實施效益

建立企業數據架構規劃,指引企業數據治理(lǐ)持續改進;

建立數據标準,提升管控能(néng)力,有效保障數據治理(lǐ)目标有效落地;

建立數據模型(主數據模型),規範數據全生命周期管理(lǐ),打破信息孤島,實現數據有效共享;

建立數據質(zhì)量管控體(tǐ)系,提高業務(wù)數據的一緻性,增強集團、跨域、跨業務(wù)的協調能(néng)力;有效支持内控,減低企業的信息安(ān)全風險;

建立和優化企業數據技(jì )術架構,形成端到端的信息流傳遞與管控,優化業務(wù)流程,建立可(kě)視化數據決策體(tǐ)系,充分(fēn)利用(yòng)數據資産,提升企業核心競争力。


數據治理(lǐ)不是一個“項目”,難以立竿見影的效果!

數據治理(lǐ)的最終目标是賦能(néng)業務(wù),提升數據價值。這是一個持續漫長(cháng)的運營過程,需要逐步完善、分(fēn)步叠代,指望一步到位完成數據治理(lǐ)是不現實的

項目型的數據治理(lǐ),是不全面的,無延續性,能(néng)夠解決一時的數據問題,但很(hěn)難獲得持續的數據價值。

因此說,數據治理(lǐ)不是一個“項目”,而是一個持續運營的過程。我們也可(kě)以将這個過程,看作(zuò)是由一個個數據治理(lǐ)“微項目”組成,連續的、螺旋上升的模型。一個項目的結案,不是企業數據治理(lǐ)的終點,而是企業數據治理(lǐ)真正的起點!


做了數據治理(lǐ),為(wèi)什麽數據質(zhì)量依然很(hěn)差?

例如企業多(duō)年前就做了數據治理(lǐ),建立了數據治理(lǐ)平台,元數據管理(lǐ)、數據質(zhì)量管理(lǐ)等功能(néng)都有了,但是數據質(zhì)量問題還是很(hěn)多(duō),導緻花(huā)了很(hěn)多(duō)錢建設的BI系統基本都沒人用(yòng),有什麽好的方式解決?

原因是數據質(zhì)量差、BI用(yòng)不起來,這個問題雖然常見,但是10家有相同問題的企業中,有9家的原因是不一樣的。在沒有經過詳細調查,不了解具體(tǐ)背景的情況下,是不能(néng)貿然給出建議的。

盤點了一般引發數據質(zhì)量問題的各種原因:

  • 有業務(wù)方面的數據定義不明确,也有技(jì )術方面的數據抽取不完整;

  • 有管理(lǐ)方面的崗位職責不清晰,也有執行層面的數據操作(zuò)不規範;

  • 有數據處理(lǐ)加工過程中出現了錯誤,也有數據源本身就有問題;

  • 有數據治理(lǐ)系統功能(néng)有缺陷,也有系統強大但是沒人用(yòng)……

做過了數據治理(lǐ),企業的數據質(zhì)量就一定能(néng)提升嗎?其原意是要問:上過了數據治理(lǐ)系統或實施了數據治理(lǐ)項目,為(wèi)什麽還會有數據質(zhì)量問題。這個問題很(hěn)複雜。正如上文(wén)中的項目型數據治理(lǐ),點到為(wèi)止,治标不治本。有的企業認為(wèi)數據治理(lǐ)就是上一套強大的數據治理(lǐ)平台,隻要平台功能(néng)強大,就能(néng)管好數據,這恰恰是陷入了另一個誤區(qū)——唯工具論,豈不知數據治理(lǐ)的本質(zhì)是管理(lǐ)數據,而不是管理(lǐ)程序、腳本和任務(wù)。

另外,還有很(hěn)多(duō)企業是出現了數據問題,并且對業務(wù)造成很(hěn)大影響之後才去進行治理(lǐ)的——被動式治理(lǐ),失去了治理(lǐ)數據的主動權,常常是解決了一個問題又引出了更多(duō)的問題。……

世界上沒有“包治百病”的數據平台,隻有将數據治理(lǐ)常态化,持續地去做才是王道。


數據治理(lǐ)之道

1. 數據治理(lǐ)需要體(tǐ)系建設

為(wèi)發揮數據價值需要滿足三個要素:合理(lǐ)的平台架構、完善的治理(lǐ)服務(wù)、體(tǐ)系化的運營手段

根據企業的規模、所屬行業、數據量等情況選擇合适的平台架構;治理(lǐ)服務(wù)需要貫穿數據全生命周期,保證數據在采集、加工、共享、存儲、應用(yòng)整個過程中的完整性、準确性、一緻性和實效性;運營手段則應當包括規範的優化、組織的優化、平台的優化以及流程的優化等等方面。

2. 數據治理(lǐ)需要夯實基礎

數據治理(lǐ)需要循序漸進,但在建設初期至少需要關注三個方面:數據規範、數據質(zhì)量、數據安(ān)全。規範化的模型管理(lǐ)是保障數據可(kě)以被治理(lǐ)的前提條件,高質(zhì)量的數據是數據可(kě)用(yòng)的前提條件,數據的安(ān)全管控是數據可(kě)以共享交換的前提條件。

3. 數據治理(lǐ)需要IT賦能(néng)

數據治理(lǐ)不是一堆規範文(wén)檔的堆砌,而是需要将治理(lǐ)過程中所産生的的規範、流程、标準落地到IT平台上,在數據生産過程中通過“以終為(wèi)始”前向的方式進行數據治理(lǐ),避免事後稽核帶來各種被動和運維成本的增加。

4. 數據治理(lǐ)需要聚焦數據

數據治理(lǐ)的本質(zhì)是管理(lǐ)數據,因此需要加強元數據管理(lǐ)和主數據管理(lǐ),從源頭治理(lǐ)數據,補齊數據的相關屬性和信息,比如:元數據、質(zhì)量、安(ān)全、業務(wù)邏輯、血緣等,通過元數據驅動的方式管理(lǐ)數據生産、加工和使用(yòng)。

5. 數據治理(lǐ)需要建管一體(tǐ)化

數據模型血緣與任務(wù)調度的一緻性是建管一體(tǐ)化的關鍵,有助于解決數據管理(lǐ)與數據生産口徑不一緻的問題,避免出現兩張皮的低效管理(lǐ)模式