大數據分(fēn)析是指對規模巨大的數據進行分(fēn)析。大數據可(kě)以概括為(wèi)5個V, 數據量大(Volume)、速度快(Velocity)、類型多(duō)(Variety)、價值(Value)、真實性(Veracity)。
大數據分(fēn)析的六個基本方面
1. 可(kě)視化分(fēn)析(Analytic Visualizations)
不管是對數據分(fēn)析專家還是普通用(yòng)戶,數據可(kě)視化是數據分(fēn)析工具最基本的要求。可(kě)視化可(kě)以直觀的展示數據,讓數據自己說話,讓觀衆聽到結果。
2. 數據挖掘算法(Data Mining Algorithms)
可(kě)視化是給人看的,數據挖掘就是給機器看的。集群、分(fēn)割、孤立點分(fēn)析還有其他(tā)的算法讓我們深入數據内部,挖掘價值。這些算法不僅要處理(lǐ)大數據的量,也要處理(lǐ)大數據的速度。
3. Predictive Analytic Capabilities(預測性分(fēn)析能(néng)力)
數據挖掘可(kě)以讓分(fēn)析員更好的理(lǐ)解數據,而預測性分(fēn)析可(kě)以讓分(fēn)析員根據可(kě)視化分(fēn)析和數據挖掘的結果做出一些預測性的判斷。
4. 語義引擎(Semantic Engines)
我們知道由于非結構化數據的多(duō)樣性帶來了數據分(fēn)析的新(xīn)的挑戰,我們需要一系列的工具去解析,提取,分(fēn)析數據。語義引擎需要被設計成能(néng)夠從“文(wén)檔”中智能(néng)提取信息。
5. 數據質(zhì)量和數據管理(lǐ)(Data Quality and Master Data Management)
數據質(zhì)量和數據管理(lǐ)是一些管理(lǐ)方面的最佳實踐。通過标準化的流程和工具對數據進行處理(lǐ)可(kě)以保證一個預先定義好的高質(zhì)量的分(fēn)析結果。
假如大數據真的是下一個重要的技(jì )術革新(xīn)的話,我們最好把精(jīng)力關注在大數據能(néng)給我們帶來的好處,而不僅僅是挑戰。
6.數據存儲,數據倉庫(Data Storage)
數據倉庫是為(wèi)了便于多(duō)維分(fēn)析和多(duō)角度展示數據按特定模式進行存儲所建立起來的關系型數據庫。在商業智能(néng)系統的設計中,數據倉庫的構建是關鍵,是商業智能(néng)系統的基礎,承擔對業務(wù)系統數據整合的任務(wù),為(wèi)商業智能(néng)系統提供數據抽取、轉換和加載(ETL),并按主題對數據進行查詢和訪問,為(wèi)聯機數據分(fēn)析和數據挖掘提供數據平台。
效益成果
1.積極主動&預測需求: 企業機構面臨着越來越大的競争壓力,它們不僅需要獲取客戶,還要了解客戶的需求,以便提升客戶體(tǐ)驗,并發展長(cháng)久的關系。客戶通過分(fēn)享數據,降低數據使用(yòng)的隐私級别,期望企業能(néng)夠了解他(tā)們,形成相應的互動,并在所有的接觸點提供無縫體(tǐ)驗。
為(wèi)此,企業需要識别客戶的多(duō)個标識符(例如手機、電(diàn)子郵件和地址),并将其整合為(wèi)一個單獨的客戶ID。由于客戶越來越多(duō)地使用(yòng)多(duō)個渠道與企業互動,為(wèi)此需要整合傳統數據源和數字數據源來理(lǐ)解客戶的行為(wèi)。此外,企業也需要提供情境相關的實時體(tǐ)驗,這也是客戶的期望。
2. 緩沖風險&減少欺詐: 安(ān)全和欺詐分(fēn)析旨在保護所有物(wù)理(lǐ)、财務(wù)和知識資産免受内部和外部威脅的濫用(yòng)。高效的數據和分(fēn)析能(néng)力将确保最佳的欺詐預防水平,提升整個企業機構的安(ān)全:威懾需要建立有效的機制,以便企業快速檢測并預測欺詐活動,同時識别和跟蹤肇事者。
将統計、網絡、路徑和大數據方法論用(yòng)于帶來警報的預測性欺詐傾向模型,将确保在被實時威脅檢測流程觸發後能(néng)夠及時做出響應,并自動發出警報和做出相應的處理(lǐ)。數據管理(lǐ)以及高效和透明的欺詐事件報告機制将有助于改進欺詐風險管理(lǐ)流程。
此外,對整個企業的數據進行集成和關聯可(kě)以提供統一的跨不同業務(wù)線(xiàn)、産品和交易的欺詐視圖。多(duō)類型分(fēn)析和數據基礎可(kě)以提供更準确的欺詐趨勢分(fēn)析和預測,并預測未來的潛在操作(zuò)方式,确定欺詐審計和調查中的漏洞。
3.提供相關産品: 産品是任何企業機構生存的基石,也通常是企業投入最大的領域。産品管理(lǐ)團隊的作(zuò)用(yòng)是辨識推動創新(xīn)、新(xīn)功能(néng)和服務(wù)戰略路線(xiàn)圖的發展趨勢。
通過對個人公布的想法和觀點的第三方數據源進行有效整理(lǐ),再進行相應分(fēn)析,可(kě)以幫助企業在需求發生變化或開發新(xīn)技(jì )術的時候保持競争力,并能(néng)夠加快對市場需求的預測,在需求産生之前提供相應産品。
4. 個性化&服務(wù): 公司在處理(lǐ)結構化數據方面仍然有些吃力,并需要快速應對通過數字技(jì )術進行客戶交互所帶來的不穩定性。要做出實時回應,并讓客戶感覺受到重視,隻能(néng)通過先進的分(fēn)析技(jì )術實現。大數據帶來了基于客戶個性進行互動的機會。這是通過理(lǐ)解客戶的态度,并考慮實時位置等因素,從而在多(duō)渠道的服務(wù)環境中帶來個性化關注實現的。
5. 優化&改善客戶體(tǐ)驗:運營管理(lǐ)不善可(kě)能(néng)會導緻無數重大的問題,這包括面臨損害客戶體(tǐ)驗,最終降低品牌忠誠度的重大風險。通過在流程設計和控制,以及在商品或服務(wù)生産中的業務(wù)運營優化中應用(yòng)分(fēn)析技(jì )術,可(kě)以提升滿足客戶期望的有效性和效率,并實現卓越的運營。
通過部署先進的分(fēn)析技(jì )術,可(kě)以提高現場運營活動的生産力和效率,并能(néng)夠根據業務(wù)和客戶需求優化組織人力安(ān)排。數據和分(fēn)析的最佳化使用(yòng)可(kě)以帶來端對端的視圖,并能(néng)夠對關鍵運營指标進行衡量,從而确保持續不斷的改進。
例如,對于許多(duō)企業來說,庫存是當前資産類别中最大的一個項目——庫存過多(duō)或不足都會直接影響公司的直接成本和盈利能(néng)力。通過數據和分(fēn)析,能(néng)夠以最低的成本确保不間斷的生産、銷售和/或客戶服務(wù)水平,從而改善庫存管理(lǐ)水平。數據和分(fēn)析能(néng)夠提供目前和計劃中的庫存情況的信息,以及有關庫存高度、組成和位置的信息,并能(néng)夠幫助确定存庫戰略,并做出相應決策。客戶期待獲得相關的無縫體(tǐ)驗,并讓企業得知他(tā)們的活動。