shanghai security defense & alarm association 愛建網(wǎng)">
這個世界上什么最值錢?鉆石、黃金、土地?數(shù)據(jù),這個世界上最值錢的是數(shù)據(jù),確切的說是數(shù)據(jù)背后所隱藏的豐富信息。管理好數(shù)據(jù),分析出其背后的信息至關重要。
新互聯(lián)網(wǎng)時代下,各種數(shù)據(jù)源和數(shù)據(jù)量爆炸性增加,大數(shù)據(jù)的概念也應運而生。大數(shù)據(jù)是“由數(shù)量巨大、結(jié)構(gòu)復雜、類型眾多數(shù)據(jù)構(gòu)成的數(shù)據(jù)集合”,現(xiàn)今的數(shù)據(jù)里,80%是傳統(tǒng)、結(jié)構(gòu)化的數(shù)據(jù),另外20%的數(shù)據(jù)包括視頻數(shù)據(jù)、圖片數(shù)據(jù)、音頻數(shù)據(jù)、郵件數(shù)據(jù)、社交類數(shù)據(jù)(如微博、微信、Facebook、Twitter等所產(chǎn)生的數(shù)據(jù))等非結(jié)構(gòu)化數(shù)據(jù)。
大數(shù)據(jù)所引發(fā)的新問題
大數(shù)據(jù)首先所帶來的就是“量”上的問題,如此海量的數(shù)據(jù),需要加大、加快硬件底層的運算能力,需要能夠?qū)Ω黝愋滦螒B(tài)數(shù)據(jù)進行處理。虛擬化在解決大數(shù)據(jù)“量”的問題方面起到了很好的作用。虛擬化一個最直接的好處是可以節(jié)省成本,虛擬化技術(shù)的廣泛采用,充分利用了服務器里的硬件資源,將原本20-30%的服務器CPU利用率提升到80-90%。這使得海量數(shù)據(jù)可以更高效、快速的存儲在服務器里。另外通過加大內(nèi)存、優(yōu)化內(nèi)存算法都可以應對大數(shù)據(jù)對于存儲所帶來的新問題。
把海量數(shù)據(jù)存儲好就萬事大吉了么?現(xiàn)在戴爾軟件事業(yè)部任大中華區(qū)售前及售后支持技術(shù)總監(jiān)的高國輝認為單純談數(shù)據(jù)沒有價值,數(shù)據(jù)背后所蘊藏的信息才是價值所在。“在大數(shù)據(jù)的處理過程中,除了加大、加快硬件底層運算能力,讓處理形態(tài)更加豐富外,另外的重點是怎樣把它從一個數(shù)據(jù)變成一個信息。”高國輝舉了一個例子:星巴克所關心的不僅僅是每天來了多少人、賣了多少咖啡這些數(shù)據(jù),它所更關注的是通過這些數(shù)據(jù)所分析出的每天都來了哪些人群、購買了哪種咖啡、搭配購買了哪些東西。
挖掘大數(shù)據(jù)里的寶藏
大數(shù)據(jù)時代,企業(yè)希望從大數(shù)據(jù)里挖掘出更具價值的信息。如果不能發(fā)現(xiàn)數(shù)據(jù)里所蘊藏的信息,就需要不斷在存儲設備與網(wǎng)絡設備上增加投入,此時數(shù)據(jù)就會從公司資產(chǎn)變成公司“負債”。那么如何才能做到對大數(shù)據(jù)的有效分析挖掘?
要想對數(shù)據(jù)進行分析,那么首先就需要將數(shù)據(jù)進行整合,這就需要借助類似Toad這類的軟件把不同的數(shù)據(jù)庫連接起來,實現(xiàn)數(shù)據(jù)庫開發(fā)和管理自動化。進一步可以借助Boomi確保數(shù)據(jù)的準確性、完整性和集成性。通過Foglight這類產(chǎn)品能夠?qū)?shù)據(jù)的效能進行分析,利用SharePlex強大的復制和集成功能可以確保數(shù)據(jù)庫的高可用性,而戴爾的B.I.套件則能實現(xiàn)對不同類型數(shù)據(jù)的訪問、分析、集成和同步,將數(shù)據(jù)拉進來進行處理,進行展示。
大數(shù)據(jù)里蘊藏著豐富的寶藏,但由于數(shù)據(jù)的復雜多樣性,需要將所有數(shù)據(jù)有效的整合起來。但僅僅這樣還不夠,如果大數(shù)據(jù)里參雜了過多“混淆視線”的無效數(shù)據(jù),那么分析所得的結(jié)果很可能會南轅北轍。要想保證對數(shù)據(jù)的有效分析,就需要保證數(shù)據(jù)的質(zhì)量,保證數(shù)據(jù)沒有丟失、數(shù)據(jù)本身沒有冗余。只有這樣才能實現(xiàn)有效的數(shù)據(jù)整理、分析,挖掘出用戶所需要的信息。
另外,將企業(yè)數(shù)據(jù)從業(yè)務系統(tǒng)抽取出來,單獨進行分析處理,這需要有一套獨立的IT架構(gòu)進行支撐,同時要保證數(shù)據(jù)復制傳輸?shù)募皶r性。
變革IT架構(gòu)應對大數(shù)據(jù)
大數(shù)據(jù)正在給傳統(tǒng)IT架構(gòu)帶來新的壓力,IT架構(gòu)需要進行適當?shù)恼{(diào)整、變革才能適應大數(shù)據(jù)。應對大數(shù)據(jù)需要看企業(yè)的考慮重點在哪里:是數(shù)據(jù)在軟件架構(gòu)上的調(diào)整,還是整體硬件的效能。如果希望提升硬件效能,就要考慮虛擬化的問題,比如存儲虛擬化、網(wǎng)絡虛擬化、服務器虛擬化、應用虛擬化。如果需要實時分析傳輸數(shù)據(jù),就需要及時拓展網(wǎng)絡帶寬。如果想要將數(shù)據(jù)開放給更多人訪問,就需要考慮將數(shù)據(jù)遷移到云端,甚至要考慮移動辦公的問題。這需要對數(shù)據(jù)進行很好的優(yōu)化,這樣才能夠有利于數(shù)據(jù)遷移到云端,方便用戶對數(shù)據(jù)的訪問。
縮短數(shù)據(jù)的生命周期是現(xiàn)在應該考慮的問題,這需要透過虛擬化實現(xiàn)對系統(tǒng)的精簡,從硬件層面實現(xiàn)“優(yōu)化”。最后需要考慮數(shù)據(jù)的安全問題,比如身份識別及訪問管理,數(shù)據(jù)的備份及恢復等等。
滬公網(wǎng)安備 31011202001934號