www涩-www黄网站-www黄色-www黄色com-国产免费拍拍视频在线观看网站-国产免费怕怕免费视频观看

浩瀚深度劉彤解讀大數(shù)據分析之道

2014-08-28 22:16:45 中國信息產業(yè)網  點擊量: 評論 (0)
主持人:彭超 中國信息產業(yè)網常務副總裁訪談嘉賓:劉彤 北京浩瀚深度信息技術股份有限公司副總裁北京浩瀚深度信息技術股份有限公司副總裁劉彤做客中國信息產業(yè)網(點擊播放)精彩觀點·大數(shù)據本身雖然叫大數(shù)據,

 

主持人:剛剛說到,在大數(shù)據采集方面技術已經不是大問題,但是在對數(shù)據進行多維度疊加分析時,每疊加一個維度所帶來的計算量的差別,是什么樣的一個關系?數(shù)據的處理能力又會有哪些區(qū)別?
劉彤:每做一個維度的疊加必然會帶來數(shù)據量的增長,這是一個很簡單的邏輯問題。作為運算來說,維度的疊加會帶來數(shù)據量的級數(shù)增長,但是在應用場景確定的情況下,數(shù)據又是在做收斂的,是在做層層的過濾,而不是層層的疊加,數(shù)據是在過濾的過程中做高密度疊加的。在這種情況下,并沒有帶來想象中的數(shù)據膨脹,這是大數(shù)據和傳統(tǒng)應用系統(tǒng)的一個很大的區(qū)別。
以前的關系型數(shù)據庫在進行分析時如果疊加維度,疊加到三個以上,處理能力就非常非常慢了,因為在進行數(shù)據處理的過程中,需要把每個維度同每一個數(shù)據進行關聯(lián),建立關系,這種方法是把全網的數(shù)據都進行組合、關聯(lián)、疊加,數(shù)據處理的效率就會直線下降。
大數(shù)據分析的特點是,不是把全部數(shù)據都同時疊加,而是在每一個維度都展開分析,在分析的過程中進行過濾篩選。舉個簡單的例子,比如會場里有很多人,這么多人里按男女分類,先把男士挑出來,然后對男士的年齡段進行篩選,先把年齡段在20-40歲的選出來,再從中選出戴眼鏡的,會發(fā)現(xiàn)選出的人越來越少,要分析的對象越來越精確,數(shù)據量變大了嗎?其實沒有。但是如果同時要得到這些維度在每一個可能分析方向的結果,就等于把所有運算做了一遍。這就帶出了在大數(shù)據分析里一個非常核心的要素:選定目標。必須要有一個清晰的工作目標,先有目標,然后進行大數(shù)據篩選,而不是對數(shù)據進行全面的分析、全量的分析,得出所有的結論,再在結論里去找所需要的東西。
主持人:在對大數(shù)據進行分析的過程中,分析方法的差別可能會導致不同的結論,而這些結論也都是基于大數(shù)據分析的,如何才能確保制定了目標之后,得到正確的結論?
劉彤:這個問題從分析的角度來說,很難進行解答,因為做大數(shù)據的目標選擇,包括分析方法的確定、分析的流程步驟制定,輸出結果,怎么樣去正確的解讀數(shù)據結果,是需要經驗的積累的。
大數(shù)據分析實際上是數(shù)學建模的過程,通過海量數(shù)據分析的過程,找到一些模型的規(guī)律,根據這些規(guī)律總結出相關的結論,而這些規(guī)律的搜集和積累過程是必須的,不能憑空拿出一些數(shù)據去做分析,馬上得出目標性的結論。
在第一次進行數(shù)據分析的時候,實際上是沒有任何參照的,在不知道行業(yè)運行方式、數(shù)據來源、數(shù)據使用方式的情況下去做數(shù)據分析是不科學的。數(shù)據分析,需要不斷累積經驗,基于數(shù)據所包含的信息量確定目標,再通過正確的分析方式,得到正確的結論。
確定目標的過程,是基于對數(shù)據的基礎分析判斷,其實在選定目標的時候,目標的制定者已經有了大致的分析計劃表,他知道要進行幾個維度的篩選疊加后能夠逼近分析結論。數(shù)據分析工程師在進行數(shù)據處理的時候,是依據目標制定者的思路來進行數(shù)據的逼近,逼近過程中,核心的保障不在于分析方法,因為分析方法已經確定了,而是在于數(shù)據分析的質量:數(shù)據是不是準確,是不是全面,是不是可靠,這些數(shù)據的有效性、延續(xù)性,是不是足夠滿足你的分析。這個過程是慢慢擴大對數(shù)據認知的過程,認知程度越深,驗證數(shù)據是不是有效可靠的過程就越順利,逼近結果的過程也就越順利,就會變成一個高效率的工作,并且會得出正確的結論。
大數(shù)據有一個好處是,在大數(shù)據應用的時候并不像傳統(tǒng)數(shù)據,展現(xiàn)的時候必須馬上給出結果,大數(shù)據的析結果是可以進行調整和修正的,會隨著結果與真實情況的驗證、對比來修正分析方法和模型,以便選擇更有效、更可靠的模型去逼近正確的結論。

大云網官方微信售電那點事兒

責任編輯:葉雨田

免責聲明:本文僅代表作者個人觀點,與本站無關。其原創(chuàng)性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
我要收藏
個贊
?
主站蜘蛛池模板: 亚洲免费一 | 日韩欧美一区二区三区免费看 | 色视频在线观看免费 | 人人公开免费超级碰碰碰视频 | 一级做a爱过程免费视频麻豆 | 爽爽日本在线视频免费 | 亚洲综合射 | 久草在线免费福利视频 | 亚洲涩涩精品专区 | 久久99精品这里精品3 | 国产一区二区三区在线观看影院 | 美女亚洲综合 | 欧美xxxx精品另类 | 国产精品成人一区二区 | 99re这里只有精品99 | 国产高清美女一级a毛片久久w | 精品久久久久久影院免费 | 免费一区二区三区在线视频 | 玖玖色视频| 国产成人精品一区 | 国产欧美久久久另类精品 | 成年午夜性视频免费播放 | 自拍1页 | 久久久精品一区二区三区 | 国产精品成人一区二区不卡 | 亚洲人成网7777777国产 | 欧美日韩99 | 欧美最爽乱淫视频播放黑人 | 国产超薄肉色丝袜足j | 一级中国毛片 | 欧洲欧美成人免费大片 | 欧美日韩视频在线第一区二区三区 | 精品国产免费第一区二区三区日韩 | 悟空影视大全免费影视 | 亚洲一区二区三区不卡视频 | 亚洲精品一二三区-久久 | 精品久久影院 | 欧美成人xxxx | 青青热在线精品视频免费 | a毛片基地免费全部香蕉 | 欧美一区二区精品系列在线观看 |