大數(shù)據(jù)技術(shù)可以分為大數(shù)據(jù)存儲與處理技術(shù):數(shù)據(jù)倉庫技術(shù)和Hadoop;大數(shù)據(jù)查詢與分析、交互分析技術(shù)和sqlonhadoop;大數(shù)據(jù)執(zhí)行與應(yīng)用技術(shù),主要是機(jī)器學(xué)習(xí)數(shù)據(jù)挖掘的開發(fā)。
大數(shù)據(jù)包括以下四個(gè)特點(diǎn):
1海量:數(shù)據(jù)量巨大,存儲單位為TB—EB,數(shù)據(jù)量以幾何級數(shù)遞增。
2實(shí)時(shí)性:實(shí)時(shí)改變流量數(shù)據(jù),反應(yīng)時(shí)間只有幾秒到十分之一秒。
三。多樣性:各種數(shù)據(jù),包括結(jié)構(gòu)化、非結(jié)構(gòu)化、純文本、多媒體數(shù)據(jù),格式不統(tǒng)一。
4不確定性:由于數(shù)據(jù)不完整、不一致、時(shí)差、故意欺騙等原因,導(dǎo)致真實(shí)性可疑的不確定數(shù)據(jù)量,可能導(dǎo)致重大損失。
@xuefen.com.cn 2013-2022 閩ICP備2023010389號-3 最近更新