大數(shù)據(jù)分析引擎(BDE)
SQL查詢接口、流數(shù)據(jù)處理、機(jī)器學(xué)習(xí)
產(chǎn)品概述
基于Spark打造的大數(shù)據(jù)分析引擎(Big Data Engine,BDE),提供基于分布式內(nèi)存的大規(guī)模并行處理框架,從而大大提高大數(shù)據(jù)分析性能,內(nèi)置SQL查詢接口、流數(shù)據(jù)處理以及機(jī)器學(xué)習(xí)。
通過Hadoop提供可靠存儲(chǔ)HDFS以及MapReduce編程范式進(jìn)行大規(guī)模并行處理數(shù)據(jù)。
通過Hbase實(shí)現(xiàn)大規(guī)模分布式NoSQL數(shù)據(jù)庫(kù),提供隨機(jī)存取大量的非結(jié)構(gòu)化和半結(jié)構(gòu)化的海量數(shù)據(jù)。
產(chǎn)品功能
提供結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的處理能力。
數(shù)據(jù)質(zhì)量控制能力,可以與數(shù)據(jù)質(zhì)量管理平臺(tái)(DQMP)進(jìn)行結(jié)合,通過對(duì)海量數(shù)據(jù)的質(zhì)量進(jìn)行分析,剔除噪聲數(shù)據(jù),保證分析結(jié)果的正確性與準(zhǔn)確性。
產(chǎn)品特征