数据仓库和数据集市之ODS、CDM、ADS、DWD、DWS

数据仓库分层架构解析 本文系统介绍了数据仓库的分层架构设计,主要包括: 基础数据层(ODS):最接近数据源的层级,进行ETL处理后保留原始数据特征,负责数据清洗、去重等预处理工作 数据仓库层(DW...
4个月前
400

HBase与DynamoDB对比:云数据库选择

在云计算和大数据时代,分布式数据库成为处理海量结构化/半结构化数据的核心基础设施。HBase作为Apache开源项目,基于Hadoop生态构建,提供高吞吐、可扩展的列式存储;DynamoDB是AWS推...
4个月前
410

Hadoop分布式计算框架【MapReduce】

摘要:MapReduce是一种用于大规模数据并行处理的编程模型,它将计算任务分为Map和Reduce两个阶段,通过移动计算而非数据实现并行处理。MapReduce适用于离线批处理场景。其工作原理包括数...
3个月前
360