晓谈数据工程2-数据存储

数据数据仓库存储架构示例

发布于 2024-06-28

412

版权声明

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：晓谈数据工程2-数据存储

文章来源：

数据驱动智能

扫码关注公众号

扫码阅读

手机扫码阅读

数据工程概念系列：数据存储概览

本文为数据工程概念系列的第二部分，重点讨论不同的数据存储解决方案，包括数据仓库、数据湖、数据Lakehouse、数据网格、数据虚拟化，以及DataFabric。

数据仓库

数据仓库是从多个源收集数据的中心存储库，旨在支持数据分析。它能存储历史数据，集成多格式数据，保证数据质量，并且强调数据安全。常见的数据仓库解决方案包括Azure Synapse Analytics、Amazon Redshift和Google BigQuery。数据仓库架构有两种主要的方法：Inmon和Kimball，前者注重统一的信息源和3NF规范化存储，后者则侧重于维度数据建模和星型或雪花模式。

数据湖

数据湖允许存储结构化和非结构化数据，并以原始格式保存，无需预处理。它优化了存储成本和查询速度，支持多种数据连接器。数据湖解决方案包括Azure Data Lake、Amazon S3和Apache Hadoop。

数据湖屋

数据湖屋结合了数据湖的灵活性和数据仓库的管理，提供ACID合规性以保证数据的一致性和安全。它还支持元数据、缓存和索引以提高性能，并允许使用数据进行机器学习和BI报告。数据湖屋解决方案包括Delta Lake by Databricks、Apache Iceberg和Apache Hudi。

数据网格

数据网格架构强调数据的领域产品和所有权，每个领域负责自己的数据产品，并采用用户为中心的设计。治理是分散的，确保数据的可靠性和互操作性。数据网格解决方案包括Google Cloud BigQuery、Azure Synapse Analytics、AWS S3和Athena、dbt和Snowflake。

数据虚拟化

数据虚拟化避免了传统数据架构中的数据复制需求，通过中间件允许直接访问数据源。这种方式提供了治理和访问权限管理，并通过API、元数据和目录提供数据。

DataFabric

DataFabric构建了一个统一的生态系统，整合不同数据源、服务和应用程序。它基于数据虚拟化，并结合了人工智能和机器学习功能，用于数据映射和编目。DataFabric通过AI支持的元数据和推荐引擎来优化数据摄取和管理。

本文最后推荐了关于数据安全、企业数据管理和数据治理等相关的系列文章。

数据驱动智能

查看原文：晓谈数据工程2-数据存储

文章来源：

数据驱动智能

扫码关注公众号

相关推荐

谈谈数据质量管理在数据资源入表中的实施方法和路径

862

数据质量资产资源

摘要：数据资源入表是数据资产化的标志，数据资源

谈谈将数据作为资产管理的几个问题

822

数据数据管理组织质量

一概述数据的重要性我们发现自己正处于一场前所未有的数据革命之中。我们采取的每一个行动，我们进行的每一笔交易，以及我们的每一次互动都会产生数据。

CDO 亟需关注的四件事

822

数据治理组织 CDO

数字经济背景下，数据要素深入推进。下面我们将深

如何设计更好的数据市场|数据交易所

741

数据市场用户产品

在当今数据驱动的社会中，数据不仅是力量的源泉，而且是推动业务成功、为决策提供信息并释放新机遇的重要资产。

如何建立受监管的良好的数据交易市场

642

数据交易商品市场

一现代经济中数据的价值数据在当今的经济中已变??

制定数据战略的终极指南

996

数据组织战略治理

一概述作为一名数据专业人士，我亲眼目睹了新技?

数据驱动智能

专注数据治理、数字化转型、数据资产、数据要素等方面的实践分享。

94 篇文章

浏览 52.2K

数据驱动智能的其他文章

晓谈数据工程5-DevOps、DataOps 和 MLOps

这是数据工程概念系列 10 部分中的第 5 部分。在这一部分中，我们将讨论 DevOps 实践的重要性。

2024寄语：开启数据治理新模式打造数据新质生产力

2024年开启了数据资产入表元年，意味着数据作为新??

2024年数据分析的五大趋势和应对措施

在快速发展和创新的数据分析领域，2024 年有望成为?

晓谈企业数据管理一：数据类型

数据就是新石油，数据需要仔细提炼才能获得所需的价值。

生成式人工智能设计模式指南

对人工智能模式的需求在构建新事物时，我们都会??

随机阅读

敏捷实践大全

3分钟弄懂CMMI2.0基准评估的抽样规则

聊聊故事点背后的故事

公司级项目管理例会的汇报内容

COSMIC规模度量案例集一：五个应用软件的需求规模度量

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线