观澜Media

AI技术 · 深度资讯 · 前沿观察

具有 S3、EventBridge、Lambda、Step Functions 和 Glue 的无服务器 ETL/ELT 架构

在这篇文章中,我将使用 Amazon S3、Ama..

在这篇文章中,我将使用 Amazon S3、Amazon EventBridge、AWS Lambda、AWS Step Functions 和 AWS Glue 介绍 AWS 上的生产型无服务器 ETL/ELT 架构。

我将介绍从事件驱动的摄取到验证、隔离处理、编排、模式漂移处理、数据质量检查和重播的完整流程。

我有意将其设计为可以同时支持 ETL 和 ELT 的模式:。

当我在获得策划输出之前在 Glue 中执行转换时进行 ETL。

当我首先获取验证/原始数据并推迟转换到下游查询引擎或仓库作业时,ELT。

这篇文章中的一些实现选择是经过深思熟虑的:。

来源:Dev.to

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注