在这篇文章中,我将使用 Amazon S3、Amazon EventBridge、AWS Lambda、AWS Step Functions 和 AWS Glue 介绍 AWS 上的生产型无服务器 ETL/ELT 架构。
我将介绍从事件驱动的摄取到验证、隔离处理、编排、模式漂移处理、数据质量检查和重播的完整流程。
我有意将其设计为可以同时支持 ETL 和 ELT 的模式:。
当我在获得策划输出之前在 Glue 中执行转换时进行 ETL。
当我首先获取验证/原始数据并推迟转换到下游查询引擎或仓库作业时,ELT。
这篇文章中的一些实现选择是经过深思熟虑的:。
来源:Dev.to












