附录 C 技术栈速查表¶
面包屑
本书主页 › 附录 C
AWS 技术栈¶
| 服务 | 类别 | 用途 | 章节 |
|---|---|---|---|
| S3 | 存储 | 数据湖分层存储 | Ch 7 |
| Redshift | 分析 | 数据仓库(MPP 列式) | Ch 8 |
| Redshift Serverless | 分析 | Agentic BI 执行后端(多环境) | Ch 38, 47 |
| Glue | 计算 | 托管 Spark ETL( PySpark/ Python Shell) | Ch 9 |
| Lambda | 计算 | 无服务器函数(控制面) | Ch 9 |
| Step Functions | 编排 | 状态机编排 | Ch 10 |
| EventBridge | 调度 | 定时触发 + 事件路由 | Ch 10 |
| DynamoDB | 数据库 | 任务配置与状态存储 | Ch 11 |
| Athena | 查询 | S3 数据 SQL 查询 | Ch 7 |
| Glue Data Catalog | 元数据 | Schema 发现与数据目录 | Ch 20 |
| Secrets Manager | 安全 | 密钥管理 + 自动轮转 | Ch 29 |
| KMS | 安全 | 加密密钥 | Ch 48 |
| IAM | 安全 | 权限管理 | Ch 48 |
| CloudWatch | 监控 | 日志/指标/告警 | Ch 49 |
| CloudTrail | 审计 | API 调用审计 | Ch 49 |
| API Gateway | API | DaaS REST API 入口 | Ch 39 |
| SNS | 通知 | 告警通知 | Ch 49 |
| SQS | 消息 | 事件缓冲 | Ch 15 |
| OIDC | 身份 | CI 无密钥认证 | Ch 29 |
Azure / Microsoft 技术栈¶
| 技术 | 用途 | 章节 |
|---|---|---|
| Power Platform | 低代码平台(零售门户) | Ch 36 |
| Dataverse | Power Platform 数据存储 | Ch 36 |
| PCF | Power Apps Component Framework(自定义控件) | Ch 36 |
| Power Automate | 事件驱动编排 | Ch 36 |
| Power Query Dataflow | 数据转换与同步 | Ch 38 |
| Azure Blob Storage | 跨云中转存储 | Ch 38 |
| Azure Data Lake | Synapse Link 导出目标 | Ch 38 |
| Azure Function App | DuckDB 大导出执行 | Ch 37 |
| 21Vianet | Azure China 运营商 | Ch 48 |
开发与 IaC 技术栈¶
| 技术 | 用途 | 章节 |
|---|---|---|
| Terraform | 基础设施即代码 | Ch 21-25 |
| GitHub Actions | CI/CD 平台 | Ch 27-28 |
| Python | 主开发语言(Glue/Lambda) | 全书 |
| HCL | Terraform 配置语言 | Ch 21 |
| PyDeequ | 数据质量校验 | Ch 17 |
| rclone | 跨账号 S3 桥接 | Ch 32 |
| DuckDB | 嵌入式分析数据库 | Ch 37 |
| PostgreSQL 驱动 | Redshift 直连驱动 | Ch 32 |
| Jinja2 | 模板引擎(Power Query 生成) | Ch 38 |
| pre-commit | 代码提交前检查 | Ch 30 |
| SonarQube | 代码质量扫描 | Ch 30 |
| SQLFluff | SQL 规范检查 | Ch 30 |
AI / Agentic BI 技术栈¶
| 技术 | 用途 | 章节 |
|---|---|---|
| LangGraph | Agent 编排(状态图) | Ch 42 |
| LangChain | LLM 应用框架 | Ch 45 |
| FastAPI | 后端 API 服务 | Ch 39 |
| PostgreSQL + AGE | 图引擎(Engine G) | Ch 41, 47 |
| pgvector | 向量检索(Engine V) | Ch 41, 47 |
| Next.js / React | 前端交互层(L1) | Ch 39 |
| Langfuse | Agent 链路追踪 | Ch 47 |
| Prometheus | AI 指标监控 | Ch 47 |
| DeepEval / Ragas | LLM 评估框架 | Ch 47 |
| MCP | Model Context Protocol(工具标准) | Ch 45 |
数据格式与协议¶
| 格式/协议 | 用途 | 章节 |
|---|---|---|
| Parquet | 数据湖列式存储格式 | Ch 7 |
| Iceberg / Delta / Hudi | 表格式(引申对比) | Ch 7 |
| JSON | 配置文件 / API 交互 | 全书 |
| YAML | 语义资产 / Terraform | Ch 40 |
| CSV / TSV | 文件源数据格式 | Ch 15 |
| SAS 令牌 | Azure Blob 认证 | Ch 37 |
| OIDC Token | CI 认证 | Ch 29 |
| JWT | DaaS API 鉴权 | Ch 39 |
技术选型决策速查¶
| 决策点 | 选择 | 理由 | 章节 |
|---|---|---|---|
| 云平台 | AWS China | 四年前唯一可用的完整国际云栈 | Ch 2 |
| IaC | Terraform | 跨云可移植 + 模块生态 | Ch 2 |
| 编排 | Step Functions | Serverless + 原生 AWS 集成 | Ch 10 |
| 数据湖格式 | Parquet(当时) | 稳定简单;如果重来选 Iceberg | Ch 7 |
| 数据仓库 | Redshift | AWS 生态 + China 可用 | Ch 8 |
| AI 执行后端 | Redshift Serverless | 执行隔离 + 按量计费 | Ch 38 |
| LLM 编排 | LangGraph | 状态图 + 条件路由 | Ch 42 |
| 语义管理 | Git+YAML | 版本控制 + PR 审查 + CI | Ch 40 |