OpenMetadata

活跃
GitHub TypeScript Apache-2.0

简介

OpenMetadata 是面向数据和 AI 的统一元数据平台,提供数据资产发现、血缘、治理与 Agent 上下文检索能力。

核心特性

  • 统一元数据模型 — 表、字段、指标、dashboard、pipeline、ML 模型等一站式管理
  • 自动血缘追踪 — 跨数据库、BI、orchestration 平台采集端到端数据血缘
  • 数据质量 SLA — 内置数据质量测试框架,支持规则、SLA 告警与失败追踪
  • 数据资产发现 — 全文与字段级搜索,让 Agent 找到正确的表与字段作为上下文
  • 协作与治理 — 支持 glossary、tag、classification、RBAC 与审计日志
  • Agent / LLM 集成 — 提供 API 与 metadata embedding,支持把数据目录上下文喂给 Agent

适用场景

💡 为 RAG Agent 提供统一的数据资产检索层,让 LLM 能查到正确的业务表与字段定义
💡 跨团队追踪数据血缘,定位 Agent 决策链路中数据出错的源头
💡 治理大模型训练数据与特征仓库,确保数据合规与可追溯
💡 集中管理指标与 dashboard,让 Agent 在回答业务问题时引用一致的指标定义
💡 通过 metadata API 让 AI 工作流访问结构化的数据上下文与描述

快速开始

git clone https://github.com/open-metadata/OpenMetadata
cd OpenMetadata
docker compose -f docker/docker-compose-quickstart/docker-compose.yml up -d
# 访问 http://localhost:8585,使用 admin@openmetadata.org / admin 登录
# 用 python SDK 写入一个 metadata 实体
pip install openmetadata-ingestion

相关项目