데이터 리니지 | 데이터 흐름 추적
데이터 리니지(Data Lineage)란?데이터가 어디서 생성되어(Source) → 어떤 과정을 거쳐 변환되고 → 어디로 이동하여(Target) → 어떻게 활용되는지를시간의 흐름과 변환 과정까지 포함해 추적·시각화한 정보입니다.한 줄로 정의하면데이터의 출처부터 최종 사용까지의 전체 흐름과 변환 이력을 보여주는 것⸻데이터 리니지가 왜 중요한가?1. 데이터 신뢰성 확보 • 리포트·지표의 숫자가 어떤 원천 데이터에서 왔는지 설명 가능 • “이 데이터는 믿을 수 있는가?”에 답할 수 있음2. 영향도 분석(Impact Analysis) • 컬럼 하나 변경 시→ 어떤 테이블, 리포트, 모델에 영향을 주는지 즉시 파악3. 장애·오류 원인 추적 • 잘못된 데이터 발생 시→ 어느 단계에서 오류가 생겼는지 빠르게 역추적4..
Data Lake
2026. 1. 8. 09:11