데이터 표준¶
ThinkERD는 데이터 품질(DQ)과 거버넌스를 위한 **3계층 표준화 체계**를 제공합니다.
왜 데이터 표준화가 필요한가?¶
데이터 모델링에서 가장 흔한 품질 문제는 **명명 불일치**입니다.
표준 없이 모델링하면
같은 "고객번호" 컬럼이 테이블마다 CUST_NO, CUST_NUM, CUSTOMER_NUMBER, CUSTID 등으로 제각각 사용됩니다. 관계 파악이 어려워지고, 유지보수 비용이 기하급수적으로 증가합니다.
ThinkERD의 표준화 체계는 단어(Word) → 용어(Term) → 도메인(Domain) 3계층 구조로 이 문제를 근본적으로 해결합니다.
3계층 구조¶
graph TB
W["🔤 표준 단어 (Word)"] -->|"조합"| T["📝 표준 용어 (Term)"]
D["📐 표준 도메인 (Domain)"] -->|"바인딩"| T
T -->|"컬럼에 적용"| C["📊 엔터티 컬럼"]
style W fill:#e0f2fe,stroke:#0284c7
style T fill:#f0fdf4,stroke:#16a34a
style D fill:#fef3c7,stroke:#d97706
style C fill:#f3e8ff,stroke:#9333ea | 계층 | 역할 | 예시 |
|---|---|---|
| 단어 (Word) | 논리명 ↔ 물리 약어의 최소 매핑 단위 | 고객 → CUST, 번호 → NO |
| 용어 (Term) | 단어를 조합한 속성명 표준 | 고객번호 → CUST_NO |
| 도메인 (Domain) | 데이터 타입·길이·제약조건의 타입 표준 | 금액 → DECIMAL(18,2) |