[SQLD] 1과목 데이터 모델링의 이해 - 데이터 모델링(Data Modeling)

SQLD

[SQLD] 1과목 데이터 모델링의 이해 - 데이터 모델링(Data Modeling)

Jia H 2025. 3. 11. 11:31

🚀 데이터 모델링의이해

1️⃣ 데이터 모델링

- 데이터 모델링은 데이터를 구조화하고 체계적으로 표현하는 과정

- 데이터의 논리적, 물리적 구조를 명확히 정의

- 중복 최소화 및 일관성 유지

- 성능 최적화 및 확장성 확보

2️⃣ 데이터 모델링의 주요 특징

특징	설명
추상화(Abstraction)	현실 세계를 간략하게 표현
단순화(Simplification)	누구나 쉽게 이해할 수 있도록 표현
명확성(Clarity)	명확하게 의미가 해석되어야 하고 한 가지 의미를 가짐

3️⃣ 데이터 모델링 단계

👉 데이터 모델링 단계

데이터 모델링 단계	설명
개념적 모델링	- 전사적 관점에서 기업의 데이터를 모델링 - 추상화 수준이 가장 높은 수준의 모델링 - 계층형 데이터 모델, 네트워크 모델, 관계형 모델에 관계없이 업무 측면에서 모델링 - 엔터티(Entity)와 속성(Attribute)을 도출하고 개념적 ERD(Entity Relationship Diagram) 작성
논리적 모델링	- 특정 데이터베이스 모델에 종속 - 식별자를 정의하고 관계, 속성 등을 모두 표현 - 정규화를 통해 재사용성 높임
물리적 모델링	- 구축할 데이터베이스 관리 시스템에 테이블, 인덱스 등을 생성하는 단계 - 성능, 보안, 가용성 등을 고려하여 데이터베이스 구축

👉 데이터 모델링 관점

관점(View)	설명
데이터	- 비즈니스 프로세스에서 사용되는 데이터를 의미 - 구조 분석, 정적 분석
프로세스	- 비즈니스 프로세스에서 수행하는 작업 - 시나리오 분석, 도메인 분석, 동적 분석
데이터와 프로세스	- 프로세스와 데이터 간의 관계를 의미 - CRUD(Create, Read, Update, Delete) 분석

4️⃣ 데이터 모델링을 위한 ERD(Entity Relationship Diagram)

👉 ERD 작성 절차

① 엔터티를 도출하고 그린다.

② 엔터티를 배치한다.

③ 엔터티 간의 관계를 설정한다

④ 관계명을 서술한다.

⑤ 관계 참여도를 표현한다

⑥ 관계의 필수 여부를 표현한다.

📌 중요한 엔터티를 가급적 왼쪽 상단에 배치

📌 ERD는 이해가 쉬워야하고 너무 복잡하지 않아야 함

5️⃣ 데이터 모델링 고려사항

❶ 데이터 모델의 독립성

- 독립성이 확보된 모델은 고객의 업무 변화에 능동적으로 대응할 수 있다.

- 독립성을 확보하기 위해서는 중복된 데이터를 제거해야 한다.

- 데이터 중복을 제거하는 방법이 바로 정규화이다.

❷ 고객 요구사항의 표현

- 고객과 데이터 모델러 간에 의사소통을 위해 고객의 요구사항을 간결하고 명확하게 표현해야 한다.

❸ 데이터 품질 확보

- 데이터베이스 구축 시에 데이터 표준을 정의하고 표준 준수율을 관리해야 한다.

- 데이터 표준을 확보해야 데이터 품질을 향상시킬 수 있다.

🚀 3층 스키마(3-Level Schema)

1️⃣ 3층 스키마

- 사용자, 설계자, 개발자가 데이터베이스를 보는 관점에 따라 기술하고 이들 간의 관계를 정의한 ANSI 표준

- 3층 스키마는 데이터베이스의 독립성을 확보하기 위한 방법

- 독립성 장점: 데이터 복잡도 감소, 데이터 중복 제거, 사용자 요구사항 변경에 따른 대응력 향상, 관리 및 유지보수 비용 절감 등

- 3단계 계층으로 분리해서 독립성을 확보하는 방법으로 각 계층을 뷰(View)라고도 함

ANSI(American National Standards Institute): 미국 표준 협회

ANSI 표준은 데이터베이스와 관련된 표준을 정의한 것으로 ANSI SQL 표준이라는 것이 있다. ANSI SQL 표준은 SQL문이 모든 데이터베이스 관리 시스템(Oracle, Sybase, DB2, MySQL 등)에서 호환되도록 정의한 표준이다.

2️⃣ 3층 스키마 구조

구조	설명
외부 스키마(External Schema)	- 사용자 관점, 업무상 관련이 있는 데이터 접근 - 관련 데이터베이스의 뷰(View)를 표시 - 응용 프로그램이 접근하는 데이터베이스 정의
개념 스키마(Conceptual Schema)	- 설계자 관점, 사용자 전체 집단의 데이터베이스 구조 - 전체 데이터베이스 내의 규칙과 구조를 표현 - 통합 데이터베이스 구조
내부 스키마(Internal Schema)	- 개발자 관점, 데이터베이스의 물리적 저장 구조 - 데이터 저장 구조, 레코드 구조, 필드 정의, 인덱스 등을 의미

🚀 엔터티(Entity)

1️⃣ 엔터티(Entity)

- 엔터티는 업무에서 관리해야 하는 데이터 집합을 의미, 저장되고 관리되어야 하는 데이터

- 엔터티는 개념, 사건, 장소 등의 명사

👉 엔터티의 의미

인물	엔터티의 의미
Peter Chen(1976)	엔터티는 변별할 수 있는 사물이다.
James Martin(1989)	정보를 저장할 수 있는 어떤 것이다.
C.J Date(1986)	데이터베이스 내부에서 변별 가능한 객체이다.
Thomas Bruce(1992)	정보가 저장될 수 있는 장소, 사람, 사건, 개념, 물건 등이다.

2️⃣ 엔터티(Entity) 도출

- 엔터티는 고객의 비즈니스 프로세스에서 관리되어야 하는 정보를 추출해야 한다.

👉 비즈니스 프로세스

① 고객이 회원가입을 한다. 회원으로 가입할 때는 회원ID, 패스워드, 이름, 주소, 전화번호 등을 입력해야 한다.

② 회원으로 가입하기 위해서는 반드시 하나의 계좌를 개설해야 한다.

③ 고객은 계좌를 여러 개 개설할 수 있다.

④ 계좌를 개설할 때는 계좌번호, 계좌명, 예수금, 계좌개설 지점, 계좌담당자가 입력된다.

3️⃣ 엔터티(Entity) 특징

엔터티 특징	설명
식별자	- 엔터티는 유일한 식별자가 있어야 한다. - 예) 회원ID, 계좌번호
인스턴스 집합	- 2개 이상의 인스턴스가 있어야 한다. - 예) 고객 정보는 2명 이상 있어야 한다.
속성	- 엔터티는 반드시 속성을 가지고 있다. - 예) 고객 엔터티에 회원 ID, 패스워드, 이름, 주소, 전화번호
관계	- 엔터니는 다른 엔터티와 최소한 한 개 이상 관계가 있어야 한다. - 예) 고객은 계좌를 개설한다.
업무	- 엔터티는 업무에서 관리되어야 하는 집합이다. - 예) 고객, 계좌

📌 릴레이션과 테이블, 인스턴스(Instance)

- 릴레이션과 테이블은 같은 의미. 릴레이션에 기본키 및 제약조건을 설정하면 테이블이 됨.

- 단, Relationship은 릴레이션 간의 관계를 의미

- 인스턴스는 릴레이션이 가질 수 없는 값을 의미. 간단하게 생각하면 행의 수를 의미.

4️⃣ 엔터티(Entity) 종류

- 엔터티의 종류는 유형과 무형에 따른 종류, 엔터티가 발생하는 시점에 따른 종류로 나눔

- 엔터티를 유형과 무형으로 분류하는 기준은 물리적 형태의 존재 여부

❶ 유형과 무형에 따른 엔터티 종류

종류	설명
유형 엔터티	- 업무에서 도출되며 지속적으로 사용되는 엔터티 - 예) 고객, 강사, 사원 등
개념 엔터티	- 유형 엔터티는 물리적 형태가 있지만, 개념 엔터티는 물리적 형태가 없음 - 예) 거래소 종목, 코스닥 종목, 생명보험 상품
사건 엔터티	- 비즈니스 플로세스를 실행하면서 생성되는 엔터티 - 예) 주문, 체결, 취소주문, 수수료 청구 등

❷ 발생 시점에 따른 엔터티 종류

종류	설명
기본 엔터티(Basic Entity)	- 키 엔터티 - 다른 엔터티로부터 영향을 받지 않고 독립적으로 생성되는 엔터티 - 예) 고객, 상품, 부서 등
중심 엔터티(Main Entity)	- 기본 엔터티와 행위 엔터티 중간 - 즉, 기본 엔터티로부터 발생되고 행위 엔터티를 생성하는 것 - 예) 계좌, 주문, 최소, 체결 등
행위 엔터티(Active Entity)	- 2개 이상의 엔터티로부터 발생 - 예) 주문 이력, 체결 이력 등

🚀 속성(Attribute)

1️⃣ 속성(Attribute)

- 엔티티가 가지는 항목

- 속성은 더 이상 분리되지 않는 단위, 업무에 필요한 데이터 저장

- 인스턴스의 구성요소, 의미적으로 더 이상 분해되지 않음

1️⃣ 속성의 특징과 종류

❶ 속성의 특징

- 속성은 업무에서 관리되는 정보

- 속성은 일반적으로 하나의 값만 가짐

- 주식별자에게 함수적으로 종속. 즉, 기본키가 변경되면 속성의 값도 변경

❷ 속성의 종류

종류	설명
단일 속성	- 하나의 의미로 구성된 것으로 회원ID, 이름 등이다.
복합 속성	- 여러 개의 의미가 있는 것으로 대표적으로 주소가 있다. - 주소는 시, 군, 동 등으로 분해될 수 있다.
다중값 속성	- 속성에 여러 개의 값을 가질 수 있는 것으로 예를 들어 상품 리스트가 있다. - 다중값 속성은 엔터티로 분해된다.

❸ 특성에 따른 속성의 종류

종류	설명
기본 속성	- 비즈니스 프로세스에서 도출되는 본래의 속성이다. - 예) 회원ID, 이름, 계좌번호, 주문 일자 등
설계 속성	- 데이터 모델링 과정에서 발생되는 속성이다. - 유일한 값을 부여한다. - 예) 상품코드, 지점코드 등
파생 속성	- 다른 속성에 의해서 만들어지는 속성이다. - 예) 합계, 평균 등

📌 도메인(Domain)

- 도메인은 속성이 가질 수 있는 값의 범위이다.

- 예) 성별이라는 속성의 도메인은 여자와 남자이다.

🚀 관계(Relationship)

1️⃣ 관계(Relationship)

- 관계는 엔터티 간의 관련성을 의미하며 존재 관계와 행위 관계로 분류된다.

- 존재 관계: 두 개의 엔터티가 존재 여부의 관계가 있는 것

- 행위 관계: 두 개의 엔터티가 어떤 행위에 의한 관련성이 있는 것

2️⃣ 관계의 종류

❶ 존재 관계

- 존재 관계는 엔터티 간의 상태를 의미한다.

- 예) 고객이 은행에 회원가입을 하면 관리점이 할당되고, 할당된 관리점에서 고객을 관리한다.

❷ 행위 관계

- 행위 관계는 엔터티 간에 어떤 행위가 있는 것으로, 계좌를 사용해서 주문을 발주하는 관계가 만들어진다.

- 예) "계좌를 개설"하고 "주문을 발주"하는 것

3️⃣ 관계 차수(Relation Cardinality)

❶ 관계 차수(Relation Cardinality)

- 관계 차수는 두 개의 엔터티 간에 관계에 참여하는 수를 의미한다.

❷ 관계 차수의 종류

① 1대1 관계

종류	설명
완전 1대1	하나의 엔터티에 관계되는 엔터티의 관계가 하나인 경우로, 반드시 존재한다.
선택적 1대1	하나의 엔터티에 관계되는 엔터티의 관계가 하나이거나 없을 수도 있다.

② 1대N 관계

- 1대N 관계는 엔터티에 행이 하나 있을 때 다른 엔터티의 값이 여러 개 있는 관계이다.

- 예) 한 명의 고객은 여러 개의 계좌를 개설할 수 있다.

③ M대N 관계

- M대N 관계는 두 개 엔터티가 서로 여러 개의 관계를 가지고 있는 것이다.

- 예) 한 명의 학생이 여러 개의 과목을 수강할 수 있다. 반대로 한 개의 과목은 여러 명의 학생이 수강한다.

- 관계형 데이터베이스에서 M대N 관계의 조인(Join)은 카테시안 곱이 발생한다. 그래서 M대N 관계를 1대N으로 해소해야 한다.

📌 카테시안 곱(Cartesian Product, 곱집합)

- 각 릴레이션에 존재하는 모든 데이터를 조합하여 연산하는 것을 말한다.

4️⃣ 필수적 관계와 선택적 관계

- 필수적 관계는 반드시 하나는 존재해야하는 관계이고 선택적 관계는 없을 수도 있는 관계이다.

- 필수적 된계는 "|"로 표현되고 선택적 관계는 "O"으로 표현된다.

구분	설명
필수적 관계	- 반드시 하나가 있어야 하는 관계이다. - 예) 고객이 반드시 있어야 계좌를 개설할 수 있다.
선택적 관계	- 없을 수도 있는 관계이다. - 고객은 있지만 계좌가 없을 수도 있다면 선택적 관계가 된다.

🚀 엔터티 식별자(Entity Identifier)

- 식별자라는 것은 엔터티를 대표할 수 있는 유일성을 만족하는 속성이다.

- 일반적으로 회원ID, 계좌번호, 주민등록번호, 외국인등록번호, 여권번호 등이 있다.

1️⃣ 주식별자(기본키, Primary key)

⭐ 최소성: 주식별자는 최소성을 만족하는 키이다.

⭐ 대표성: 주식별자는 엔터티를 대표할 수 있어야 한다.

⭐ 유일성: 주식별자는 엔터티의 인스턴스를 유일하게 식별한다.

⭐ 불변성: 주식별자는 자주 변경되지 않아야 한다.

⭐ 존재성: 주식별자는 항상 데이터 값이 있어야 한다.

👉 키의 종류

데이터베이스 키	설명
기본키(Primary key)	- 후보키 중에서 엔터티를 대표할 수 있는 키
후보키(Candidate key)	- 후보키는 유일성과 최소성을 만족하는 키
슈퍼키(Super key)	- 슈퍼키는 유일성은 만족하지만 최소성을 만족하지 않는 키
대체키(Alternate key)	- 대체키는 여러 개의 후보키 중에서 기본키를 선정하고 남은 키
외래키(Foreign key)	- 하나 혹은 다수의 다른 테이블의 기본 키 필드를 가리키는 것으로 참조 무결성(Referentiall Integrity)을 확인하기 위해서 사용되는 키 - 즉, 허용된 데이터 값만 데이터베이스에 저장하기 위해서 사용

2️⃣ 식별자의 종류

- 식별자는 대표성, 생성 여부, 속성의 수, 대체 여부로 분류된다.

❶ 식별자의 대표성

- 주식별자는 엔터티를 대표할 수 있는 식별자이다. 예를 들어 회원ID는 고객 엔터티의 주식별자가 된다.

👉 대표성 여부에 따른 식별자의 종류

종류	설명
주식별자	- 유일성과 최소성을 만족하면서 엔터티를 대표하는 식별자이다. - 다른 엔터티와 참조 관계로 연결될 수 있다.
보조 식별자	- 유일성과 최소성을 만족하지만 대표성을 만족하지 못하는 식별자이다.

❷ 생성 여부

👉 생성 여부에 따른 식별자의 종류

종류	설명
내부 식별자	- 내부 식별자는 엔터티 내부에서 스스로 생성하는 식별자이다. - 예) 부서코드, 주문번호, 종목코드 등
외부 식별자	- 다른 엔터티와의 관계로 인하여 만들어지는 식별자이다. - 예) 계좌 엔터티에 회원ID

❸ 속성의 수

👉 속성의 수에 따른 식별자의 종류

종류	설명
단일 식별자	- 하나의 속성으로 구성된다. - 예) 고객 엔터티에 회원ID
복합 식별자	- 두 개 이상의 속성으로 구성된다.

❹ 대체 여부

👉 대체 여부에 따른 식별자의 종류

종류	설명
본질 식별자	- 비즈니스 프로세스에서 만들어지는 식별자이다.
인조 식별자	- 인위적으로 만들어지는 식별자이다.

📌 인조 식별자

- 인조 식별자는 후보 식별자 중에서 주식별자로 선정할 것이 없거나 주식별자가 너무 많은 칼럼으로 되어 있는 경우에 사용한다.

- 즉, 순서번호(Sequence Number)를 사용해서 식별자를 만드는 것이다.

'SQLD' 카테고리의 다른 글

[SQLD] 2과목 SQL 기본 및 활용 - 관리구문 (0)	2025.03.16
[SQLD] 2과목 SQL 기본 및 활용 - SQL 활용(2) (0)	2025.03.15
[SQLD] 2과목 SQL 기본 및 활용 - SQL 활용(1) (0)	2025.03.14
[SQLD] 2과목 SQL 기본 및 활용 - SQL 기본 (0)	2025.03.13
[SQLD] 1과목 데이터 모델링의 이해 - 데이터 모델과 SQL (0)	2025.03.12

현재글[SQLD] 1과목 데이터 모델링의 이해 - 데이터 모델링(Data Modeling)

지옥의 스터디

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30