1 / 13

4.6 관계 데이터베이스의 정규화

4.6 관계 데이터베이스의 정규화. 1. 관계 스킴 (relational scheme) 의 설계 (1) 관계 스킴의 설계 - 현실세계를 가장 정확하게 표현할 수 있는 데이터의 논리적 구조를 결정하는 것 - 앤티티 , 애트리뷰트 , 관계성을 파악 -> 릴레이션 - 데이터의 중복 -> 이상 (anomaly) 발생 (2) 이상 (anomaly) ① 삭제이상 : 연쇄 삭제 현상에 의한 정보 손실 발생 ② 삽입이상 : 불필요한 데이터의 삽입

ova
Download Presentation

4.6 관계 데이터베이스의 정규화

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 4.6 관계 데이터베이스의 정규화 1. 관계 스킴 (relational scheme)의 설계 (1) 관계 스킴의 설계 - 현실세계를 가장 정확하게 표현할 수 있는 데이터의 논리적 구조를 결정하는 것 - 앤티티, 애트리뷰트, 관계성을 파악 -> 릴레이션 - 데이터의 중복 -> 이상(anomaly) 발생 (2) 이상(anomaly) ① 삭제이상 : 연쇄 삭제 현상에 의한 정보 손실 발생 ② 삽입이상 : 불필요한 데이터의 삽입 ③ 갱신이상 : 중복 데이터의 일부 갱신으로 인한 모순성 발생 (3) 이상(anomaly)의 원인 - 여러 종류의 관계를 하나의 릴레이션에 표현하기 때문에 발생 -> 서로 독립적인 관계는 별개의 릴레이션으로 표현 -> 정규화(normalization)

  2. (4) 정규화의 목적 - 논리적 데이터베이스 구조상에 있어 삭제, 삽입, 수정 결과 생기는 이상현상 제거 - 어떠한 릴레이션도 데이터베이스 내에서 표현이 가능하도록 구성 - 보다 간단한 관계연산에 기초하여 검색 알고리즘을 효과적으로 제공 - 새로운 형태의 데이터가 삽입될 때 릴레이션을 재구성할 필요성 감소

  3. 성 명 학 번 성 적 학 과 과목번호 학 년 2. 함수종속 정의 : 릴레이션 R에서 X와 Y를 각각 R의 애트리뷰트 집합의 부분집합이라고 한다면 애트리뷰트 X의 값 각각에 대해 애트리뷰트 Y의 값이 오직 하나만 연관되어 있을때 이를 함수 종속이라고 하고, X Y로 표기한다. ( X : 결정자, Y : 종속자 ) (예) 학번 성명 학번 학과 학번 (성명, 학과, 학년) 학번 학년 { 학번, 과목번호 } 성적 ※ 완전함수종속 (성적은 {학번, 과목번호}에 완전함수종속) 부분함수종속 (성명,학과,학년은 {학번, 과목번호}에 부분함수종속)

  4. 지도교수 학 번 성 적 학 과 과목번호 {학번, 과목번호} 성적 학번 지도교수 학번 학과 지도교수 학과 3. 정규형 (1) 제1정규형(1NF ; First Normal Form) - 릴레이션 R의 모든 도메인이 원자값만을 포함 - 문제) 기본키에 부분함수종속으로 인한 이상현상 발생 (1NF)

  5. 학 번 지도교수 학 과 과목번호 성 적 100 100 101 102 102 102 103 103 103 103 김경아 김경아 권현정 김경아 김경아 김경아 정동경 정동경 정동경 정동경 컴퓨터 컴퓨터 전자 컴퓨터 컴퓨터 컴퓨터 컴퓨터 컴퓨터 컴퓨터 컴퓨터 DB OS CA DB OS SA DB OS SA TT A B A C A A C A A B - 문제) 불필요한 데이터의 중복이 발생하며, 기본키에 부분함수종속으로 인한 이상현상 발생 ① 삽입이상 : 특정 학생이 과목을 등록할 때까지는 지도교수가 누구라는 것 삽입 불가 ② 삭제이상 : 학번이 101번은 과목등록을 취소하면 학과, 지도교수정보도 삭제 ③ 갱신이상 : 학번이 103인 학생의 지도교수가 변경되면 4개의 튜플 변경

  6. 지도교수 학 번 성 적 학 과 과목번호 학 번 지도교수 성 적 학 번 과목번호 학 과 학번 지도교수 학번 학과 지도교수 학과 {학번, 과목번호} 성적 (2) 제2정규형(2NF ; Second Normal Form) - 릴레이션 R이 1NF이고 키가 아닌 모든 애트리뷰트가 기본키에 완전함수종속 - 문제) 기본키에 이행적 함수종속으로 인한 이상현상 발생 ※ 이행적 함수 종속 : A B와 B C가 성립하면 A C도 성립 (1NF) 부분함수종속 제거 (2NF)

  7. 학 번 학 번 학 번 지도교수 지도교수 성 적 성 적 학 번 과목번호 과목번호 지도교수 학 과 학 과 {학번, 과목번호} 성적 학번 지도교수 지도교수 학과 (3) 제3정규형(3NF ; Third Normal Form) - 릴레이션 R이 2NF이고 키가 아닌 모든 애트리뷰트가 기본키에 이행적 함수종속이 아님 - 문제) 후보키가 서로 중첩되는 경우에는 적용할 수가 없음 (2NF) 이행적 함수종속 제거 (3NF)

  8. 기본키 : 학번, 과목번호 {학번, 과목번호} 교수 교수 과목번호 교 수 학 번 학 번 교 수 교 수 과목번호 과목번호 (4) 보이스/코드 정규형(Boyce/Codd Normal Form : BCNF) - 릴레이션 R의 모든 결정자가 후보키 (강한 3NF) - 1NF, 2NF, 기본키, 이행종속 등의 개념을 이용하지 않고 정의되기 때문에 3NF보다 간단 (3NF) 결정자가 후보키가 아닌 함수종속 제거 (BCNF) 기본키 : 학번, 교수 외래키 : 교수 참조 : 교수과목번호 기본키 : 교수

  9. 과 목 교 수 과 목 교 재 DB DB 운영체제 김경아 권현정 정동경 과 목 교 수 교 재 다치종속제거 DB 운영체제 운영체제 운영체제 DB OS1 OS2 OS3 DB 운영체제 김경아 권현정 정동경 DB OS1 OS2 OS3 과목 교수|교재 과목 교재 과목 교수 (5) 제4정규형(4NF ; Fourth Normal Form) ※ 다치종속(MVD) : 릴레이션 R의 애트리뷰트 A,B,C에서 (A,C) 값에 대응되는 B의 값이 A에만 종속되고 C값에는 독립적이면 B는 A에 다치종속이라한다. (A B로 표기) ※ Fagin의 정리 : R(A,B,C)에서 A B|C가 존재하면 R(A,B)와 R(A,C)로 분해가능

  10. (6) 제5정규형(5NF ; Fifth Normal Form) PJ/NF(Projection-Join / Normal Form) ※ 조인종속(JD) : 릴레이션 R(A,B,C..Z)가 프로젝션 A,B,C…Z를 조인한 결과와 같다면 R은 조인종속 *(A,B,C…Z)를 만족 ※ JD와 MVD의 관계 : 릴레이션 R(A,B,C)가 조인종속(JD) *(AB,AC)를 만족하면 R은 다치종속(MVD) A B|C를 만족 - 릴레이션 R에 존재하는 모든 조인종속이 릴레이션 R의 후보키를 통해서만 성립 - 예) 릴레이션 R(학번, 이름, 학과, 학년) 후보키 : 학번, 이름 *((학번, 이름, 학과), (학번, 학년)) *((학번, 이름), (학번, 학년), (이름, 학과))

  11. 비정규 릴레이션 원자값이 아닌 도메인을 분해 1NF 비정규릴레이션 부분함수종속 제거 1NF 2NF 2NF 이행적 함수종속 제거 3NF 3NF BCNF 4NF 결정자가 후보키가 아닌 함수종속 제거 5NF BCNF 함수종속이 아닌 다치종속 제거 4NF 후보키를 통하지 않은 조인종속 제거 (7) 정규형들간의 관계 5NF

  12. 기출 . 예상 문제 • 정규화(normalization)는 데이터베이스의 물리적 구조나 처리에 영향을 주지 않고 논리적 처리 • 및 품질에 영향을 미친다. 정규화하지 않을 경우에는 이상(anomaly)현상, 즉 잠재적인 문제점 • 들이 발생한다. 다음 중 이상 현상의 형태에 해당하지 않는 것은? • ① 삽입 이상 현상 ② 링크 이상 현상 • ③ 갱신 이상 현상 ④ 삭제 이상 현상 • 2. 어떤 릴레이션 R이 2NF를 만족하면서 키에 속하지 않는 모든 애트리뷰트가 기본 키에 대하여 이 • 행적 함수 종속이 아니면 어떤 정규형에 해당 하는가? • ① 제1정규형 ② 제2정규형 • ③ 제3정규형 ④ 제1,2,3정규형 • 3. 키가 아닌 모든 속성이 기본 키에 충분한 함수적 종속을 만족하는 정규형은? • ① 1NF ② 2NF • ③ 3NF ④ 4NF

  13. 기출 . 예상 문제 4. 관계형 데이터베이스의 릴레이션을 조작할 때 발생하는 이상현상(anomaly)에 관한 설명으로 적절하지 않은 것은? ① 데이터의 종속으로 인해 발생하는 이상현상에는 삭제이상, 삽입이상, 갱신이상이 있다. ② 릴레이션의 한 튜플을 삭제함으로써 연쇄삭제로 인해 정보의 손실을 발생시키는 현상이 삭제이상이다. ③ 데이터를 삽입할 때 불필요한 데이터가 함께 삽입되는 현상을 삽입이상이라 한다. ④ 튜플 중에서 일부 속성을 갱신함으로써 정보의 모순성이 발생하는 현상이 갱신이상이다. 5. 정규화의 의미로 틀린 것은? ① 함수적 종속성 등의 이론을 이용하여 잘못 설계된 관계형 스키마를 더 작은 속성의 세트로 쪼개어 바람직한 스키마로 만들어 가는 과정이다. ② 좋은 데이터베이스 스키마를 생성해 내고 불필요한 데이터의 중복을 방지하여 정보검색을 용이하게 할 수 있도록 허용해 준다. ③ 정규형에는 제1정규형, 제2정규형, 제3정규형, BCNF, 제4정규형, 제5정규형 등이 있다. ④ 어떠한 릴레이션 구조가 바람직한 것인지, 바람직하지 못한 릴에이션을 어떻게 합쳐야 하는지에 관한 구체적인 판단기준을 제공한다.

More Related