728x90

데이터베이스 (Database)

  • 통합된 데이터 (Integrated Data) : 자료의 중복을 배제한 데이터
  • 저장된 데이터 (Stored Data) : 컴퓨터가 접근할 수 있는  저장 매체에 저장된 자료
  • 운영 데이터 (Operational Data) : 조직의 고유한 업무를 수행하는 데 반드시 필요한 자료
  • 공용 데이터 (Shared Data) : 여러 응용 시스템들이 공동으로 소유하고 유지하는 자료

DBMS (DataBase Management System, 데이터베이스 관리 시스템)

  • 정의 기능 (Definition) : 데이터 형(Type)과 구조, 이용 방식, 제약 조건 등
  • 조작 기능 (Manipulation) : 데이터 검색, 갱신, 삽입, 삭제 등
  • 제어 기능 (Control) : 데이터 무결성, 보안, 권한 검사, 병행 제어 등

데이터의 독립성

  • 논리적 독립성 : 응용 프로그램과 데이터베이스를 독립시킴으로써, 데이터의 논리적 구조를 변경시키더라도 응용 프로그램은 영향을 받지 않음
  • 물리적 독립성 : 응용 프로그램과 보조기억장치 같은 물리적 장치를 독립시킴으로써, 디스크를 추가/변경하더라도 응용 프로그램은 영향을 받지 않음

스키마 (Schema)

데이터베이스의 구조와 제약 조건에 관한 전반적인 명세를 기술

  • 외부 스키마 : 각 개인의 입장에서 필요로 하는 데이터베이스의 논리적 구조를 정의
  • 개념 스키마 : 조직 전체의 데이터베이스로 하나만 존재
  • 내부 스키마 : 물리적 저장장치 입장에서 본 데이터베이스 구조

 

 

데이터베이스 설계

데이터베이스 설계시 고려사항

  • 무결성 : 삽입, 삭제, 갱신 등 연산 후에도 데이터베이스에 저장된 데이터가 정해진 제약 조건을 항상 만족해야 함
  • 일관성 : 처음부터 끝까지 변함없이 일정해야 함
  • 회복 : 시스템에 장애가 발생했을 때 장애 발생 직전의 상태로 복구할 수 있어야 함
  • 보안 : 불법적인 데이터의 노출 또는 변경이나 손실로부터 보호할 수 있어야 함
  • 효율성 : 응답시간의 단축, 시스템의 생산성, 저장 공간의 최적화 등 가능해야 함
  • 데이터베이스 확장 : 데이터베이스 운영에 영향을 주지 않으면서 지속적으로 데이터를 추가할 수 있어야 함

데이터베이스 설계 순서

요구 조건 분석 -> 개념적 설계 -> 논리적 설계 -> 물리적 설계 -> 구현

  • 개념적 설계 : 현실 세계에 대한 인식을 추상적 개념으로 표현, 개념 스키마 모델링과 트랜잭션 모델링을 병행 수행, ERD
  • 논리적 설계 (데이터 모델링) : 논리적 스키마, 특정 DBMS가 지원하는 논리적 자료 구조로 변환(Mapping)시키는 과정
  • 물리적 설계 (데이터 구조화) : 논리적 구조로 표현된 데이터 -> 물리적 구조의 데이터로 변환

 

 

데이터 모델

현실 세계의 정보들을 단순화, 추상화해 체계적으로 표현한 개념적 모형

구성요소

개체 (Entity)

  • 개념이나 정보 단위 같은 현실 세계의 대상체
  • 실세계에 독립적으로 존재하는 유/무형 정보로서 속성으로 구성
  • 유일한 식별자 (Unique Identifier)에 의해 식별
  • 다른 개체와 하나 이상의 관계 (Relationship)가 있음

속성 (Attribute)

  • 데이터베이스를 구성하는 가장 작은 논리적 단위
  • 데이터 항목, 데이터 필드에 해당
  • 개체의 특성
  • 속성의 수는 디그리 (Degree), 차수

관계 (Relationship)

  • 개체와 개체 사이의 논리적 연결
  • 개체 간의 관계, 속성 간의 관계
  • 관계의 형태
    • 일대일 (1:1)
    • 일대다 (1:N)
    • 다대다 (N:M)
  •  관계의 종류
    • 종속 관계 (Dependent Relationship) : 식별 관계, 비식별 관계
    • 중복 관계 (Redundant Relationship) : 2번 이상의 종속 관계
    • 재귀 관계 (Recursive Relationship) : 순환 관계, 자기 자신과 관계를 갖음
    • 배타 관계 (Exclusive Relationship) : 배타 AND 관계, 배타 OR 관계

 

종류

  • 개념적 데이터 모델
  • 논리적 데이터 모델
  • 물리적 데이터 모델

표시할 요소

  • 구조 (Structure)
  • 연산 (Operation)
  • 제약 조건 (Constraint)

 

 

식별자 (Identifier)

하나의 개체 내에서 인스턴스를 유일(Unique)하게 구분할 수 있는 구분자

모든 개체는 1개 이상의 식별자를 가져야 한다.

식별자의 특징

  • 유일성
  • 최소성
  • 불변성
  • 존재성

 

 

ERD (Entity-Relationship Diagram, 개체-관계 다이어그램)

 

 

관계형 데이터베이스

튜플 (Tuple)

  • 릴레이션을 구성하는 각각의 행
  • 속성의 모임으로 구성됨
  • 파일 구조에서 레코드와 같은 의미
  • 튜플의 수는 카디널리티 (Cardinality)

속성 (Attribute)

  • 데이터베이스를 구성하는 가장 작은 논리적 단위
  • 파일 구조에서 데이터 항목, 데이터 필드에 해당
  • 개체의 특성
  • 속성의 수를 디그리 (Degree), 차수

도메인 (Domain)

  • 하나의 애트리뷰트가 취할 수 있는 같은 타입의 원자 (Atomic) 값들의 집합
  • ex) '성별' 애트리뷰트의 도메인은 "남"과 "여"로, 그 외의 값은 입력될 수 없음

릴레이션의 특징

  • 한 릴레이션에 포함된 튜플 사이에는 순서가 없음
  • 속성의 값은 논리적으로 더 이상 쪼갤 수 없는 원자값만을 저장

관계형 데이터 모델 (Relational Data Model)

  • 2차원 표(Table)를 이용해서 데이터 상호 관계를 정의하는 DB 구조
  • 기본키 (Primary Key)와 이를 참조하는 외래키 (Foreign Key)로 데이터 간의 관계를 표현
  • SQL
  • 1:1, 1:N, N:M 관계를 자유롭게 표현할 수 있음

 

 

관계형 데이터베이스 제약 조건 - 키 (Key)

데이터베이스에서 조건에 만족하는 튜플을 찾거나 순서대로 정렬할 때 기준이 되는 속성

후보키 (Candidate Key)

  • 속성들 중에서 튜플을 유일하게 식별하기 위해 사용되는 속성들의 부분집합
  • 유일성와 최소성을 모두 만족시켜야 함
  • 유일성 (Uniquee) : 하나의 키 값으로 하나의 튜플만을 유일하게 식별할 수 있어야 함
  • 최소성 (Minimality) : 키를 구성하는 속성 하나를 제거하면 유일하게 식별할 수 없도록 꼭 필요한 최소의 속성으로 구성되어야 함

기본키 (Primary Key)

  • 후보키 중에서 특별히 선정된 주 키 (Main Key)
  • 중복된 값을 가질 수 없음
  • 한 릴레이션에서 특정 튜플을 유일하게 구별할 수 있는 속성
  • NULL 값을 가질 수 없음

대체키 (Alternate Key)

  • 보조키, 후보키가 둘 이상일 때 기본키를 제외한 나머지 후보키

슈퍼키 (Super Key)

  • 한 릴레이션 내에 있는 속성들의 집합으로 구성된 키
  • 유일성은 만족하지만, 최소성은 만족하지 못함

외래키 (Foreign Key)

  • 다른 릴레이션의 기본키를 참조하는 속성 또는 속성들의 집합

 

 

관계형 데이터베이스의 제약 조건 - 무결성 (Integrity)

데이터베이스에 저장된 데이터 값과 현실 세계의 실제값이 일치하는 정확성

무결성의 종류

  • 개체 무결성 : 기본 테이블의 기본키를 구성하는 어떤 속성도 NULL 값이나 중복값을 가질 수 없음
  • 참조 무결성 : 릴레이션은 참조할 수 없는 외래키 값을 가질 수 없음
  • 도메인 무결성 : 주어진 속성 값이 정의된 도메인에 속한 값이어야 함
  • 사용자 정의 무결성 : 속성 값들이 사용자가 정의한 제약조건에 만족되어야 함
  • NULL 무결성 : 릴레이션의 특정 속성 값이 NULL이 될 수 없도록 함
  • 고유 무결성 : 릴레이션의 특정 속성에 대해 각 튜플이 갖는 속성값들이 서로 달라야 함
  • 키 무결성 : 하나의 릴레이션에는 적어도 하나의 키가 존재해야 함
  • 관계 무결성 : 릴레이션의 어느 한 튜플의 삽입 가능 여부 또는 한 릴레이션과 다른 릴레이션의 튜플들 사이의 관계에 대한 적절성 여부를 지정한 규정

 

 

관계대수, 관계해석

관계대수

  • 원하는 정보와 그 정보를 검색하기 위해 어떻게 유도하는가를 기술하는 절차적 언어
  • 순수 관계 연산자, 일반 집합 연산자

 

순수 관계 연산자

 

일반 집합 연산자

 

 

관계 해석 (Relational Calculus)

  • 관계 데이터의 연산을 표현하는 방법. 비절차적 특성

 

 

이상, 함수적 종속

이상 (Anomaly)

  • 테이블에서 데이터의 중복(Redundancy)이 발생하고 이로 인해 테이블 조작 시 문제가 발생하는 현상
  • 이상의 종류
    • 삽입 이상 (Insertion Anomaly) : 삽입 안 됨
    • 삭제 이상 (Deletion Anomaly) : 연쇄 삭제
    • 갱신 이상 (Updqte Anomaly) : 불일치성(Inconsistency)

 

 

 

함수적 종속 (Functional Dependency)

속성 X의 값 각각에 대해 시간에 관계없이 항상 속성 Y의 값이 오직 하나만 연관되어 있을 때 Y는 X에 함수적 종속 or X가 Y를 함수적으로 결정한다고 하고, X -> Y로 표기

완전 함수적 종속 (Full Functional Dependency) : 

부분 함수적 종속 (Partial Functional Dependency) : 

 

 

정규화 (Normalization)

  • 테이블의 속성들이 상호 종속적인 관계를 갖는 특성을 이용해 테이블을 무손실 분해하는 과정
  • 목적 : 가능한 한 중복을 제거해 삽입, 삭제, 갱신 이상의 발생 가능성을 줄이는 것

메인이 원자값

분적 함수 종속 제거

행적 함수 종속 제거

정자이면서 후보키가 아닌 것 제거

치 종속 제거

인 종속성 이용

 

제 1 정규형 (1NF; First Normal Form)

테이블의 모든 속성 값이 원자 값(Atomic Value)으로만 되어 있는 정규형

 

제 2 정규형 (2NF; Second Normal Form)

테이블 R이 제 1 정규형이고, 기본키가 아닌 모든 속성이 기본키에 대해 완전 함수적 종속을 만족하는 정규형

 

제 3 정규형 (3NF; Third Normal Form)

테이블 R이 제 2 정규형이고, 이행적 함수적 종속 (Transitive Functional Dependency)을 만족하지 않는 정규형

이행적 함수적 종속 : A -> B이고, B -> C 일 때, A -> C 를 만족

 

BCNF (Boyce-Codd Normal Form)

모든 결정자가 후보키(Candidate Key)인 정규형

 

제 4 정규형 (4NF; Fourth Normal Form)

다중 값 종속 (MVD; Multi Valued Dependency, 다치 종속)


제 5 정규형 (5NF; Fifth Normal Form)

조인 종속 (JD; Join Dependency)이 R의 후보키를 통해서만 성립되는 정규형

 

 

반정규화 (Denormalization)

  • 시스템의 성능을 향상하고 개발 및 운영의 편의성을 높이기 위해 정규화된 데이터 모델을 의도적으로 통합, 중복, 분리해 정규화 원칙을 위배하는 행위
  • 방법
    • 테이블 통합
    • 테이블 분할
    • 중복 테이블 추가
    • 중복 속성 추가

 

 

시스템 카탈로그 (System Catalog)

데이터 사전(Data Dictionary), 시스템 그 자체에 관련이 있는 다양한 객체에 관한 정보를 포함하는 시스템 데이터베이스

메타 데이터 (Meta-Data)

  • 시스템 카탈로에 저장된 정보
  • 유형 : 데이터베이스 객체 정보, 사용자 정보, 테이블의 무결성 제약 조건 정보, 함수, 프로시저, 트리거 등 정보

데이터 디렉터리 (Data Directory)

데이터 사전에 수록된 데이터에 접근하는 데 필요한 정보를 관리 유지하는 시스템

 

 

트랜잭션 / CRUD

트랜잭션 (Transaction)

논리적 기능을 수행하기 위한 작업 단위 또는 한꺼번에 모두 수행되어야 할 일련의 연산들

트랜잭션의 특성

  • Atomicity (원자성) : All or Nothing
  • Consistency (일관성) : 실행을 성공적으로 완료하면 일관성 있는 데이터베이스 상태로 변환됨
  • Isolation (독립성, 격리성, 순차성) : 둘 이상의 트랜잭션이 동시에 병행 실행되는 경우, 어느 하나의 트랜잭션 실행 중에 다른 트랜잭션의 연산이 끼어들 수 없음
  • Durability (영속성, 지속성) : 시스템이 고장나더라도 영구적으로 반영되어야 함

CRUD

프로세스와 테이블 간에 CRUD 매트릭스를 만들어서 트랜잭션을 분석

 

 

인덱스 (Index)

데이터 레코드를 빠르게 접근하기 위해 <키 값, 포인터> 쌍으로 구성되는 데이터 구조

 

 

뷰 / 클러스터

뷰 (View)

  • 하나 이상의 기본 테이블로부터 유도된 이름을 가지는 가상 테이블
  • 뷰는 물리적으로 존재하지 않지만, 사용자에게 있는 것처럼 간주
  • 뷰를 정의할 때는 CREATE문, 제거할 때는 DROP 문을 사용

뷰의 장단점

클러스터 (Cluster)

  • 데이터 저장 시 데이터 액세스 효율을 향상시키기 위해 동일한 성격의 데이터를 동일한 데이터 블록에 저장하는 물리적 저장 방법
  • 클러스터링 된 테이블은 데이터 조회 속도를 향상시키지만 입력, 수정, 삭제에 대한 작업 성능을 저하시킨다
  • 클러스터는 데이터의 분포도가 넓을수록 유리
  • 처리 범위가 넓은 경우 : 단일 테이블 클러스터링, 조인이 많이 발생하는 경우 : 다중 테이블 클러스터링

 

 

파티션 (Partition)

  • 대용량의 테이블이나 인덱스를 작은 논리적 단위인 파티션으로 나누는 것
  • 하나의 테이블이 여러 개의 파티션으로 나눠져 있어도, DB에 접근하는 애플리케이션은 테이블 단위로 데이터를 처리하기 때문에 파티션을 인식하지 못함

 

 

분산 데이터베이스

  • 논리적으로는 하나의 시스템에 속하지만, 물리적으로는 네트워크를 통해 연결된 여러 개의 사이트(Site)에 분산된 데이터베이스를 말함
  • 목표
    • 위치 투명성 (Location Transparency) : DB의 실제 위치를 알 필요 없이 DB의 논리적 명칭만으로 액세스 할 수 있음
    • 중복 투명성 (Replication Transparency) : 동일 데이터가 여러 곳에 중복되어 있더라도 사용자는 하나의 데이터만 존재하는 것처럼 사용하고, 시스템은 자동으로 여러 자료에 대한 작업을 수행
    • 병행 투명성 (Concurrency Transparency) : 분산 DB와 관련된 다수의 트랜잭션들이 동시에 실현되더라도 그 트랜잭션의 결과는 영향을 받지 않음
    • 장애 투명성 (Failure Transparency) : 트랜잭션, DBMS, 네트워크, 컴퓨터 장애에도 불구하고 트랜잭션을 정확하게 처리

 

 

데이터베이스 이중화 / 서버 클러스터링

데이터베이스 이중화 (Database Replication)

  • 시스템 오류로 인한 DB 서비스 중단이나 물리적 손상 발생 시 이를 복구하기 위해 동일한 DB를 복제해 관리
  • 데이터베이스의 부하를 줄일 수 있고 손쉽게 백업 서버를 운영할 수 있음
  • 데이터베이스 이중화의 분류
    • Eager 기법 : 즉시 적용
    • Lazy 기법 : 종료되면 적용

클러스터링 (Clustering)

  • 두 대 이상의 서버를 하나의 서버처럼 운영하는 기술
  • 공유 스토리지 (NAS; Network Attached Storage) : 데이터 저장소를 네트워크로 연결해 파일 및 데이터를 공유하는 것으로, 다수의 사용자 또는 서버가 데이터를 안전하고 편리하게 공유할 수 있음
  • 고가용성 (HA; High Availability) : 시스템을 오랜 시간동안 계쏙해서 정상적으로 운영이 가능한 성질

RTO / PRO

  • RTO (Recovery Time Objective, 목표 복구 시간) : 비상사태 또는 업무 중단 시점으로부터 복구되어 가동될 때까지의 소요 시간
  • RPO (Recovery Point Objective, 목표 복구 시점) : 비상사태 또는 업무 중단 시점으로부터 데이터를 복구할 수 있는 기준점

 

 

데이터베이스 보안

암호화 (Encryption)

데이터를 보낼 때 송신자가 지정한 수신자 이외에는 그 내용을 알 수 없도록 평문을 암호문으로 변환하는 것

  • 암호화 (Encryption) : 평문 -> 암호문
  • 복호화 (Decryption) : 암호문 -> 평문
  • 암호화 기법
    • 개인키 암호화 방식 (Private Key Encryption)
    • 공개키 암호화 방식 (Public Key Encryption)

접근 통제

  • 임의 접근통제 (DAC, Discretionary Access Control)
    • 데이터에 접근하는 사용자의 신원에 따라 접근 권한을 부여하는 방식
    • 데이터의 소유자가 접근통제 권한을 지정하고 제어함
    • 객체를 생성한 사용자가 생성된 객체에 대한 모든 권한을 부여받고, 부여된 권한을 다른 사용자에게 허가할 수 있음
  • 강제 접근통제 (MAC, Mandatory Access Control)
    • 주체와 객체의 등급을 비교해 접근 권한을 부여하는 방식
    • 시스템이 접근통제 권한을 지정함
    • DB 객체별로 보안 등급을 부여할 수 있음
    • 사용자별로 인가 등급을 부여할 수 있음
  • 역할기반 접근통제 (RBAC, Role Based Access Control)
    • 사용자의 역할에 따라 접근 권한을 부여하는 방식
    • 중앙관리자가 접근통제 권한을 지정함
    • 임의 접근통제와 강제 접근통제의 단점을 보완함
    • 다중 프로그래밍 환경에 최적화된 방식

 

 

스토리지 (Storage)

대용량의 데이터를 처리하기 위해 서버와 저장장치를 연결하는 기술

DAS (Direct Attached Storage)

  • 서버와 저장장치를 전용 케이블로 직접 연결하는 방식
  • 일반 가정에서 컴퓨터에 외장하드를 연결하는 것

NAS (Network Attached Storage)

  • 서버와 저장장치를 네트워크를 통해 연결하는 방식
  • Ethernet 스위치를 통해 다른 서버에서도 스토리지에 접근할 수 있음
  • DAS에 비해 확장성 및 유연성이 우수

SAN (Storage Area Network)

  • DAS의 빠른 처리와 NAS의 파일 공유 장점을 혼합한 방식으로, 서버와 저장장치를 연결하는 전용 네트워크를 별도로 구성하는 방식
  • 파이버 채널(FC) 스위치를 이용해 네트워크를 구성
  • 확장성, 유연성, 가용성이 뛰어남

 

 

논리 데이터 모델의 변환

 

 

자료 구조

배열 (Array)

  • 크기와 형(Type)이 동일한 자료들이 순서대로 나열된 자료의 집합
  • 반복적인 데이터 처리 작업에 적합한 구조
  • 데이터 삭제 시 기억장소가 빈 공간으로 남아 있어 메모리의 낭비가 발생함

연속 리스트 (Contiguous List)

  • 배열과 같이 연속되는 기억장소에 저장되는 자료 구조
  • 중간에 데이터를 삽입하기 위해서는 연속된 빈 공간이 있어야 함
  • 삽입, 삭제 시 자료의 이동이 필요함

연결 리스트 (Linked List)

  • 자료들을 임의의 기억공간에 기억시키되, 순서에 따라 노드의 포인터 부분을 이용해 서로 연결시킨 자료 구조
  • 기억 공간의 이용 효율이 좋지 않으며, 접근 속도가 느리고, 연결이 끊어지면 다음 노드 찾기가 어려움

스택 (Stack)

  • 리스트의 한쪽 끝으로만 자료의 삽입, 삭제 작업이 이루어지는 자료 구조
  • 후입선출 (LIFO; Last In First Out)
  • 저장할 기억 공간이 없는 상태에서 데이터가 삽입되면 오버플로(Overflow)가 발생
  • 삭제할 데이터가 없는 상태에서 데이터를 삭제하면 언더플로(Underflow)가 발생

큐(Queue)

리스트의 한쪽에는 삽입 작업이 이루어지고, 다른 한쪽에서는 삭제 작업이 이루어지는 자료 구조

선입선출(FIFO; First In First out)

시작을 표시하는 프런트(Front) 포인터와 끝을 표시하는 리어 (Rear) 포인터가 있음

그래프 (Graph)

  • 정점(Vertex)과 간선(Edge)의 두 집합으로 이루어지는 자료 구조
  • 사이클이 없는 그래프(Graph)를 트리(Tree)라 함
  • 방향 그래프
  • 무방향 그래프

 

 

트리 (Tree)

정점(Node, 노드)과 선분(Branch, 가지)를 이용해 사이클을 이루지 않도록 구성한 그래프(Graph)의 특수한 형태

 

 

 

이진 트리 (Tree)

차수(Degree)가 2 이하인 노드들로 구성된 트리

Preorder

Root -> Left -> Right

Inorder

Left -> Root -> Right

Postorder

Left -> Right -> Root

 

 

정렬 (Sort)

삽입 정렬 (Insertion Sort)

가장 간단한 정렬 방식, 이미 순서화된 파일에 새로운 하나의 레코드를 순서에 맞게 삽입시켜 정렬하는 방식

선택 정렬 (Selection Sort)

최소값을 찾아 첫 번째 레코드 위치에 놓고, 다시 최소값을 찾아 두 번째 레코드 위치에 놓는 방식을 반복해 정렬하는 방식

 

버블 정렬 (Bubble Sort)

인접한 2개의 레코드 키 값을 비교해 그 크기에 따라 레코드 위치를 서로 교환하는 정렬 방식

쉘 정렬 (Shell Sort)

입력 파일을 어떤 매개변수의 값으로 서브 파일을 구성하고, 각 서브 파일을 삽입(Insertion) 정렬 방식으로 순서 배열하는 과정

삽입 정렬(Insertion Sort)을 확장한 개념

퀵 정렬 (Quick sort)

키를 기준으로 작은 값을 왼쪽, 큰 값은 오른쪽 서브 파일에 분해시키는 정렬 방식

힙 정렬 (Heap Sort)

전이진 트리를 이용한 정렬 방식

2-Way 합병 정렬 (Merge Sort)

이미 정렬되어 있는 2개의 파일을 1개의 파일로 합병하는 정렬 방식

기수 정렬 (Radix Sort) = 버킷 정렬 (Bucket Sort)

큐(Queue)를 이용해 자릿수(Digit)별로 정렬하는 방식

 

 

#

REFERENCE

 

[정보처리기사 실기] 02. 데이터 입·출력 구현

02. 데이터 입·출력 구현 (1) 데이터 전환 데이터 전환 운영 중인 기본 정보 시스템에 축적되어 있는 데이터를 추출(Extraction)하여 새로 개발할 정보 시스템에서 운영할 수 있도록 변환(Transformation)

starrykss.tistory.com