Certificate/정보처리기사

정보처리기사 실기 키워드 정리(3장)

마닐라 2021. 9. 3. 14:44

1.데이터 모델 절차

개념적 데이터 모델 - 주요 산출물로는 개체관계 다이어그램이 있으며 현실 세계에 대한 인식을 추상적, 개념적으로 표현하여 개념적 구조를 도출

논리적 데이터 모델 - 정규화를 수행하며 사람이 이해하기 쉽게 표현한 데이터 모델

물리적 데이터 모델 - 반정규화를 수행하며 특정 DBMS의 특성 및 성능을 고려하여 물리적인 스키마를 만드는 데이터 모델

 

논리적 데이터 모델의 종류

관계 데이터 모델 - 논리적 구조가 2차원 테이블 형태로 구성된 모델

계층 데이터 모델 - 논리적 구조가 트리 형태로 구성된 모델

네트워크 데이터 모델 - 논리적 구조가 그래프 형태로 구성된 모델

 

2.도출된 엔티티 간의 관계를 이해하기 쉽게 도식화한 다이어그램

- 개체관계 다이어그램

 

3.관계 데이터 모델의 구성요소 - 릴레이션, 튜플, 속성, 카디널리티, 차수, 스키마, 인스턴스

릴레이션 - 행과 열로 구성된 테이블

튜플 - 릴레이션의 행

속성(Attribute) - 릴레이션의 열

카디널리티 - 튜플의 수

차수 - 속성의 수

스키마 - 데이터베이스의 구조, 제약정보 등을 담고 있는 기본적인 구조

인스턴스 - 생성된 테이블에 실제 저장된 데이터의 집합

 

4.관계형 DB에서 원하는 정보와 그 정보를 어떻게 유도하는가를 기술하는 절차적 정형 언어

- 관계 대수

 

5.관계 대수 연산자의 종류

- 일반 집합 연산자 / 순수 관계 연산자

일반 집합 연산자(합교차카)

순수 관계 연산자(셀프조디) - σ , π, ▷◁, ÷

셀렉트(행) - 릴레이션 R에서 조건을 만족하는 튜플 반환 -> σ조건(R)

프로젝트(열) - 릴레이션 R에서 주어진 속성들의 값으로만 구성된 튜플 반환 -> π속성리스트(R)

조인 - 공통 속성을 이용해 R과 S의 튜플들을 연결해 만들어진 튜플 반환 -> R▷◁S

디비전 - 릴레이션 S에 있는 모든 튜플과 관련있는 R의 튜플 반환 -> R÷S

 

6.튜플 관계 해석과 도메인 관계 해석을 하는 비절차적 언어

- 관계 해석

 

7.논리 데이터 모델링의 속성

- 개체(사각형), 속성(타원형), 관계(마름모)

 

8.현실 세계에 존재하는 데이터와 그들 간의 관계를 표현하기 위해 사용하는 모델

- 개체-관계 모델

 

9.참조무결성 원칙을 위배하는 연산을 거절하는 옵션 - Restricted

참조되는 릴레이션에서 이 튜플을 참조하는 튜플도 함께 삭제하는 옵션 - Cascade

 

10.대상이 되는 범위(모집단)의 요소를 몇 개 모은 단위체이고 인덱스의 단점을 해결한 기법

- 클러스터

 

11.파티션의 종류 - 레인지 파티셔닝, 해시 파티셔닝, 리스트 파티셔닝, 컴포지트 파티셔닝

레인지 파티셔닝 - 연속적인 숫자나 날짜를 기준으로 관리 하는 파티셔닝 기법

해시 파티셔닝 - 파티션 키의 해시 함수 값에 의한 파티셔닝 기법

리스트 파티셔닝 - 특정 파티션에 저장 될 데이터에 대한 명시적 제어가 가능한 파티셔닝 기법

컴포지트 파티셔닝 - 위의 3개 파티셔닝 중 2개 이상의 파티셔닝을 결합하는 파티셔닝 기법

 

12.성능 향상을 위해 데이터를 1개 이상의 디스크 드라이브에 저장하여 드라이브를 병렬로 사용할 수 있는 기술

- 디스크 스트라이핑

 

13.자료 내용은 주 저장부, 자료의 색인은 자료가 기록된 위치와 함께 색인부에 기록되는 시스템

- ISAM(Indexed Sequential Access Method)

 

14.대형 운영체제에서 사용되는 파일 시스템

- VSAM(Virtual Storage Access Method)

 

15.DBMS 유형 - 키-값 DBMS, 컬럼 기반 데이터 저장 DBMS, 문서 저장 DBMS, 그래프 DBMS

키-값 DBMS - 키 기반 Get/Put/Delete 제공, 메모리 기반

컬럼 기반 데이터 저장 DBMS - Key 안에 (Column, Value) 조합으로 된 여러 개의 필드를 갖는 DBMS

테이블 기반, 조인 미지원, 컬럼 기반으로 구글의 Bigtable 기반으로 구현

문서 저장 DBMS - 값의 데이터 타입이 문서(Document)라는 타입을 사용하는 DBMS

그래프 DBMS - 그래프로 데이터를 표현하는 DBMS

 

16.DBMS 특징 - 무결성, 일관성, 회복성, 보안성, 효율성

 

부적절한 자료가 입력되어 동일한 내용에 대하여 서로 다른 데이터가 저장되는 것을 허용하지 않는 성질

- 무결성

삽입, 삭제, 갱신, 생성 후에도 저장된 데이터가 변함없이 일정한 성질

- 일관성

장애가 발생하였을 시 특정 상태로 복구되어야하는 성질

- 회복성

 

17.빅데이터의 특성 3가지 - 양, 다양성, 속도

 

빅데이터 수집, 저창 처리 기술

비정형 데이터 수집 - 척와

정형 데이터 수집 - 스쿱

 

18.대용량 데이터의 집합을 처리하는 응용 프로그램에 적합하도록 설계된 하둡 분산 파일 시스템

- HDFS

 

19.구글에서 대용량 데이터 처리를 분산 병렬 컴퓨팅에서 처리하기 위한 목적으로 제작한 프레임워크

- 맵 리듀스

 

20.실세계에 존재하는 모든 개념들과 속성, 관계 정보를 컴퓨터가 이해하도록 서술한 지식베이스

- 온톨로지

 

21.온톨로지를 활용하여 서비스를 기술하고 상호 운영성을 이용하여 자동화하는 웹

- 시멘틱 웹

 

22.대규모로 저장된 데이터 안에서 체계적이고 자동적으로 규칙이나 패턴을 찾아내는 기술

- 데이터 마이닝

 

23.데이터 마이닝의 주요 기법 - 분류 규칙, 연관 규칙, 연속 규칙, 데이터 군집화

분류 규칙 - 과거 데이터로부터 특성을 찾아내 분류모형을 만들어 결과 값을 예측

연관 규칙 - 데이터 안에 존재하는 항목들 간의 종속관계를 찾아내는 기법

연속 규칙 - 연관 규칙에 시간 관련 정보가 포함된 형태의 기법

데이터 군집화 - 대상 레코드들을 유사한 특성을 지닌 몇 개의 소그룹으로 분할하여 작업

 

24.대량의 텍스트 데이터로부터 패턴 또는 관계를 추출하여 의미 있는 정보를 찾아내는 기법

- 텍스트 마이닝

 

25.웹으로부터 얻어지는 방대한 양의 정보로부터 유용한 정보를 찾아내기 위하여 분석하는 기법

- 웹 마이닝

 

26.모든 속성으로 상속되는 공통 속성

- 슈퍼타입

 

27.개체의 전체 집합에서 일부만 모아놓은 부분 속성

- 서브타입