📖 Certificate/ADsP
[ADsP] 1-1 데이터의 이해 요약정리
스쳐가는비
2024. 1. 29. 11:11
데이터의 정의 ★
- 데이터는 추론과 추정의 근거를 이루는 사실이다.
- 존재적 특성- 객관적 사실
- 당위적 특성- 추론, 예측, 전망, 추정을 위한 근거
클라우드 컴퓨팅
- 빅데이터 분석에 경제적 효과를 제공해준 기술로 가장 적절하다.
- 빅데이터 분석에 경제성을 제공해준 결정적 기술
- 대규모 데이터가 모이는 곳
- 신속한 처리비용 하락
데이터의 특징 ★
- 지역별 온도, 풍속, 강우량과 같이 수치로 명확하게 표현되고 데이터의 양이 크게 증가 하더라도
이를 관리하는 시스템에 저장, 검색, 분석하여 활용하기가 매우 용이하다.
ex) 정량적 데이터 -> 강수량(정량), 온도(정량), 풍속(정량)
정성적 데이터 -> 기상특보(정성)
- 정성적 데이터
- 언어, 문자 형태의 데이터 (회사 매출의 증가 등) - 정량적 데이터
- 수치, 도형, 기호 형태의 데이터(나이, 몸무게, 주가 등)
지식의 종류 ★★★
- 암묵지
- 학습과 경험을 통해 개인에 체화된 지식, 공유와 전달의 어려움이 있다. (내면화 -> 공통화 필요) - 형식지
- 문서나 메뉴얼처럼 형식화된 지식, 공유와 전달이 용이하다. (표출화 -> 연결화 필요)
ex)
- 데이터는 지식경영의 핵심 이슈인 암묵지와 형식지의 상호작용을 한다.
- 지식의 차원에 대해 가장 널리 알려진 것은 Polany가 두가지 차원으로 구성된 암묵지와 형식지이다.
- 암묵지의 예) 김장김치 담그기의 노하우
- 암묵지는 개인에서 체화되기 있기 때문에 공유하기 어렵다. 현장작업과 같은 경험을 통해 획득할 수 있다.
- 회계, 재무 관련 대차대조표에 요구되는 지식의 메뉴얼 등이 암묵지이다. [(X) 메뉴얼로 얻을수 있는 지식은 형식지]
- 형식지는 문서나 메뉴얼처럼 외부로 표출되어 여러 사람이 공유할 수 있는 지식이다.
- 형식지란 개인에 체화된 비밀스러운 지식이다. [(X) 개인에 체화된 지식은 암묵지]
- 내재된 경험을 문서나 매체로 저장하는 것은? (표출화)
- 암묵지 지식 노하우를 다른 사람에게 알려주는 것은? (공통화)
- 암묵지 지식 노하우를 책이나 교본 등 형식지로 만드는 것은? (표출화)
- 책이나 교본(형식지)에 자신이 알고 있는 새로운 지식(형식지)를 추가하는 것은? (연결화)
- 만들어진 책이나 교본(형식지)를 보고 다른 직원들이 암묵적 지식(노하우)을 습득하는 것은? (내면화)
DIKW 피라미드 ★ ★ ★
- Data(자료), Infomation(정보), Knowledge(지식), Wisdom(지혜)의 4가지 계층으로 이루어져있다.
- 데이터
- 가공하기 전의 순수한 수치나 기호 - 정보
- 데이터의 가공 및 상관관계간 이해를 통해 패턴을 인식하고 그 의미를 부여 - 지식
- 상호 연결된 정보 패턴을 이해하여 이를 토대로 예측한 결과물 - 지혜
- 근본 원리에 대한 깊은 이해를 바탕으로 도출되는 창의적인 아이디어
ex)
- 데이터는 객관적 사실이다.
- 데이터는 개별 데이터 자체로는 의미가 중요한 객관적 사실이다. [(X) 데이터는 단지 순수한 수치나 기호만 뜻한다.]
- 데이터는 단순한 객체로서의 가치와 다른 객체와의 상호 관계 속에서 가치를 가진다.
- 오늘의 날씨는 21도이다. (데이터)
- A마트의 쇠고기는 1키로에 2만원이다. (데이터)
- B회사의 매출액은 3천만원으로 예상된다. (지식)
- C마트는 100원에, D마트는 200원에 연필을 판다. (데이터)
- 데이터의 가공 및 처리와 데이터간 연관관계 속에서 의미가 도출되는 것은? (정보)
1980년대 기업 내부 데이터베이스 ★
- OLTP (On-line Transaction Processing)
- 호스트 컴퓨터가 데이터베이스를 액세스하고, 바로 처리 결과를 돌려보내는 형태 (데이터 갱신 위주) - OLAP (On-line Analytical Processing)
- 쉽고 빠르게 다차원적인 데이터에 접근하여 의사 결정에 활용할 수 있는 정보를 얻을 수 있게 해주는 기술(데이터 조회 위주)
- 다차원의 데이터를 대화식으로 분석하기 위한 S/W
2000년대 기업 내부 데이터베이스 ★
- CRM (Customer Relationship Management, 고객 관계 관리)
- 기업이 고객과 관련된 내-외부 자료를 분석-통합하여 고객 중심 자원을 극대화 하고, 회사의 현재 고객 및 잠재 고객과 관련된 정보를 관리, 추적, 저장하도록 지원하는 일련의 데이터기반 S/W가 통합된 솔루션 - SCM (Supply Chain Management, 공급망 관리)
- 기업에서 원재료의 생산-유통등 모든 공급망 단계를 최적화해 수요자가 원하는 제품을 원하는 시간과 장소에 제공 - KMS (Knowledge Management System, 지식관리 시스템)
- 조직 내 인적자원들이 축적하고 있는 지식을 체계화 하여 공유함으로써 조직의 역량을 강화
ex)
- 기업 내부 데이터베이스의 활용과 관련된것은? (CRM, ERP, ITS[X], KMS)
- 고객과의 관계를 지속적으로 하기 위한 정보시스템은? (CRM)
분야별 데이터베이스 ★ ★
- 제조부문
- ERP (Enterprise Resource Planing) : 경영자원을 하나의 통합시스템으로 재구축, 생산성 극대화를 위한 경영혁신 기법
- BI (Business Intelligence) : 기업이 보유하고 있는 데이터를 통해 기업의 의사결정에 활용하는 프로세스
- CRM (Customer Relationship Management) : 고객 중심 자원을 극대화
- RTE (Real-Time Enterprise) : 회사 전 부문의 정보를 하나로 통합 - 금융부문
- EAI (Enterprise Application Integration) : 필요한 정보를 중앙 집중적으로 통합-관리-사용할 수 있는 환경
- EDW (Enterprise Data Warehouse) : BPR, CRM, BSC 같은 다양한 분석 애플리케이션들을 위한 원천 - 유통부문
- KMS (Knowledge Management System) : 지식관리시스템, 기업경영을 지식관점에서 접근
- RFID (RF, Radio Frequency) : 주파수를 이용해 ID를 식별하는 System, 일명 전자태그
ex)
- 제조업을 포함한 다양한 비즈니스 분야에서 생산, 구매, 재고, 주문, 공급자와의 거래, 고객서비스 제공등 주요 프로세스 관리를 돕는 여러모듈로 구성된 통합 애플리케이션은? (ERP)
- 이것은 데이터를 통합/분석하여 기업활동에 연관된 의사결정을 돕는 프로세스를 말한다. (BI)
DB 용어 ★ ★
- DML (데이터 조작어)
- 데이터 처리 및 관리 (SELECT, INSERT, UPDATE, DELETE) - DDL (데이터 정의어)
- 데이터 구조를 정의 (CREATE, ALTER, DROP, RENAME) - DCL (데이터 제어어)
- 권한 관리 (GRANT, REVOKE) - TCL (트랜잭션 제어어)
- 작업을 단위별로 제어 (COMMIT, ROLLBACK)
데이터베이스 특징 ★ ★
- 통합된 데이터
- 중복된 데이터가 없음 - 저장된 데이터
- 저장 매체에 저장 - 공용 데이터
- 여러 사용자가 서로 다른목적을 가지고 공동으로 이용 - 변화되는 데이터
- 데이터 삽입, 삭제, 갱신으로 항상 변화하면서도 현재의 정확한 데이터를 유지
ex)
- 데이터베이스는 통합된 데이터이다. 이것은 데이터베이스에서도 동일한 내용의 데이터가 중복되어 있지 않다는것을의미한다.
- 데이터베이스는 저장된 데이터이다. 이것은 자기디스크나 자기테이프등과 같이 컴퓨터가 접근할 수 있는 저장매체에 저장되는것을 의미한다.
- 데이터베이스는 공용 데이터이다. 이것은 여러 사용자가 서로 다른 목적으로 데이터베이스의 데이터를 공동으로 이용하는 것을 말한다.
- 데이터베이스는 변화되는 데이터이다. 데이터베이스가 저장되는 내용은 정량적 데이터 상태로만 유지됨을 의미한다[(X) 정량적 데이터 상태로만 유지되는것이 아니라 삽입, 삭제, 갱신으로 변화가능한 데이터다.)
- 데이터 베이스 설계 절차는? (요구분석 -> 개념 -> 논리 -> 물리)