📖 Certificate/ADsP

[ADsP] 1-1 데이터의 이해 요약정리

스쳐가는비 2024. 1. 29. 11:11

데이터의 정의

- 데이터는 추론과 추정의 근거를 이루는 사실이다.

  • 존재적 특성- 객관적 사실
  • 당위적 특성- 추론, 예측, 전망, 추정을 위한 근거

 

클라우드 컴퓨팅 

- 빅데이터 분석에 경제적 효과를 제공해준 기술로 가장 적절하다.

  • 빅데이터 분석에 경제성을 제공해준 결정적 기술
  • 대규모 데이터가 모이는 곳
  • 신속한 처리비용 하락

 

데이터의 특징

- 지역별 온도, 풍속, 강우량과 같이 수치로 명확하게 표현되고 데이터의 양이 크게 증가 하더라도

이를 관리하는 시스템에 저장, 검색, 분석하여 활용하기가 매우 용이하다.

ex) 정량적 데이터 -> 강수량(정량), 온도(정량), 풍속(정량)

정성적 데이터 -> 기상특보(정성)

  • 정성적 데이터
    - 언어, 문자 형태의 데이터 (회사 매출의 증가 등)
  • 정량적 데이터
    - 수치, 도형, 기호 형태의 데이터(나이, 몸무게, 주가 등)

 

지식의 종류

  • 암묵지
    - 학습과 경험을 통해 개인에 체화된 지식, 공유와 전달의 어려움이 있다. (내면화 -> 공통화 필요)
  • 형식지
    - 문서나 메뉴얼처럼 형식화된 지식, 공유와 전달이 용이하다. (표출화 -> 연결화 필요)

ex) 

  1. 데이터는 지식경영의 핵심 이슈인 암묵지와 형식지의 상호작용을 한다.
  2. 지식의 차원에 대해 가장 널리 알려진 것은 Polany가 두가지 차원으로 구성된 암묵지와 형식지이다.
  3. 암묵지의 예) 김장김치 담그기의 노하우
  4. 암묵지는 개인에서 체화되기 있기 때문에 공유하기 어렵다. 현장작업과 같은 경험을 통해 획득할 수 있다.
  5. 회계, 재무 관련 대차대조표에 요구되는 지식의 메뉴얼 등이 암묵지이다. [(X) 메뉴얼로 얻을수 있는 지식은 형식지]
  6. 형식지는 문서나 메뉴얼처럼 외부로 표출되어 여러 사람이 공유할 수 있는 지식이다.
  7. 형식지란 개인에 체화된 비밀스러운 지식이다. [(X) 개인에 체화된 지식은 암묵지]
  8. 내재된 경험을 문서나 매체로 저장하는 것은? (표출화)
  9. 암묵지 지식 노하우를 다른 사람에게 알려주는 것은? (공통화)
  10. 암묵지 지식 노하우를 책이나 교본 등 형식지로 만드는 것은? (표출화)
  11. 책이나 교본(형식지)에 자신이 알고 있는 새로운 지식(형식지)를 추가하는 것은? (연결화)
  12. 만들어진 책이나 교본(형식지)를 보고 다른 직원들이 암묵적 지식(노하우)을 습득하는 것은? (내면화)

 

DIKW 피라미드

- Data(자료), Infomation(정보), Knowledge(지식), Wisdom(지혜)의 4가지 계층으로 이루어져있다.

  • 데이터
    - 가공하기 전의 순수한 수치나 기호
  • 정보
    - 데이터의 가공 및 상관관계간 이해를 통해 패턴을 인식하고 그 의미를 부여
  • 지식
    - 상호 연결된 정보 패턴을 이해하여 이를 토대로 예측한 결과물
  • 지혜
    - 근본 원리에 대한 깊은 이해를 바탕으로 도출되는 창의적인 아이디어

ex)

  1. 데이터는 객관적 사실이다.
  2. 데이터는 개별 데이터 자체로는 의미가 중요한 객관적 사실이다. [(X) 데이터는 단지 순수한 수치나 기호만 뜻한다.]
  3. 데이터는 단순한 객체로서의 가치와 다른 객체와의 상호 관계 속에서 가치를 가진다.
  4. 오늘의 날씨는 21도이다. (데이터)
  5. A마트의 쇠고기는 1키로에 2만원이다. (데이터)
  6. B회사의 매출액은 3천만원으로 예상된다. (지식)
  7. C마트는 100원에, D마트는 200원에 연필을 판다. (데이터)
  8. 데이터의 가공 및 처리와 데이터간 연관관계 속에서 의미가 도출되는 것은? (정보)

 

1980년대 기업 내부 데이터베이스  

  • OLTP (On-line Transaction Processing)
    - 호스트 컴퓨터가 데이터베이스를 액세스하고, 바로 처리 결과를 돌려보내는 형태 (데이터 갱신 위주)
  • OLAP (On-line Analytical Processing)
    - 쉽고 빠르게 다차원적인 데이터에 접근하여 의사 결정에 활용할 수 있는 정보를 얻을 수 있게 해주는 기술(데이터 조회 위주)
    - 다차원의 데이터를 대화식으로 분석하기 위한 S/W

 

2000년대 기업 내부 데이터베이스  

  • CRM (Customer Relationship Management, 고객 관계 관리)
    - 기업이 고객과 관련된 내-외부 자료를 분석-통합하여 고객 중심 자원을 극대화 하고, 회사의 현재 고객 및 잠재 고객과 관련된 정보를 관리, 추적, 저장하도록 지원하는 일련의 데이터기반 S/W가 통합된 솔루션
  • SCM (Supply Chain Management, 공급망 관리)
    - 기업에서 원재료의 생산-유통등 모든 공급망 단계를 최적화해 수요자가 원하는 제품을 원하는 시간과 장소에 제공
  • KMS (Knowledge Management System, 지식관리 시스템)
    - 조직 내 인적자원들이 축적하고 있는 지식을 체계화 하여 공유함으로써 조직의 역량을 강화

ex) 

  1. 기업 내부 데이터베이스의 활용과 관련된것은? (CRM, ERP, ITS[X], KMS)
  2. 고객과의 관계를 지속적으로 하기 위한 정보시스템은? (CRM)

 

분야별 데이터베이스  

  • 제조부문
    - ERP (Enterprise Resource Planing) : 경영자원을 하나의 통합시스템으로 재구축, 생산성 극대화를 위한 경영혁신 기법
    - BI (Business Intelligence) : 기업이 보유하고 있는 데이터를 통해 기업의 의사결정에 활용하는 프로세스
    - CRM (Customer Relationship Management) : 고객 중심 자원을 극대화
    - RTE (Real-Time Enterprise) : 회사 전 부문의 정보를 하나로 통합
  • 금융부문
    - EAI (Enterprise Application Integration) : 필요한 정보를 중앙 집중적으로 통합-관리-사용할 수 있는 환경
    - EDW (Enterprise Data Warehouse) : BPR, CRM, BSC 같은 다양한 분석 애플리케이션들을 위한 원천
  • 유통부문
    - KMS (Knowledge Management System) : 지식관리시스템, 기업경영을 지식관점에서 접근
    - RFID (RF, Radio Frequency) : 주파수를 이용해 ID를 식별하는 System, 일명 전자태그

ex)

  1. 제조업을 포함한 다양한 비즈니스 분야에서 생산, 구매, 재고, 주문, 공급자와의 거래, 고객서비스 제공등 주요 프로세스 관리를 돕는 여러모듈로 구성된 통합 애플리케이션은? (ERP)
  2. 이것은 데이터를 통합/분석하여 기업활동에 연관된 의사결정을 돕는 프로세스를 말한다. (BI)

 

DB 용어 ★   

  • DML (데이터 조작어) 
    - 데이터 처리 및 관리 (SELECT, INSERT, UPDATE, DELETE)
  • DDL (데이터 정의어)
    - 데이터 구조를 정의 (CREATE, ALTER, DROP, RENAME)
  • DCL (데이터 제어어)
    - 권한 관리 (GRANT, REVOKE)
  • TCL (트랜잭션 제어어)
    - 작업을 단위별로 제어 (COMMIT, ROLLBACK)

 

데이터베이스 특징  ★  

  • 통합된 데이터
    - 중복된 데이터가 없음
  • 저장된 데이터
    - 저장 매체에 저장
  • 공용 데이터
    - 여러 사용자가 서로 다른목적을 가지고 공동으로 이용
  • 변화되는 데이터
    - 데이터 삽입, 삭제, 갱신으로 항상 변화하면서도 현재의 정확한 데이터를 유지

ex)

  1. 데이터베이스는 통합된 데이터이다. 이것은 데이터베이스에서도 동일한 내용의 데이터가 중복되어 있지 않다는것을의미한다.
  2. 데이터베이스는 저장된 데이터이다. 이것은 자기디스크나 자기테이프등과 같이 컴퓨터가 접근할 수 있는 저장매체에 저장되는것을 의미한다.
  3. 데이터베이스는 공용 데이터이다. 이것은 여러 사용자가 서로 다른 목적으로 데이터베이스의 데이터를 공동으로 이용하는 것을 말한다.
  4. 데이터베이스는 변화되는 데이터이다. 데이터베이스가 저장되는 내용은 정량적 데이터 상태로만 유지됨을 의미한다[(X) 정량적 데이터 상태로만 유지되는것이 아니라 삽입, 삭제, 갱신으로 변화가능한 데이터다.)
  5. 데이터 베이스 설계 절차는? (요구분석 -> 개념 -> 논리 -> 물리)