본문 바로가기
빅데이터/ADsP

[ADsP] (1과목) 1.데이터의 이해

by 백곰IT 2020. 4. 13.

* 교재 : ADsP 데이터 분석 준전문가 2019 전면개정판-윤종식 (https://book.naver.com/bookdb/book_detail.nhn?bid=14451061)

* 위 도서를 근거로 작성한 글임을 밝힙니다 :)

1) 데이터와 정보

 1. 데이터의 정의와 특성

  가. 데이터의 정의

    - 1646년 영국 문헌에 처음 등장, 라틴어 dare(주다)의 과거분사형으로 '주어진 것' 이란 의미

    - 기술의 발전으로 데이터의 의미는 추상적인 개념에서 기술적이고 사실적인 의미로 변화

    - 추론과 추정의 근거를 이루는 사실

    - 다른 데이터간의 상호관계 속에서 가치를 갖는 것

  나. 데이터의 특성

    - 존재적 특성 : 객관적 사실

    - 당위적 특성 : 추론, 예측, 전망, 추정을 위한 근거

 2. 데이터의 유형

   - 정성적 데이터 : 언어, 문자 등 / 분석 등의 많은 비용

   - 정량적 데이터 : 수치, 기호 등 / 정형화로 인해 적은 비용

 3. 지식경영의 핵심 이슈

   - 암묵지 : 경험을 통해 개인이 얻은 지식 / 자전거 타기 / 공통화, 내면화

   - 형식지 : 문서나 매뉴얼 같은 형상화된 지식 / 교과서 / 표출화, 연결화

 4. 데이터와 정보의 관계

  가. DIKW

   - Data(데이터) : 자체로는 의미가 중요하지 않은 객관적인 사실

   - Information(정보) : 데이터를 가공하여 처리된 데이터에 관계 속에서 의미 도출

   - Knowledge(지식) : 정보를 통해 예측한 결과물

   - Wisdom(지혜) : 지식을 바탕으로 도출되는 창의적 아이디어

2) 데이터베이스 정의와 특징

 1. 용어의 역사

   - 1950년대 : 미군에서 컴퓨터 도서관을 설립하면서 데이터의 기지(base)라는 뜻으로 '데이터베이스' 탄생
   - 1963년 6월 : 미국'SDC'가 개최한 심포지엄에서 '대량의 데이터를 축적하는 기지'라는 개념의 용어 공식사용
   - 1963년 : GE의 C.바크만은 데이터베이스 관리시스템인 IDS 개발
   - 1965년 : 2차 심포지엄에서 체계적인 관리, 저장 등을 의미를 담은 '데이터베이스 시스템'이라는 용어 등장
   - 1970년대 초반 : 유렵에서 '데이터베이스 '라는 단일어가 일반화
   - 1975년 :  미국의 CAC가 KORSTIC을 통해 서비스 되면서 우리나라에 유입
   - 1980년 : KORSTIC이 해외 전문 데이터베이스를 확충하여 'TECHNOLINE'이라는 온라인 정보 검색 서비스를 개사하여 본격적인 데이터베이스 서비스 시대를 시작
   - 1980년대 중반 : 국내의 데이터베이스 기술의 연구, 개발

 2. 데이터베이스의 정의

   - 1차개념확대 : 정형데이터 관리

   - 2차개념확대 : 빅데이터의 출현, 비정형데이터

 3. 데이터베이스의 특징

   - 통합된 데이터(integrated data) : 통합하여 중복이 없는 데이터

   - 저장된 데이터(stored data) : 저장 매체(자기 디스크, 자기 테이프 등)에 저장된 것을 의미

   - 공용 데이터(shared data) : 여러 사용자가 데이터를 공동으로 이용

   - 변화되는 데이터(changable data) : 삽입, 삭제, 갱신으로 항상 데이터가 변화함, 현재의 데이터를 유지해야함

3) 데이터베이스의 활용

 1. 기업내부 데이터베이스

   가. 1980년대

      - OLTP(On-Line Transaction Processing) : 호스트 컴퓨터가 데이터베이스를 액세스하여 데이터 처리 / 재고관리시스템 등

      - OLAP(On-Line Analytical Processing) : 정보를 분석하여 의사 결정에 활용할 수 있는 정보를 얻는 기술 / 구매성향, 판매 추이 등

   나. 2000년대

      - CRM(Customer Relationship Management) : '고객관계관리'-고객과 관련되 정보를 활용하여 마케팅 전략을 개발

      - SCM(Supply Chain Management) : '공급망 관리'-생산,유통 과정을 업체간에 공유하여 이익 극대화

   다. 분야별 내부 데이터베이스

     - 제조부문

       1) ERP(Enterprise Resource Plannig) : 인사, 회계, 생상 등 경영자원을 하나로 통합하요 구축한 시스템

       2) BI(Business Intelligence) : 기업의 보유 데이터를 분석하여 의사결정에 활용하는 프로세스

       3) CRM(Customer Relationship Management) : '고객관계관리'-고객과 관련되 정보를 활용하여 마케팅 전략을 개발

       4) RTE(Real-Time Enterprise) : ERP, CRM등의 정보를 하나로 통합

     - 금융부문

       1) EAI(Enterprise Application Integration) : 기업 내의 모든 정보를 중앙 집중적으로 통합, 관리, 사용 할수 있는 인프라
       2) EDW(Enterprise Data Warehouse) : DW의 확장 개념으로 분석 애플리케이션을 위한 원천

     - 유통부문

       1) KMS(Knowledge Management System) : 지식관리시스템-지적재산의 중요성이 커짐에 따라 중요도가 높아짐

       2) RFID(Radio Frequency ID) : 주파수를 이용하여 식별하는 시스템(RFID칩을 활용)

   라. 사회기반구조로서의 데이터베이스

     - EDI(Electronic Data Interchange) : 주문서, 청구서 등 무역에 필요한 서류를 표준화하여 전산화한 시스템

     - VAN(Value Added NetWork) : 부가가치통신망, 독자적인 네트워크를 형성한 것(전기 등)

     - CALS(Commerce At Light Speed) : 전자상거래 구축시간을 단축하기 위해 전반적인 데이터를 통합하고 공유, 교환할 수 있는 시스템

728x90
반응형

댓글