* 교재 : ADsP 데이터 분석 준전문가 2019 전면개정판-윤종식 (https://book.naver.com/bookdb/book_detail.nhn?bid=14451061)
* 위 도서를 근거로 작성한 글임을 밝힙니다 :)
1) 데이터와 정보
1. 데이터의 정의와 특성
가. 데이터의 정의
- 1646년 영국 문헌에 처음 등장, 라틴어 dare(주다)의 과거분사형으로 '주어진 것' 이란 의미
- 기술의 발전으로 데이터의 의미는 추상적인 개념에서 기술적이고 사실적인 의미로 변화
- 추론과 추정의 근거를 이루는 사실
- 다른 데이터간의 상호관계 속에서 가치를 갖는 것
나. 데이터의 특성
- 존재적 특성 : 객관적 사실
- 당위적 특성 : 추론, 예측, 전망, 추정을 위한 근거
2. 데이터의 유형
- 정성적 데이터 : 언어, 문자 등 / 분석 등의 많은 비용
- 정량적 데이터 : 수치, 기호 등 / 정형화로 인해 적은 비용
3. 지식경영의 핵심 이슈
- 암묵지 : 경험을 통해 개인이 얻은 지식 / 자전거 타기 / 공통화, 내면화
- 형식지 : 문서나 매뉴얼 같은 형상화된 지식 / 교과서 / 표출화, 연결화
4. 데이터와 정보의 관계
가. DIKW
- Data(데이터) : 자체로는 의미가 중요하지 않은 객관적인 사실
- Information(정보) : 데이터를 가공하여 처리된 데이터에 관계 속에서 의미 도출
- Knowledge(지식) : 정보를 통해 예측한 결과물
- Wisdom(지혜) : 지식을 바탕으로 도출되는 창의적 아이디어
2) 데이터베이스 정의와 특징
1. 용어의 역사
- 1950년대 : 미군에서 컴퓨터 도서관을 설립하면서 데이터의 기지(base)라는 뜻으로 '데이터베이스' 탄생
- 1963년 6월 : 미국'SDC'가 개최한 심포지엄에서 '대량의 데이터를 축적하는 기지'라는 개념의 용어 공식사용
- 1963년 : GE의 C.바크만은 데이터베이스 관리시스템인 IDS 개발
- 1965년 : 2차 심포지엄에서 체계적인 관리, 저장 등을 의미를 담은 '데이터베이스 시스템'이라는 용어 등장
- 1970년대 초반 : 유렵에서 '데이터베이스 '라는 단일어가 일반화
- 1975년 : 미국의 CAC가 KORSTIC을 통해 서비스 되면서 우리나라에 유입
- 1980년 : KORSTIC이 해외 전문 데이터베이스를 확충하여 'TECHNOLINE'이라는 온라인 정보 검색 서비스를 개사하여 본격적인 데이터베이스 서비스 시대를 시작
- 1980년대 중반 : 국내의 데이터베이스 기술의 연구, 개발
2. 데이터베이스의 정의
- 1차개념확대 : 정형데이터 관리
- 2차개념확대 : 빅데이터의 출현, 비정형데이터
3. 데이터베이스의 특징
- 통합된 데이터(integrated data) : 통합하여 중복이 없는 데이터
- 저장된 데이터(stored data) : 저장 매체(자기 디스크, 자기 테이프 등)에 저장된 것을 의미
- 공용 데이터(shared data) : 여러 사용자가 데이터를 공동으로 이용
- 변화되는 데이터(changable data) : 삽입, 삭제, 갱신으로 항상 데이터가 변화함, 현재의 데이터를 유지해야함
3) 데이터베이스의 활용
1. 기업내부 데이터베이스
가. 1980년대
- OLTP(On-Line Transaction Processing) : 호스트 컴퓨터가 데이터베이스를 액세스하여 데이터 처리 / 재고관리시스템 등
- OLAP(On-Line Analytical Processing) : 정보를 분석하여 의사 결정에 활용할 수 있는 정보를 얻는 기술 / 구매성향, 판매 추이 등
나. 2000년대
- CRM(Customer Relationship Management) : '고객관계관리'-고객과 관련되 정보를 활용하여 마케팅 전략을 개발
- SCM(Supply Chain Management) : '공급망 관리'-생산,유통 과정을 업체간에 공유하여 이익 극대화
다. 분야별 내부 데이터베이스
- 제조부문
1) ERP(Enterprise Resource Plannig) : 인사, 회계, 생상 등 경영자원을 하나로 통합하요 구축한 시스템
2) BI(Business Intelligence) : 기업의 보유 데이터를 분석하여 의사결정에 활용하는 프로세스
3) CRM(Customer Relationship Management) : '고객관계관리'-고객과 관련되 정보를 활용하여 마케팅 전략을 개발
4) RTE(Real-Time Enterprise) : ERP, CRM등의 정보를 하나로 통합
- 금융부문
1) EAI(Enterprise Application Integration) : 기업 내의 모든 정보를 중앙 집중적으로 통합, 관리, 사용 할수 있는 인프라
2) EDW(Enterprise Data Warehouse) : DW의 확장 개념으로 분석 애플리케이션을 위한 원천
- 유통부문
1) KMS(Knowledge Management System) : 지식관리시스템-지적재산의 중요성이 커짐에 따라 중요도가 높아짐
2) RFID(Radio Frequency ID) : 주파수를 이용하여 식별하는 시스템(RFID칩을 활용)
라. 사회기반구조로서의 데이터베이스
- EDI(Electronic Data Interchange) : 주문서, 청구서 등 무역에 필요한 서류를 표준화하여 전산화한 시스템
- VAN(Value Added NetWork) : 부가가치통신망, 독자적인 네트워크를 형성한 것(전기 등)
- CALS(Commerce At Light Speed) : 전자상거래 구축시간을 단축하기 위해 전반적인 데이터를 통합하고 공유, 교환할 수 있는 시스템
'빅데이터 > ADsP' 카테고리의 다른 글
[ADsP] (2과목) 1.2.분석 방법론 (0) | 2020.05.02 |
---|---|
[ADsP] (2과목) 1.1.분석기획 방향성 도출 (0) | 2020.04.30 |
[ADsP] (1과목) 3.가치 창조를 위한 데이터 사이언스와 전략 인사이트 (0) | 2020.04.19 |
[ADsP] (1과목) 2.데이터의 가치와 미래 (0) | 2020.04.15 |
[ADsP] ADsP(데이터 분석 준전문가) 자격검정 안내 (0) | 2020.04.10 |
댓글