본문 바로가기
빅데이터/ADsP

[ADsP] (1과목) 2.데이터의 가치와 미래

by 백곰IT 2020. 4. 15.
728x90

* 교재 : ADsP 데이터 분석 준전문가 2019 전면개정판-윤종식 (https://book.naver.com/bookdb/book_detail.nhn?bid=14451061)

* 위 도서를 근거로 작성한 글임을 밝힙니다 :)

1) 빅데이터의 이해

 1. 빅데이터의 이해

   - 빅데이터란 3V의 개념을 가지고 있으면서 데이터의 분석기술 및 분석인재 등을 포함한 것

    *3V란?

     양(Volume), 형태(Variety), 속도(Velocity)를 말한다.

      - 양(Volume) : 데이터의 규모

      - 형태(Variety) : 데이터의 종류

      - 속도(Velocity) : 데이터의 분석 속도

     - 빅데이터의 범주 : 데이터의 변화 - 기술 변화 - 인재, 조직 변화

2. 출현배경

   - 산업계 : 축적된 데이터의 가치 발견

   - 학계 : 데이터를 기반으로 과학 학산, 통계 도구의 발전

   - 기술발전 : 저장매체, 인터넷 등의 발전

3. 빅데이터의 기능

   - 빅데이터를 비유 : 산업혁명의 석탄 / 원유 등의 역할을 할 것

4. 본질의 변화

   - 사전처리 -> 사후처리 : 필요한 정보만 수집에서 모든 정보 수집 후 분석으로 변화

   - 표본조사 -> 전수조사 : 일부 표본으로 조사에서 모든 데이터를 기반으로 조사

   - 질 -> 양 : 일부의 정확한 정보로 분석에서 많은 데이터를 기반으로 변화

   - 인과관계 -> 상관관계 : 특정 기준에서 결과를 도출에서 상호간의 연관성으로 결과 도출

 

2) 빅데이터의 가치와 영향

 1. 빅데이터의 가치

   - 가치 선정이 어려움

    1) 데이터의 활용 목적에 따라 가치가 변화

    2) 새로운 가치를 창출한 데이터로 가치를 판단하기 힘듦

    3) 현재는 가치가 없는 데이터가 새로운 분석기술로 인해 가치 창출 가능성이 있음

 2. 빅데이터의 영향 및 활용

   - 기업 : 소비자들의 상향을 분석하여 생상성향상, 경쟁력 강화를 함

     ex) 구글의 검색로그를 활용한 검색엔진

   - 정부 : 기상, 인구이동 등의 데이터를 분석하여 환경, 편의성을 제공

     ex) 교통관련 서비스, 기상정보 등을 제공

   - 개인 : 빅데이터 서비스을 개인적인 목적에 활용

     ex) 공연순서, 정치 유세지역 등

  3. 빅데이터 활용 기술

    1) 연관규칙 : A제품 구매자가 B제품도 구매할 것인가?

    2) 유형분석 : 구매자의 성향에 맞는 집단으로 구분

    3) 유전자 알고리즘 : 어떤 시기에 어떤 상품을 팔까?(최적화)

    4) 기계학습 : 기존의 구매 성향으로 다른 제품 추천(추천알고리즘)

    5) 회귀분석 : 특정 요소가 다른 요소에 미치는 영향

    6) 감정분석 : 리뷰 등의 글에서 감정정보 추출

    7) 소셜네트워크 : 고객들간의 관계

 

3) 빅데이터의 위기 요인과 통제 방안

1. 빅데이터의 위기 요인 및 통제 방안

 가. 위기

   - 사생활 침해 : 여행사진을 인터넷에 올려 강도의 타겟이 됨

   - 책임 원칙 훼손 : 빅데이터의 예측으로 일어나지 않은 일에 대한 피해를 받을 수 있음

   - 데이터 오용 : 잘못된 데이터를 근거로 예측

 나. 통제 방안

   - 개인정보 제공자 동의 -> 개인정보 사용자 책임 

   - 예측 결과를 근거로한 판단에 대한 책임

   - 분석 및 예측 방법 공개

728x90
반응형

댓글