본문 바로가기

데이터/데이터 분석 공부

[데이터 분석] 데이터의 이해

 

  데이터의 유형

정성적 데이터: 저장,검색,분석에 많은 비용이 소모 되는 언어, 문자 형태의 데이터

정량적 데이터:  정형화된 데이터로 수치, 도형, 기호 등의 형태를 가진 데이

 

  DIKW 피라미드

DIKW 피라미드

 

 

  데이터베이스 특징

- Integrated data (통합된 데이터) : 동일한 내용의 데이터가 중복되어 있지 않음.

- Stored data (저장된 데이터) : 데이터베이스는 컴퓨터가 접근할 수 있는 저장 매체에 저장되어 있음. 

- Shared data (공용 데이터) : 여러 사용자가 다른 목적으로 데이터를 공동으로 이용함. 대용량화되고 구조가 복잡함.

- Changable data (변화되는 데이터) : 데이터베이스는 새로운 데이터의 삽입, 기존 데이터의 삭제 및 갱신으로 항상 변화하면서도 항상 현재의 정확한 데이터를 유지하도록 함. 

 

  빅데이터의 정의

규모(Volume) - 데이터의 규모 측면

형태(Variety) - 데이터의 유형과 소스 측면

속도(Velocity) - 데이터의 수집과 처리 측면

 

  데이터 사이언스의 영역

- Analytics: 분석적 영역

- IT: 데이터 처리와 관련된 IT영역

- Business analysis: 비즈니스 컨설팅 영역

 

  빅데이터 회의론을 넘어 가치 패러다임의 변화

 

과거 | 현재 | 미래

Digitalization ==> Connection ==> Agency 

 

 

  데이터 분석 대상과 방법

- 분석의 대상(what)과 분석의 방법(how)에 따라 4가지로 분류

 

  분석의 대상 (What)
Known Unknown
분석의 방법 (How) Known Optimization Insight
Unknown Solution Discovery

 

 

 

  목표 시점별 데이터 분석기획 방안

  당면한 분석 주제의 해결
(과제 단위)
지속적 분석 문화 내제회
(마스터 플랜 단위)
1차 목표 Speed & Test Accuracy & Deploy
과제의 유형 Quick - Win Long Term View
접근방식 Problem Solving Problem Definition

 

 

 

 

 

 

 

참고 자료
관련 포스팅

[데이터] 데이터 분석 전문가 가이드(ADP/ADsP) 내용 정리 (In Progress)  [IVORY STUDY:티스토리]
책 정보

데이터 분석 전문가 가이드 ( ADP / ADsP )
- 한국데이터진흥원 저
- 책 정보: https://www.yes24.com/Product/Goods/29430751