1-1. 데이터분석 이란?

2023. 3. 12. 18:58혼자 공부하는 데이터 분석 정리

1. 데이터 분석과 데이터 과학

    1.1. 데이터 분석 : 유용한 정보를 발견하고 결론을 유추하거나, 의사 결정을 돕기 위해 데이터를 조사, 정제, 변환, 모델        링하는 과정

    1.2. 데이터 과학 : 통계학, 데이터분석, 머신러닝, 데이터 마이닝 등을 아우르는 큰 개념

 

     1.3. 데이터분석과 데이터 과학 : 데이터 분석은 올바른 의사 결정을 돕기 위한 통찰을 제공하는데 초점을 맞추고, 데이터 과학은 한걸음 더 나아가 문제 해결을위한 최선의 솔루션을 만드는 데 초점을 맞춤 

특징 데이터 분석 데이터 과학
범주 비교적 소규모 대규모
목표 의사 결정을 돕기 위한 통찰을 제공하는 일  문제해결을 위해 최선의 솔루션을 만드는 일
주요 기술 컴퓨터 과학, 통계학, 시각화 등 컴퓨터 과학, 통계학, 머신러닝, 인공지능 등
빅데이터 사용 사용

    1.4. 데이터 분석 나누기 : 데이터 분석은 통계적 관점에서 봤을때, 기술통계, 탐색적 데이터 분석, 가설검정 으로 나눌 수   있다.

  • 기술통계 : 관측이나 실험을 통해 수집한 데이터를 정량화하거나 요약하는 기법, ex)평균 계산, 최솟값, 최댓값 찾기
  • 탐색적 데이터 분석(EDA): 데이터를 시각적으로 표현하여 주요 특징을 찾고 분석하는 방법
  • 가설검정 : 주어진 데이터를 기반으로 특정 가정이 합당한지 평가하는 통계 방법

    1.5. 데이터 분석가 

    데이터 분석가의 필요 역량

데이터 분석가의 작업 과정은 데이터 수집, 데이터 처리, 데이터 정제, 데이터 분석, 모델링까지 포함된다. 좁은 의미로는기술통계. 탐색적 데이터 분석, 가설검정 등을 넓은 의미 
로는 데이터 수집부터 모델링까지를 말한다.