본문 바로가기
Python/영화 데이터 분석

한국 영화 데이터 분석 (2) : 탐색적 자료 분석(EDA)과 상관 시각화 Google Colab Python

by 춘춘주모 2020. 7. 24.
반응형

 지난 시간엔 엑셀로 전 처리하고 코랩에 데이터를 불러오는 데 까지 실행했습니다. 이번 포스팅에서는 불러온 데이터의 형태와 기초 통계치를 출력한 후 상관관계 히트맵을 시각화까지 진행하겠습니다. 

 

1. EDA 

  • 데이터 불러오기 

  • 기초통계치 출력 

개수, 평균, 표준편차, 최댓값, 최솟값, 각 분 위수의 통계치를 확인하며 데이터의 분포를 개략적으로 파악 가능. 

  • 데이터의 자료형 출력 

데이터의 자료형을 출력하여 기대하지 않은 자료형이 존재하는지 확인했다.

2. 상관 시각화 

상관 관계 시각화를 통해 변수간 상관을 알아보았다. 

 그 전에 seaborn 패키지를 불러와야 한다, data만 지정해주면 다음과 같이 있어 보이는(?) 시각화가 가능하다.

 

반응형

댓글