반응형
지난 시간엔 엑셀로 전 처리하고 코랩에 데이터를 불러오는 데 까지 실행했습니다. 이번 포스팅에서는 불러온 데이터의 형태와 기초 통계치를 출력한 후 상관관계 히트맵을 시각화까지 진행하겠습니다.
1. EDA
- 데이터 불러오기
- 기초통계치 출력
개수, 평균, 표준편차, 최댓값, 최솟값, 각 분 위수의 통계치를 확인하며 데이터의 분포를 개략적으로 파악 가능.
- 데이터의 자료형 출력
데이터의 자료형을 출력하여 기대하지 않은 자료형이 존재하는지 확인했다.
2. 상관 시각화
상관 관계 시각화를 통해 변수간 상관을 알아보았다.
그 전에 seaborn 패키지를 불러와야 한다, data만 지정해주면 다음과 같이 있어 보이는(?) 시각화가 가능하다.
반응형
'Python > 영화 데이터 분석' 카테고리의 다른 글
한국 영화 데이터 분석 (1) : 데이터 수집과 불러오기 Google Colab Python (2) | 2019.12.23 |
---|
댓글