목록AI_STUDY/데이터 분석 (2)
ㅅㅇ
# 어떤 컬럼이 있을 때, 고유값의 개수를 확인하고 싶을 때 - > s.count() # 어떤 컬럼이 있을 때 , 결측치의 개수를 확인하고 싶을 때 - > s.isnull().sum() # 어떤 데이터프레임 컬럼 별, 결측치의 개수를 확인하고 싶을 때 - > df.isnull().sum() : 컬럼별 결측치 개수를 series로 # 어떤 범주형 컬럼이 있을 때, 가장 많은 빈도를 차지 하는 것.- > s6.mode() : series로 반환 # 어떤 범주형 컬럼이 있을 때, 범주 별 갯수 -> value.counts() # 어떤 범주형 컬럼이 있을 때, 범주 별 비율 -> value.counts(normalize = True) # 어떤 범주형 컬럼이 있을 때, 기술통계량 - > s.describe(inc..
pandas로 데이터를 탐색, 분석하고 시각화툴(matplotlib, seabone)로 시각화한다. 1. PANDAS 란? 우리는 데이터 처리에서 정형데이터(표형태데이터)를 분석하여 알고 싶은 값을 찾는 과정을 하고 싶을 것이다. 이를 위한 대표적인 툴 패키지가 pandas이다. 참고로 이는 통계가 주목적은 아니다.(통계용 툴은 따로 있다.) 판다스도 사실 넘파이 기반이다. 총 세가지의 데이터 구조를 사용한다. 시리즈(Series) 데이터프레임(DataFrame) 패널(Panel) pip install pandas - 시각화tool에는 matplotlib, seabone 등이 있다. 2. 시각화 tool _ matplotlib 이란? 데이터를 차트(chart)나 플롯(plot)으로 시각화하는 패키지이다...