목록AI_STUDY (56)
ㅅㅇ

플레이데이터 빅데이터캠프 공부 내용 _ 6/16 Pandas_ 02_5 각종 그래프 그리기 _ 히스토그램 (histogram) 1. 히스토그램 - 표로 된 도수 분포표를 그래프로 나타낸 것. - 도수분포표: 특정 그룹안에 값의 빈도를 나타낸 표 - 주로 연속형 자료를 특정 구간으로 나눠 그 빈도를 확인한다. - 빈도 확인이나 분포를 볼때 사용한다. - 그래프 X축 : 계급(변수구간)의 대표값, Y축 : 빈도수 - hist( data [, bins = 계급개수] ) 메소드를 사용 - data: 리스트형의 객체를 전달한다. - bins : 동일한 간격으로 나눌 구간의 갯수 def : 10 - > 동일한 간격인 10개의 구간으로 나눈다. 크게 나눌수록 세분화하여 볼 수 있다. 2. 히스토그램 그리기 ** 지정..

플레이데이터 빅데이터캠프 공부 내용 _ 6/16 Pandas_ 02_4 각종 그래프 그리기 _ 파이차트 (Pie Chart) 1. 파이차트 Pie Chart - 각 범주(Category)가 데이터에서 차지하는 '비율' 을 나타내는데 사용 - pie(x, labels = 대상, ) - x : 값 (값들을 100을 기준으로 비율을 알아서 계산해 크기 설정) - labels : 값들의 label - 세번째 매개변수이기에 키워드 인자로 써주기 - autopct : 조각내에 표시될 비율의 문자열 형식. '%fmt문자' - fmt문자: f(실수), d(정수), %% (%) - 파이 차트를 좌표평면으로 생각했을 때, 가로인 수직선 x축에서 시작하여, x 에 넣어준 값들의 순서대로 배치된다. ** 넘파이 메소드를 이용..

플레이데이터 빅데이터캠프 공부 내용 _ 6/16 Pandas_ 02_3 각종 그래프 그리기 _ 막대그래프(Bar plot) 1. 막대그래프(Bar plot) - 수량을 막대 형식으로 나타낸 그래프 - 수량을 표현할 때 사용. (ex. 범주형컬럼의 value_counts() 각 범주별 수량 갯수 ) 1) 수직막대 : bar(x, height) 메소드 사용 - x: x값 - > 분류값(수량을 셀대상) - height: 막대 높이 - > 개수 수량 2) 수평막대 : barh(y, width) 메소드 - 1번인수 : y값 - > 분류값(수량을 셀 대상) - 2번인수: 막대 너비 - > 개수 수량 2. 막대그래프(Bar plot) 그리기 수직 .bar (대상 x, 수량 y, [width = 0~1] ) 수평 .b..

플레이데이터 빅데이터캠프 공부 내용 _ 6/15 Pandas_ 02_2 각종 그래프 그리기 _ 산점도 (Scatter Plot) 1. 산점도(산포도) - X와 Y축을 가지는 좌표평면상 관측값들을 점을 찍어 표시하는 그래프 - 변수(Feature)간의 상관성(상관관계. ex. x축에 따라 y축이 증가)이나, 관측값들 간의 군집 분류(ex. 두 개의 그룹으로 나눠, 뭉쳐져 있다.)를 확인할 수 있다. - cf) line plot는 값의 위치보다 시간, 순서 등 변화 흐름에 따른 값 보고 싶을 때. 목적이 아예 다르다. - scatter() 메소드 사용 x = np.arange(1,1000,50) y = np.arange(1,1000,50) plt.scatter(x,y) - 1번인수 : x값, 2번인수 y값 ..

플레이데이터 빅데이터캠프 공부 내용 _ 6/15 Pandas_ 02_1 각종 그래프 그리기 _ 선 그래프 (line Graph) Line Graph 선 그래프 (꺽은선 그래프) - 점과 점을 선으로 연결한 그래프 - 시간의 흐름에 따른 변화를 표현할 때 많이 사용한다. (시계열) cf ) 산점도는 순서 흐름을 시각적으로 파악할 수 없다. - plot([x], y) - 1번인수 : x값(생략가능), 2번인수 y값 - 인수가 하나인 경우 y 축의 값으로 설정되고 X값은 (0 ~ len(y)-1) 범위로 지정된다. - x,y 의 인수는 리스트 형태의 객체들을 넣는다. - 리스트 - 튜플 - numpy 배열 (ndarray) - 판다스 Series - x와 y의 size는 같아야 한다. - 하나의 axes(su..