목록AI_STUDY (56)
ㅅㅇ
플레이데이터 빅데이터캠프 공부 내용 _ 6/9 Pandas_03_2 집계 1. 기술통계메소드들을 이용한 데이터 집계 - DataFrame 에 위의 기술 통계 메소드를 적용할 경우 컬럼별로 계산 -> Series 반환 - sum(), mode(), max(), min(), unique(), nunique(), count()는 문자열에 적용가능 - 문자열에서 mode(), unique(), numique(), count()는 중요하지만, - sum() 은 문자열 적용 되지만 무쓸모. - max(), min() 유니코드 기준으로 큰,작은 값 반환한다. - idxmax(), idxmin() 는 문자열 컬럼에 사용할 수 없다. - 큰 , 작은 값을 가진 index를 알고 싶다면, numpy 에서 np.argmax..
플레이데이터 빅데이터캠프 공부 내용 _ 6/9 Pandas_03_1 정렬 1. 정렬 _ index명 / 컬럼명 을 순 정렬 현재 DF의 값이 기준이 아니라, index 와 컬럼 자체를 이름(유니코드)로 정렬하는 것. sort_index(axis, ascending=True) - axis - index명 기준 정렬(행) : 'index' 또는 0 (기본값) - columnm 명 기준 정렬(열) : 'columns' 또는 1 - 컬럼명이 정렬됨. 거의 안 함. - ascending - 정렬방식 - True(기본): 오름차순, False: 내림차순 - inplace - 원본에 적용 여부 - False(기본): 변경한 복사본 반환 - True : 원본을 변경 - 인덱스명 정렬 : 거의 이 용도. # (defau..
플레이데이터 빅데이터캠프 공부 내용 _ 6/8 Pandas_02-4 DataFrame 접근 _ 컬럼/행의 값 조회 및 변경 1. 열 (컬럼) 조회 _ 방법 1 ) 대괄호 (1) df [ '컬럼명' ] # 열 순번 안됨. 슬라이싱도 안됨. - > 하면 인덱스 순번으로 인식한다. : 한 컬럼(열) 조회. => series 로 반환. 결과의 index명 = DF 행 index명 # 1. 한 컬럼(열)을 조회할 경우 series 로 반환. grade['국어'] - > Series로 반환 # series의 index명(각각의 값의 키로)으로 DF의 index명이 온다. # Name : 국어 => 국어 컬럼 조회한 결과야. ID id-1 100.0 id-2 50.0 id-3 NaN id-4 90.0 id-5 85...
플레이데이터 빅데이터캠프 공부 내용 _ 6/8 Pandas_02-3 DataFrame 접근 _ 컬럼/행 조회 및 변경 1. 데이터 프레임의 기본 정보 조회 데이터 조회 시 루틴. 베이직하게 함. - csv 파일 읽기 - shape - info() - head() - tail() - isnull().sum() => 컬럼별 null 체크 ( .sum() 한번더 하면 총개수 ) - describe() : 숫자형-기술통계값, 문자열-총개수, 유니크값, 최빈값 - index / columns : index와, 컬럼명 조회. columns = df.colums indexer로 반환 (리스트처럼 인덱싱, 슬라이싱 가능하다. => 변수에 담아두고 순번으로 접근가능) 아래 쳅터에서 자세히. import pandas as..
플레이데이터 빅데이터캠프 공부 내용 _ 6/8 Pandas_01-2 Series 주요 메소드, 속성 1. 주요 기본 메소드, 속성 (1) .T : 행/열을 바꾼다. (1,1), (2,2) .... 은 안 바뀌고 (1,0)은 (0,1) , (0,1)은 (1,0) ... grade.T - 테이블프레임 조회 시 컬럼이 너무 많을 때 이를 행으로 바꿔서 보거나 한다. (2) .head() : 상위 .tail() : 하위 (기본값:5) # 기본값 - 상위 5개 movie_df.head(7) # 기본값 - 하위 5개 movie_df.tail(2) (3) .shape : axis(순번의 방향)별 데이터 수 튜플로 반환 => (행수, 열수) : 0축, 1축 movie_df.shape (4916, 28) (4) .siz..