목록AI_STUDY (56)
ㅅㅇ
플레이데이터 빅데이터캠프 공부 내용 _ 6/7 Pandas _ 02-1 DataFrame 개요 & 생성 및 저장 1. DataFrame 개요 - 표(테이블-행렬) - 정형데이터를 다루는 Pandas 클래스 - 데이터베이스의 Table이나 R의 data.frame이나 Excel의 표 와 동일한 역할 - 분석할 데이터를 가지는 판다스의 가장 핵심적인 클래스 - 행 이름: index 열 이름: column - 행이름과 열이름은 명시적으로 지정할 수 있다. - 명시적으로 지정하지 않으면 순번 (0부터 1씩 증가) 이 index, column 명으로 사용된다. - 직접 데이터를 넣어 생성하거나, 데이터 셋을 파일(csv, 엑셀, DB 등)로 부터 읽어와 생성한다. - 하나의 행과 하나의 열은 Series로 구성된..
플레이데이터 빅데이터캠프 공부 내용 _ 6/7 Pandas_01-2 Series 주요 메소드, 속성 - Date(series 객체)를 처리(연산자,메소드) - Series객체의 속성과 메소드 1. 주요 기본 메소드, 속성 (1) .head(), .tail() - 앞 뒤의 일부 데이터만 조회 - default 값 = 앞, 뒤 5개의 원소 - 괄호 안 값 = 개수를 명시 - tail() 한다고 뒤 원소부터 정렬해서 반환하는 것 아님. (9,10,11,12,13 이런 식으로 순서대로) s1.head() # 앞의 5개 원소 s1.head(2) # 개수를 명시 s1.tail() # 뒤의 5개 원소 s1.tail(7) # 뒤의 7새 원소 (2) .value_counts() - 각각의 범주값들이 몇 개씩 있는 지 조..
플레이데이터 빅데이터캠프 공부 내용 _ 6/3 Python _DB : pymysql을 이용해 mysql 연동 1. pymysql : 파이썬에서 MySQL, MariaDB DBMS와 연동하는 다양한 함수를 제공하는 모듈 - Python DB API 2.0 표준을 따른다. db 마다 연결하는(전송하는) 방식이 다르다. 그러나, 연결한다라는 것은 즉, 하는 일은 동일하다. 이는 Python [DB API 2.0] 표준에 따르기 때문이다. 그렇기에, 모듈과 CONNECT 내 구문 등 달라질 수 도 있지만(DB연결방법에는 차이가 있으니), CONNECT, CURSOR, CLOSE ... 등 이는 표준에 따르기에 모든 DBMS 공통이다. - 오라클용 py 라이브러리는 xOracle. 이걸 다운받아 사용해야 하지만 ..
플레이데이터 빅데이터캠프 공부 내용 _ 6/3, 6/7 Pandas_01-1 pandas 개요, Series 생성 및 접근 1. 판다스(Pandas) - 데이터 분석과 관련된 다양한 기능을 제공하는 파이썬 패키지 - 데이터 셋을 이용한 다양한 통계 처리 기능을 제공한다. - 표 형태의 데이터를 다루는데 특화된 파이썬 모듈. - 엑셀의 기능을 제공하는 파이썬 모듈이라고 생각하면 이해가 쉽다. - 표 형태의 데이터를 다루기 위한 시리즈(Series)와 데이터프레임(DataFrame) 클래스 제공 (1) Series : 1차원 자료구조를 표현 (2) DataFrame : 행렬의 표를 표현 [설치법] - `pip install pandas` - `conda instll pandas` - 아나콘다에는 미리 ins..
pandas로 데이터를 탐색, 분석하고 시각화툴(matplotlib, seabone)로 시각화한다. 1. PANDAS 란? 우리는 데이터 처리에서 정형데이터(표형태데이터)를 분석하여 알고 싶은 값을 찾는 과정을 하고 싶을 것이다. 이를 위한 대표적인 툴 패키지가 pandas이다. 참고로 이는 통계가 주목적은 아니다.(통계용 툴은 따로 있다.) 판다스도 사실 넘파이 기반이다. 총 세가지의 데이터 구조를 사용한다. 시리즈(Series) 데이터프레임(DataFrame) 패널(Panel) pip install pandas - 시각화tool에는 matplotlib, seabone 등이 있다. 2. 시각화 tool _ matplotlib 이란? 데이터를 차트(chart)나 플롯(plot)으로 시각화하는 패키지이다...