목록AI_STUDY (56)
ㅅㅇ
플레이데이터 빅데이터캠프 공부 내용 _ 7/11 딥러닝 _02_첫번째 딥러닝- MLP 구현 MLP(Multi Layer Perceptron) - 가장 기본적인 딥러닝모델의 구조 - dense layer 로만 이뤄진 모델 구조 1. Keras 개발 Process 1. 입력 텐서(X)와 출력 텐서(y)로 이뤄진 훈련 데이터를 정의 2. 입력과 출력을 연결하는 Layer(층)으로 이뤄진 네트워크(모델) 구조를 을 정의 (딥러닝은 머신러닝과 달리 모델 구조는 우리가 설정해야 한다.) - Sequential 방식: 순서대로 쌓아올린 네트워크로 이뤄진 모델을 생성하는 방식 - Functional API 방식: 다양한 구조의 네트워크로 이뤄진 모델을 생성하는 방식 - Subclass 방식: 네트워크를 정의하는 클래스..
플레이데이터 빅데이터캠프 공부 내용 _ 7/11 딥러닝 _ 01_ 개요 및 Tensorflow 설치 1. 개요 인공지능 (AI - Artificial Intelligence) - 지능: 어떤 문제를 해결하기 위한 지적 활동 능력 - 인공지능 - 기계가 사람의 지능을 모방하게 하는 기술 - 규칙기반, 데이터 학습 기반 머신러닝(Machine Learning) - 데이터 학습 기반의 인공 지능 분야 - 기계에게 어떻게 동작할지 일일이 코드로 명시하지 않고 데이터를 이용해 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 인공지능의 한분야 딥러닝 (Deep Learning) - 인공신경망을 기반으로 하는 머신러닝의 한 분야. - '비정형의 대용량' 데이터 학습에 뛰어난 성능을 나타낸다. - 식별 가능한 구조나..
플레이데이터 빅데이터캠프 공부 내용 _ 7/5 머신러닝 _ 07_ 지도학습 _ 최근접이웃 1. K-최근접 이웃 (K-Nearest Neighbors, KNN) : 예측하려는 데이터와 input 데이터들 간의 거리를 측정해 가장 가까운 K개의 데이터셋의 레이블을 참조해 분류/예측한다. - 분류(Classification)와 회귀(Regression) 를 모두 지원한다. 1) 학습시 단순히 input 데이터(train)들을 저장만 하며, - 학습 할 게 없다. 단순히 저장만 하면 된다. 2) 예측 시점에 거리를 계산한다. 이때 들어온 새로운 데이터셋과 학습 데이터 간의 거리를 계산하는 것 - 학습은 빠르지만, 예측시 시간이 많이 걸린다. 2. 분류 문제 에서의 KNN 예측 예시 설명 - 물음표는 무엇인지 추..
플레이데이터 빅데이터캠프 공부 내용 _ 7/5 머신러닝 _ 06_2_파이프라인 1.파이프라인 (Pipeline) 개요 : 여러 단계의 머신러닝 프로세스 (전처리의 각 단계, 모델생성, 학습) 처리 과정을 설정하여 한번에 처리되도록 한다. : 데이터에 포커스를 맞춰 따로 해줘야 하는 여러 개의 흐름을 묶어주는 것. 데이터가 흘러가는 흐름에다가 여러 처리를 한 번에 하는데 이때, 각 단계의 결과를 제대로 넘겨주는 게 중요하다. - 파이프라인은 여러개의 변환기와 마지막에 변환기 또는 추정기를 넣을 수 있다. - 추정기-Estimator는 마지막에만 올 수 있다. 1) 전처리 작업 파이프라인 - 변환기들로만 구성 2) 전체 프로세스 파이프 라인 - 변환기와 마지막에 추정기를 넣는다. 2. Pipeline 생성 ..
플레이데이터 빅데이터캠프 공부 내용 _ 7/4 머신러닝 _ 06_1_과적합 일반화와 그리드 서치 1. 일반화, 과적합 1) Generalization (일반화) - 모델이 새로운 데이터셋(테스트 데이터)에 대하여 정확히 예측하면 이것을 (훈련데이터에서 테스트데이터로) 일반화 되었다고 말한다. - 모델이 훈련 데이터로 평가한 결과와 테스트 데이터로 평가한 결과의 차이가 거의 없고 좋은 평가지표를 보여준다. 2) Overfitting (과대적합) - 모델이 훈련 데이터에 대한 예측성능은 너무 좋지만 일반성이 떨어져 새로운 데이터(테스트 데이터)에 대해선 성능이 좋지 않은 것을 Overfitting이라고 한다. - 이는 모델이 훈련 데이터 세트의 특징을 너무 맞춰서 학습 되었기 때문에 일반화 되지 않아 (필요..