목록전체 글 (110)
ㅅㅇ
플레이데이터 빅데이터캠프 공부 내용 _ 7/11 딥러닝 _02_첫번째 딥러닝- MLP 구현 MLP(Multi Layer Perceptron) - 가장 기본적인 딥러닝모델의 구조 - dense layer 로만 이뤄진 모델 구조 1. Keras 개발 Process 1. 입력 텐서(X)와 출력 텐서(y)로 이뤄진 훈련 데이터를 정의 2. 입력과 출력을 연결하는 Layer(층)으로 이뤄진 네트워크(모델) 구조를 을 정의 (딥러닝은 머신러닝과 달리 모델 구조는 우리가 설정해야 한다.) - Sequential 방식: 순서대로 쌓아올린 네트워크로 이뤄진 모델을 생성하는 방식 - Functional API 방식: 다양한 구조의 네트워크로 이뤄진 모델을 생성하는 방식 - Subclass 방식: 네트워크를 정의하는 클래스..
플레이데이터 빅데이터캠프 공부 내용 _ 7/11 딥러닝 _ 01_ 개요 및 Tensorflow 설치 1. 개요 인공지능 (AI - Artificial Intelligence) - 지능: 어떤 문제를 해결하기 위한 지적 활동 능력 - 인공지능 - 기계가 사람의 지능을 모방하게 하는 기술 - 규칙기반, 데이터 학습 기반 머신러닝(Machine Learning) - 데이터 학습 기반의 인공 지능 분야 - 기계에게 어떻게 동작할지 일일이 코드로 명시하지 않고 데이터를 이용해 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 인공지능의 한분야 딥러닝 (Deep Learning) - 인공신경망을 기반으로 하는 머신러닝의 한 분야. - '비정형의 대용량' 데이터 학습에 뛰어난 성능을 나타낸다. - 식별 가능한 구조나..
1. 재귀함수란 메소드 혹은 함수의 내부에서 자신의 메소드 혹은 함수를 다시 호출하여 작업을 수행하는 방식의 함수를 의미. 다른 말로는 재귀호출, 되부름이라고 부르기도 한다. 2. 재귀함수의 원리 재귀 함수를 작성할 때는 함수 내에서 다시 자신을 호출한 후 그 함수가 끝날 때까지 함수 호출 이후의 명령문이 수행되지 않는다는 사실과 종료 조건이 꼭 포함되어야 한다. = = > 조건문을 활용하여 재귀함수 종료 조건을 삽입해야 함. 3. 재귀함수 사용 이유 코드의 간결화 및 변수 사용 최소화 4. 예시 문제 - 재귀함수를 활용한 완전탐색 data = [3, 5, 8] 에서 성분들의 합을 표현할 수 있는 경우의 가지수는? data = [3,5,8] def recur(index, value): if index =..
플레이데이터 빅데이터캠프 공부 내용 _ 7/5 머신러닝 _ 07_ 지도학습 _ 최근접이웃 1. K-최근접 이웃 (K-Nearest Neighbors, KNN) : 예측하려는 데이터와 input 데이터들 간의 거리를 측정해 가장 가까운 K개의 데이터셋의 레이블을 참조해 분류/예측한다. - 분류(Classification)와 회귀(Regression) 를 모두 지원한다. 1) 학습시 단순히 input 데이터(train)들을 저장만 하며, - 학습 할 게 없다. 단순히 저장만 하면 된다. 2) 예측 시점에 거리를 계산한다. 이때 들어온 새로운 데이터셋과 학습 데이터 간의 거리를 계산하는 것 - 학습은 빠르지만, 예측시 시간이 많이 걸린다. 2. 분류 문제 에서의 KNN 예측 예시 설명 - 물음표는 무엇인지 추..
플레이데이터 빅데이터캠프 공부 내용 _ 7/5 머신러닝 _ 06_2_파이프라인 1.파이프라인 (Pipeline) 개요 : 여러 단계의 머신러닝 프로세스 (전처리의 각 단계, 모델생성, 학습) 처리 과정을 설정하여 한번에 처리되도록 한다. : 데이터에 포커스를 맞춰 따로 해줘야 하는 여러 개의 흐름을 묶어주는 것. 데이터가 흘러가는 흐름에다가 여러 처리를 한 번에 하는데 이때, 각 단계의 결과를 제대로 넘겨주는 게 중요하다. - 파이프라인은 여러개의 변환기와 마지막에 변환기 또는 추정기를 넣을 수 있다. - 추정기-Estimator는 마지막에만 올 수 있다. 1) 전처리 작업 파이프라인 - 변환기들로만 구성 2) 전체 프로세스 파이프 라인 - 변환기와 마지막에 추정기를 넣는다. 2. Pipeline 생성 ..
플레이데이터 빅데이터캠프 공부 내용 _ 7/4 머신러닝 _ 06_1_과적합 일반화와 그리드 서치 1. 일반화, 과적합 1) Generalization (일반화) - 모델이 새로운 데이터셋(테스트 데이터)에 대하여 정확히 예측하면 이것을 (훈련데이터에서 테스트데이터로) 일반화 되었다고 말한다. - 모델이 훈련 데이터로 평가한 결과와 테스트 데이터로 평가한 결과의 차이가 거의 없고 좋은 평가지표를 보여준다. 2) Overfitting (과대적합) - 모델이 훈련 데이터에 대한 예측성능은 너무 좋지만 일반성이 떨어져 새로운 데이터(테스트 데이터)에 대해선 성능이 좋지 않은 것을 Overfitting이라고 한다. - 이는 모델이 훈련 데이터 세트의 특징을 너무 맞춰서 학습 되었기 때문에 일반화 되지 않아 (필요..