목록AI_STUDY/머신러닝 (13)
ㅅㅇ

플레이데이터 빅데이터캠프 공부 내용 _ 6/28 머신러닝 프로세스 중 데이터 셋 분리에 대해 배울 것이다. 머신러닝 _ 03_데이터셋 나누기와 교차검증 1. 데이터셋(Dataset) - Train 데이터셋 (훈련/학습 데이터셋) : 모델을 학습시킬 때 사용할 데이터셋. - Validation 데이터셋 (검증 데이터셋) : 모델의 성능 중간 검증을 위한 데이터셋. 성능을 높이는 작업에서 쓰이는 데이터 - Test 데이터셋 (평가 데이터셋) : 모델의 성능을 최종적으로 측정하기 위한 데이터셋 Test 데이터 셋은 마지막에 모델의 성능을 측정하는 용도로 한번만 사용되야 한다. = = > 데이터셋을 Train set, Validation set, Test set으로 나눈다. ★ 왜 우리는 데이터 셋을 Train..

플레이데이터 빅데이터캠프 공부 내용 _ 6/27 머신러닝 _ 02 머신러닝분석 - lris 분석 1. Iris DataSet 꽃받침(Sepal)과 꽃잎(Petal)의 길이, 너비 네가지 feature로 Setosa, Versicolor, Virginica 아이리스 세가지 품종 Label 을 분류 - 식물에 대한 전문가가 아닌 프로그래머가 꽃에 대한 규칙을 알기 어렵다. 사람이 직접 찾는 규칙기반에서는 iris 전문가가 필요하다. - 머신러닝은 데이터만으로 컴퓨터가 직접 패턴을 찾는 것이다. - 사실, 머신러닝에서 중요도를 따지면 알고리즘은 20~30%이다. 성능의 차이는 데이터에서 난다. 머신러닝에서는 데이터 전처리가 중요하다. 패턴을 알 수 있는 유의미한 데이터를 구하는 것이 중요. (딥러닝에서는 또 ..

플레이데이터 빅데이터캠프 공부 내용 _ 6/23, 27 머신러닝 _ 01 개요 1. 인공지능 (AI - Artificial Intelligence) 이란 - 지능: 어떤 문제를 해결하기 위한 지적 활동 능력 - 인공지능 - 기계가 사람의 지능을 모방하게 하는 기술 - 규칙기반(사람이 만든 알고리즘), 데이터 학습 기반(기계가 넣은 데이터를 스스로 학습해 알고리즘을) - 머신러닝에서는 데이터를 가지고 기계가 스스로 학습할 수 있는 환경을 우리가 만드는 것이다. 그렇다면 데이터가 바껴도 바뀐 데이터만 주면 알아서. 바뀐 것을 공부할 수 만 있게 하면 된다. (규칙기반은 데이터뿐만 아니라 다 바꿔야 함.) - 기계가 배우는 책과 같은 개념이 데이터이다. 기계는 규칙을 데이터로부터 찾는다 Strong AI vs..