목록AI_STUDY/머신러닝 (13)
ㅅㅇ
플레이데이터 빅데이터캠프 공부 내용 _ 7/8 머신러닝 _ 15_로지스틱 회귀 1. 로지스틱 회귀 (LogisticRegression) - ''' Sample이 특정 클래스에 속할 확률을 추정 ''' 하는 모델이다. - 여기서 설명하는 모델은 이항 로지스틱회귀로 선형회귀 알고리즘을 이용한 이진 분류 모델이다. ( ** 다항 로지스틱 회귀, 순서형 로지스틱 회귀) = > 데이터가 어떤 범주에 속할 확률을 0 에서 1 사이의 값으로 예측하고 그 확률에 따라 가능성이 더 높은 범주 ( 사건이 일어나는지 (1) , 일어나지 않는지 (0) ) 에 속하는 것으로 분류 해주는 지도 학습 알고리즘 이다. - 로지스틱 회귀는 선형회귀 기반의 알고리즘임으로 모델링을 위해 데이터 셋들을 선형 회귀 와 같이 전처리 해주어야 ..
플레이데이터 빅데이터캠프 공부 내용 _ 7/8 머신러닝 _ 14_최적화 _ 경사하강법 1. 최적화 (Optimize) = > ' 학습 '에서 모델의 예측한 결과 값과 실제 정답 값의 차이 -- > ' 오차를 계산하는 함수 ' 손실함수 를 만들고 그 오차값이 최소가 되는 지점 그때의 Parameter 를 찾는 작업을 한다. 2. 최적화 문제 - 선형회귀 모델에서 오차는 w 에 영향을 받는데, 둘은 관계가 있는 것이다. - 오차 구하는 함수 f(w) 의 값을 최소화(또는 최대화) 하는 arg 변수 w(파라미터)를 찾는 것. - 예시 그래프 (설명을 위해 우리가 만든 손실함수 f(w) _ 원래는 우리가 만드는게 아니라, 모델이 학습하여 만드는 함수) 아래 그래프와 같이 weigth 에 따라 loss 오차 값이..
플레이데이터 빅데이터캠프 공부 내용 _ 7/7 ~ 7/8 머신러닝 _ 13_02 선형회귀 _ 다항회귀 1. 다항회귀 개요 (Polynomial Regression) : 단순한 직선형 보다 복잡한 비선형의 데이터셋을 학습하기 위한 방식. 1) 방법 : 각 Feature들을 거듭제곱한 것과 Feature들 끼리 곱한 새로운 특성들을 추가한 뒤 선형모델로 훈련시킨다. - 파라미터 가중치를 기준으로는 일차식이 되어 선형모델이다. 파라미터(Coef, weight)들을 기준으로는 N차식이 되어 비선형 데이터를 추론할 수 있는 모델이 된다. = > `PolynomialFeatures` Transformer를 사용해서 변환한다. 2) 목적 : Feature가 너무 적어 y의 값들을 다 표현 하지 못하여 = > unde..
플레이데이터 빅데이터캠프 공부 내용 _ 7/7 머신러닝 _ 13_01 선형회귀 1. 선형회귀 개요 선형 회귀(線型回歸, Linear regression)는 종속 변수 y와 한 개 이상의 독립 변수X와의 선형 상관 관계를 모델링하는 회귀분석 기법. 2. 선형회귀 모델 - 입력 Feature에 가중치(Weight)를 곱하고 편향(bias)를 더해 예측 결과를 출력한다. = > Weight와 bias가 학습대상 Parameter가 된다. - 각 W들은 타켓을 예측하는데 각각의 feature가 어떤 영향을 주는 지를 뜻하게 된다. - b는 모든 feature가 0일 때 예측값 3. 기본예제 : LinearRegression - 가장 기본적인 선형 회귀 모델 - 데이터 전처리 선형회귀 모델사용시 아래와 같은 전처..
플레이데이터 빅데이터캠프 공부 내용 _ 7/7 머신러닝 _ 12_회귀모델개요_평가지표 1. 회귀(Regression) 이란? 예측할 값(Target)이 연속형(continuous) 데이터(float)인 지도 학습(Supervised Learning). X 를 이용해 y 를 예측하는 모델. 선형회귀는 확보한 데이털를 이용해서, 두 변수 사이의 관계를 모델링하여 둘의 관계를 선형식으로 추정한다. 회귀 문제는 실제 식을 찾는 것은 불가능하며, 샘플을 이용해 실제 식을 추정한다. - LinearRegression 모델이 학습해서 찾는 파라미터 제공 attribute : 계수(coef, 가중치-weigth) 와 절편(intercept, 편향-bias) 를 통해 X과 y에 미치는 영향을 알 수 있기에 선형 회귀 모..