목록전체 글 (110)
ㅅㅇ
플레이데이터 빅데이터캠프 공부 내용 _ 6/29 30 머신러닝 _ 04_데이터 전처리 1. 데이터 전처리 : 모델을 학습시키기 전에 처리시키는 것 = > 학습이 가능한 혹은 학습이 더 잘되도록 dataset 으로 만들어주기 - 공학적 전처리 : 사람들이 연구한 전처리. 항상 일정한 퍼포먼스를 보여줌. 어떤 feature 인지, 어떤 타입인지 등에 따라 전처리 방식이 정해져 있다. - 도메인 지식에 의한 전처리 : 우리가 해결해야 할 업무 즉, 특정 분야에 대한 도메인 지식에 맞는 전처리가 필요하다. 이를 위해 그 분야에 대한 지식을 알아야 전처리를 할 수 있다. 1) 학습이 가능한(무조건해줘야함) : 학습을 못 시키게 하는 값들이 있다. - 머신러닝은 수학 함수 처리이다. 모든 모델은 숫자만을 처리할 수..
플레이데이터 빅데이터캠프 공부 내용 _ 6/28 머신러닝 프로세스 중 데이터 셋 분리에 대해 배울 것이다. 머신러닝 _ 03_데이터셋 나누기와 교차검증 1. 데이터셋(Dataset) - Train 데이터셋 (훈련/학습 데이터셋) : 모델을 학습시킬 때 사용할 데이터셋. - Validation 데이터셋 (검증 데이터셋) : 모델의 성능 중간 검증을 위한 데이터셋. 성능을 높이는 작업에서 쓰이는 데이터 - Test 데이터셋 (평가 데이터셋) : 모델의 성능을 최종적으로 측정하기 위한 데이터셋 Test 데이터 셋은 마지막에 모델의 성능을 측정하는 용도로 한번만 사용되야 한다. = = > 데이터셋을 Train set, Validation set, Test set으로 나눈다. ★ 왜 우리는 데이터 셋을 Train..
문제 B진법 수 N이 주어진다. 이 수를 10진법으로 바꿔 출력하는 프로그램을 작성하시오. 10진법을 넘어가는 진법은 숫자로 표시할 수 없는 자리가 있다. 이런 경우에는 다음과 같이 알파벳 대문자를 사용한다. A: 10, B: 11, ..., F: 15, ..., Y: 34, Z: 35 입력 첫째 줄에 N과 B가 주어진다. (2 ≤ B ≤ 36) B진법 수 N을 10진법으로 바꾸면, 항상 10억보다 작거나 같다. 출력 첫째 줄에 B진법 수 N을 10진법으로 출력한다. 예제 입력 1 ZZZZZ 36 예제 출력 1 60466175 문제풀이 소스 코드 1 - int (N, B) 함수 : B 진수인 N을 10진수로 변환해줌. - 첫 번째 인자는 무조건 문자열이여야 한다. N,B = input().split() ..
문제 상근이는 보통 사람들이 사는 것과는 조금 다른 삶을 사는 사람이다. 상근이는 이런 사람들의 시선이 부담스럽기 때문에, 자신만의 숫자를 개발하기로 했다. 바로 그 이름은 팩토리얼 진법이다. 팩토리얼 진법은 각 자리에 올 수 있는 숫자는 0부터 9까지로 10진법과 거의 비슷하다. 하지만, 읽는 법은 조금 다르다. 팩토리얼 진법에서는 i번 자리의 값을 ai×i!로 계산한다. 즉, 팩토리얼 진법에서 719는 10진법에서 53과 같다. 그 이유는 7×3! + 1×2! + 9×1! = 53이기 때문이다. 팩토리얼 진법으로 작성한 숫자가 주어졌을 때, 10진법으로 읽은 값을 구하는 프로그램을 작성하시오. 입력 입력은 여러 개의 테스트 케이스로 이루어져 있다. 각 테스트 케이스는 한 줄로 이루어져 있고, 길이가 ..
문제 네오는 평소 프로도가 비상금을 숨겨놓는 장소를 알려줄 비밀지도를 손에 넣었다. 그런데 이 비밀지도는 숫자로 암호화되어 있어 위치를 확인하기 위해서는 암호를 해독해야 한다. 다행히 지도 암호를 해독할 방법을 적어놓은 메모도 함께 발견했다. 지도는 한 변의 길이가 n인 정사각형 배열 형태로, 각 칸은 "공백"(" ") 또는 "벽"("#") 두 종류로 이루어져 있다. 전체 지도는 두 장의 지도를 겹쳐서 얻을 수 있다. 각각 "지도 1"과 "지도 2"라고 하자. 지도 1 또는 지도 2 중 어느 하나라도 벽인 부분은 전체 지도에서도 벽이다. 지도 1과 지도 2에서 모두 공백인 부분은 전체 지도에서도 공백이다. "지도 1"과 "지도 2"는 각각 정수 배열로 암호화되어 있다. 암호화된 배열은 지도의 각 가로줄에..
주유소 가격 데이터 분석 및 시각화 ( pandas, matplotlib, seaborn, numpy 실습 ) 2019년 주유소들의 일자별 가격 데이터 https://www.opinet.co.kr/user/opdown/opDownload.do 싼 주유소 찾기 Opinet 유가내려받기 사업자 정보 및 유가 정보 일반 면세 www.opinet.co.kr 분석 내용 https://github.com/cso6005/Big-Date-Camp/blob/master/%EC%8B%A4%EC%8A%B5%20%EB%B0%8F%20%ED%94%84%EB%A1%9C%EC%A0%9D%ED%8A%B8/01%20%EC%A3%BC%EC%9C%A0%EC%86%8C%EA%B0%80%EA%B2%A9%20%EB%8D%B0%EC%9D%B4%..