머신러닝 (2) 썸네일형 리스트형 [AI Tech] 1주차 4-2차시 머신러닝 기본 개념 소개 (2) 4-2. 머신러닝 기본 개념 소개 (2) 2. Validation Strategy 2-1. What is Validation strategy Test Dataset - 가장 중요한 데이터 셋 - 정량적인 비교가 진행되어야 한다. - 테스트 데이터셋은 전체를 대표할 수 있는 것이 좋은 것이다. Validation Dataset - 주요 목적: 모델의 성능을 파악하기 위한 데이터 셋 - Validation은 Test와 최대한 유사한 것이 중요하다. - 다만, Test 데이터셋의 정보를 알 수 없을 경우(미래의 값일 경우)가 많다. - 전체 데이터셋과 유사한 데이터셋을 만드는 것이다. Train Dataset - 머신러닝 모델이 보고 학습하는 데이터셋 - 확보한 데이터셋에 따라 노이즈가 포함되었나 되지 않았나.. [AI Tech] 1주차 4-1차시 머신러닝 기본 개념 소개 (1) 4-1. 머신러닝 기본 개념 소개 1. Underfitting & Overfitting 1-1. What is Underfitting & Overfitting 용어 정리 - Fit: 데이터를 "잘" 설명할 수 있는 능력을 말한다. - Underfitting: 데이터를 설명하지 못하는 것 - Overfitting: 데이터를 과하게 설명하는 것 알아야 할 점 - 우리의 데이터 셋은 전체의 일부분이다. - Our dataset = Full dataset일 경우 Overfitting이 좋아 보일 수는 있지만, 실제로는 샘플 데이터가 전체 데이터에 비해 엄청 작다. (기억이 안 난다면 화장품의 sample을 빗대어 생각해 보자) - 데이터로 모든 것을 잘 설명할 수 있어야 한다. 주의점 - 원본 데이터는 특별한 .. 이전 1 다음