eda (3) 썸네일형 리스트형 [AI Tech] 1주차 2-3차시 탐색적 자료 분석 연습 2-3. 탐색적 자료 분석 연습 1. 복습 1) EDA는 데이터의 특징과 내재하는 구조적 관계를 알아내기 위해 시각화와 통계적 방법을 통해 다양한 각도에서 관찰하고 이해하는 과정이다. → 문제를 직관적으로 이해하고, 정답에 가까워질 수 있게 됨 2)정형데이터/비정형 데이터 구분 없이 모든 데이터 분석에서 공통적으로 진행되는 필수 과정 데이터마다 적용되는 전문지식과 변수들이 다르고, 그 안의 내용 역시 천차만별이기에 EDA과정은 일반화가 어렵고 정해진 답이 없다. © NAVER Connect Foundation. All Rights Reserved [AI Tech] 1주차 2-2차시 탐색적 자료 분석 (2) 2-2. 탐색적 자료 분석 (2) 3. EDA Our Data 3.1 문제 이해 및 가설 세우기 1. 문제 이해 - Aggregation? - Time Series? - Aggregation + Time Series? 2. 가설 세우기 - 이전 달의 total이 영향을 끼치지 않을까? - 작년 12월 달의 total이 영향을 끼치지 않을까? - 거주 국적에 따른 영향이 있을까? - 고객마다 주로 구매하는 품목이 있을까? 그렇다면 target에 어떤 영향이 있을까? 3.2 가설 검정 - 연속형 1. 개별 연속형 변수 Total 가설: 환불기록이 target에 영향을 줄까? - 최솟값과 최댓값의 다른 점은 오직 부호만 있다. - 데이터를 확인 후 인사이트를 파악해야 한다. 가설검정: 환불건수 보다는, 구매건.. [AI Tech] 1주차 2-1차시 탐색적 자료 분석 (1) 2-1. 탐색적 자료 분석 (1) 1. EDA 1.1 EDA 정의 - EDA(Exploratory Data Analysis, 탐색적 데이터 분석)은 데이터를 탐색하고 가설을 세우고 증명하는 과정을 의미한다. - 다양한 시각을 통해 데이터를 이해하고 특정하고 찾아내는 과정 → 이러한 특징들을 시각화, 통계량으로 표현한다. → 데이터를 특징과 문제들을 직관적으로 이해한다. - 정형, 비정형 모든 데이터는 분석에 앞서서 이러한 EDA 과정을 수반한다. 1.2 EDA 과정 - 주어진 문제를 데이터를 통해 해결하기 위해 데이터를 이해하는 과정 → 문제를 해결하는 과정에서 데이터에 대한 이해는 필수적이다. → 문제에 대한 이해와 데이터에 대한 이해를 통해 적절한 전처리, 방법론들을 선택한다. - 즉, 데이터를 통한.. 이전 1 다음