본문 바로가기

인공지능

(66)
[AI Tech] 1주차 2-2차시 탐색적 자료 분석 (2) 2-2. 탐색적 자료 분석 (2) 3. EDA Our Data 3.1 문제 이해 및 가설 세우기 1. 문제 이해 - Aggregation? - Time Series? - Aggregation + Time Series? 2. 가설 세우기 - 이전 달의 total이 영향을 끼치지 않을까? - 작년 12월 달의 total이 영향을 끼치지 않을까? - 거주 국적에 따른 영향이 있을까? - 고객마다 주로 구매하는 품목이 있을까? 그렇다면 target에 어떤 영향이 있을까? 3.2 가설 검정 - 연속형 1. 개별 연속형 변수 Total 가설: 환불기록이 target에 영향을 줄까? - 최솟값과 최댓값의 다른 점은 오직 부호만 있다. - 데이터를 확인 후 인사이트를 파악해야 한다. 가설검정: 환불건수 보다는, 구매건..
[AI Tech] 1주차 2-1차시 탐색적 자료 분석 (1) 2-1. 탐색적 자료 분석 (1) 1. EDA 1.1 EDA 정의 - EDA(Exploratory Data Analysis, 탐색적 데이터 분석)은 데이터를 탐색하고 가설을 세우고 증명하는 과정을 의미한다. - 다양한 시각을 통해 데이터를 이해하고 특정하고 찾아내는 과정 → 이러한 특징들을 시각화, 통계량으로 표현한다. → 데이터를 특징과 문제들을 직관적으로 이해한다. - 정형, 비정형 모든 데이터는 분석에 앞서서 이러한 EDA 과정을 수반한다. 1.2 EDA 과정 - 주어진 문제를 데이터를 통해 해결하기 위해 데이터를 이해하는 과정 → 문제를 해결하는 과정에서 데이터에 대한 이해는 필수적이다. → 문제에 대한 이해와 데이터에 대한 이해를 통해 적절한 전처리, 방법론들을 선택한다. - 즉, 데이터를 통한..
[AI Tech] 1주차 1-4차시 프로젝트 1 1-4. 프로젝트 1 [ 프로젝트 1 ] 코딩환경 설정 (Windows / Mac) 목표 v 가상환경 구성하기: 파이썬 버전 확인 v 실행환경 점검하기: 파일 입출력 v 간단한 코드를 작성하고 코드리뷰 제출하기 (numpy) 가상환경 설치하기 import sys print(sys.version) 실행환경 점검 - 파일 입출력 'zen of python.csv' 파일을 불러와 내용을 출력 불러올 파일을 저장한 변수명은 'df_csv'입니다. import pandas as pd ## 코드시작 ## df_csv = pd.read_csv("zen of python.csv") ## 코드종료 ## print(df_csv) 간단한 코드 작성하고 실행하기 (numpy) 다음 지시문의 코드를 작성하고 결과를 출력해보세요..
[AI Tech] 1주차 1-3차시 파이썬 프로그래밍 연습 1-3. 파이썬 프로그래밍 연습 파이썬 인공지능을 연습하기에 앞서 파이썬 라이브러리에 대한 코드 문제를 풀어봐야 한다. 제공된 연습자료를 다운로드 받아 제공된 문제를 풀고, 풀어본 소감을 코치에게 공유. 문제는 총 5문입니다. 1. Numpy 1) 행렬곱 연산 랜덤으로 무작위 데이터를 가진 5x3 행렬과 3x2 행렬을 numpy array로 만든 후 행렬곱 출력하기 2) concatenate 연산 numpy에서 자주 사용하는 연산 첫 번째 array: [[5,7],[9,11]] 두 번째 array: [[2,4],[6,8]] array를 사용해 axis가 0과 1일 때의 concatenate 연산을 각각 구함 2. Pandas 1) Series - 조건에 따른 목록 재구성 재고 목록을 사용해 Pandas ..
[AI Tech] 1주차 1-2차시 개발환경 설정 연습 1-2. 개발환경 설정 연습 1. 웹 기반 인터랙티브 편집기 1) Jupyter Notebook 일반적으로 가장 많이 사용한다. 다만, 기존에 사용하던 코드편집기나 IDE가 있다면 해당 툴을 사용해도 무방하다. 2) Google Colaboraty 2. 설치형 어플리케이션 Anaconda + VSCode © NAVER Connect Foundation. All Rights Reserved
[AI Tech] 1주차 1-1차시 정형 데이터란? 1차시: 정형 데이터 소개 및 개발환경 준비하기 1-1. 정형 데이터란? 정의 - 엑셀 파일 형식이나 관계형 데이터베이스의 테이블에 담을 수 있는 데이터로 행(row)과 열(column)으로 표현 가능한 데이터. - 하나의 행은 하나의 데이터 인스턴스를 나타내고, 각 열은 데이터의 피처를 나타냄 비정형 데이터 - 이미지, 비디오, 음성, 자연어 등의 정제되지 않은 데이터 정형 데이터의 중요성 떠오르는 비정형 데이터 1. 이미지: 자율주행자동차, 사물 인식 등 2. 음성: 음성 검색 서비스, 시리, 빅스비 등 3. 자연어: 번역, 이메일 필터 등 => 떠오르는 AI, 다양한 가치 창출 정형 데이터 필요성 1. 범용적인 데이터 - 사람, 기업, 현상, 사회의 많은..