본문 바로가기

취업준비

(68)
[AI Tech] 1주차 2-4차시 Quiz 1 2-4. Quiz 1 1번 정형데이터의 예시로 올바른 것을 고르시오. 1) ".WAV" 파일 형식의 음성 데이터 2) ".JPG" 파일 형식의 이미지 데이터 3) ".XLSX" 파일 형식의 스프레드시트 데이터 4) ".AVI" 파일 형식의 비디오 데이터 2번 다음 설명중 옳지 않은 것을 고르시오. 1) 정형데이터는 관계형 데이터베이스의 테이블에 담을 수 있는 데이터이다. 2) 정형데이터는 JPEG 이미지 파일 형식을 가진다. 3) 하나의 행(row)은 하나의 데이터 인스턴스를 가진다. 4) 하나의 열(column)은 각 데이터의 피처를 나타낸다. 3번 Customer ID Product 1 Product 2 A P11 P21 B P12 P22 C P13 P23 D P14 P24 다음 표에 대한 설명으로 ..
[AI Tech] 1주차 2-3차시 탐색적 자료 분석 연습 2-3. 탐색적 자료 분석 연습 1. 복습 1) EDA는 데이터의 특징과 내재하는 구조적 관계를 알아내기 위해 시각화와 통계적 방법을 통해 다양한 각도에서 관찰하고 이해하는 과정이다. → 문제를 직관적으로 이해하고, 정답에 가까워질 수 있게 됨 2)정형데이터/비정형 데이터 구분 없이 모든 데이터 분석에서 공통적으로 진행되는 필수 과정 데이터마다 적용되는 전문지식과 변수들이 다르고, 그 안의 내용 역시 천차만별이기에 EDA과정은 일반화가 어렵고 정해진 답이 없다. © NAVER Connect Foundation. All Rights Reserved
[AI Tech] 1주차 2-2차시 탐색적 자료 분석 (2) 2-2. 탐색적 자료 분석 (2) 3. EDA Our Data 3.1 문제 이해 및 가설 세우기 1. 문제 이해 - Aggregation? - Time Series? - Aggregation + Time Series? 2. 가설 세우기 - 이전 달의 total이 영향을 끼치지 않을까? - 작년 12월 달의 total이 영향을 끼치지 않을까? - 거주 국적에 따른 영향이 있을까? - 고객마다 주로 구매하는 품목이 있을까? 그렇다면 target에 어떤 영향이 있을까? 3.2 가설 검정 - 연속형 1. 개별 연속형 변수 Total 가설: 환불기록이 target에 영향을 줄까? - 최솟값과 최댓값의 다른 점은 오직 부호만 있다. - 데이터를 확인 후 인사이트를 파악해야 한다. 가설검정: 환불건수 보다는, 구매건..
[AI Tech] 1주차 2-1차시 탐색적 자료 분석 (1) 2-1. 탐색적 자료 분석 (1) 1. EDA 1.1 EDA 정의 - EDA(Exploratory Data Analysis, 탐색적 데이터 분석)은 데이터를 탐색하고 가설을 세우고 증명하는 과정을 의미한다. - 다양한 시각을 통해 데이터를 이해하고 특정하고 찾아내는 과정 → 이러한 특징들을 시각화, 통계량으로 표현한다. → 데이터를 특징과 문제들을 직관적으로 이해한다. - 정형, 비정형 모든 데이터는 분석에 앞서서 이러한 EDA 과정을 수반한다. 1.2 EDA 과정 - 주어진 문제를 데이터를 통해 해결하기 위해 데이터를 이해하는 과정 → 문제를 해결하는 과정에서 데이터에 대한 이해는 필수적이다. → 문제에 대한 이해와 데이터에 대한 이해를 통해 적절한 전처리, 방법론들을 선택한다. - 즉, 데이터를 통한..
[AI Tech] 1주차 1-4차시 프로젝트 1 1-4. 프로젝트 1 [ 프로젝트 1 ] 코딩환경 설정 (Windows / Mac) 목표 v 가상환경 구성하기: 파이썬 버전 확인 v 실행환경 점검하기: 파일 입출력 v 간단한 코드를 작성하고 코드리뷰 제출하기 (numpy) 가상환경 설치하기 import sys print(sys.version) 실행환경 점검 - 파일 입출력 'zen of python.csv' 파일을 불러와 내용을 출력 불러올 파일을 저장한 변수명은 'df_csv'입니다. import pandas as pd ## 코드시작 ## df_csv = pd.read_csv("zen of python.csv") ## 코드종료 ## print(df_csv) 간단한 코드 작성하고 실행하기 (numpy) 다음 지시문의 코드를 작성하고 결과를 출력해보세요..
[AI Tech] 1주차 1-3차시 파이썬 프로그래밍 연습 1-3. 파이썬 프로그래밍 연습 파이썬 인공지능을 연습하기에 앞서 파이썬 라이브러리에 대한 코드 문제를 풀어봐야 한다. 제공된 연습자료를 다운로드 받아 제공된 문제를 풀고, 풀어본 소감을 코치에게 공유. 문제는 총 5문입니다. 1. Numpy 1) 행렬곱 연산 랜덤으로 무작위 데이터를 가진 5x3 행렬과 3x2 행렬을 numpy array로 만든 후 행렬곱 출력하기 2) concatenate 연산 numpy에서 자주 사용하는 연산 첫 번째 array: [[5,7],[9,11]] 두 번째 array: [[2,4],[6,8]] array를 사용해 axis가 0과 1일 때의 concatenate 연산을 각각 구함 2. Pandas 1) Series - 조건에 따른 목록 재구성 재고 목록을 사용해 Pandas ..
[AI Tech] 1주차 1-2차시 개발환경 설정 연습 1-2. 개발환경 설정 연습 1. 웹 기반 인터랙티브 편집기 1) Jupyter Notebook 일반적으로 가장 많이 사용한다. 다만, 기존에 사용하던 코드편집기나 IDE가 있다면 해당 툴을 사용해도 무방하다. 2) Google Colaboraty 2. 설치형 어플리케이션 Anaconda + VSCode © NAVER Connect Foundation. All Rights Reserved
[AI Tech] 1주차 1-1차시 정형 데이터란? 1차시: 정형 데이터 소개 및 개발환경 준비하기 1-1. 정형 데이터란? 정의 - 엑셀 파일 형식이나 관계형 데이터베이스의 테이블에 담을 수 있는 데이터로 행(row)과 열(column)으로 표현 가능한 데이터. - 하나의 행은 하나의 데이터 인스턴스를 나타내고, 각 열은 데이터의 피처를 나타냄 비정형 데이터 - 이미지, 비디오, 음성, 자연어 등의 정제되지 않은 데이터 정형 데이터의 중요성 떠오르는 비정형 데이터 1. 이미지: 자율주행자동차, 사물 인식 등 2. 음성: 음성 검색 서비스, 시리, 빅스비 등 3. 자연어: 번역, 이메일 필터 등 => 떠오르는 AI, 다양한 가치 창출 정형 데이터 필요성 1. 범용적인 데이터 - 사람, 기업, 현상, 사회의 많은..