- 주최 : 한국데이터산업진흥원, 과학기술정보통신부
- 교육 : 연세대학교
- 인원 : 66명
- 파이썬, spark 등 다양한 빅데이터 분석도구 활용
- 데이터베이스와 연동한 분석 학습
- 머신 러닝, 딥러닝 기법을 활용한 실전 KDD 프로세스 분석 실습 교육
- 이론실습 : 2020. 7. 6 ~ 8. 16 / 09:30 ~ 17:30
- 프로젝트 : 2020. 8. 17 ~ 9. 4 / 09:30 ~ 17:30
- 프로젝트 보완 및 제출(비대면) : 2020. 9. 7 ~ 9. 18
교과목명 | 주요 내용 | 시간 |
---|---|---|
빅데이터 분석 | 빅데이터 정의 및 개념, 가치 및 트렌드 이해, 빅데이터 주요 기술 소개 | 3H |
파이썬 프로그래밍 | 개발 도구 및 빌드 환경의 이해, 데이터 유형 및 기초 문법, 데이터베이스 연동, 쥬피터를 통한 interactive programming |
35H |
데이터 분석 기초 및 시각화 | numpy, pandas, matploylib 라이브러리를 사용한 데이터 분석 | 28H |
데이터베이스와 SQL | SQL 기본 개념, SQL 주요 문법 설명(select, join, agregate), 고급 문법 활용 설명(subquery, view …) |
7H |
빅데이터 전처리 | 데이터 정제, 통합, 변환, 축소, 이산화 기법 | 14H |
고급 데이터 분석 | 분석 방법론, 클러스터링, 연관규칙, 빈발패턴, 순차패턴, 결정트리 기법, xgBoost, 인공신경망 |
61H |
크롤링 및 소셜 분석 | 웹페이지 크롤링, 자연어 처리 | 21H |
실전 KDD 프로세스 분석 실습 | 실전 프로젝트 실습, 실무 분석 | 21H |
Spark 기반 배치/실시간 빅데이터 처리 | Apache Spark 아키텍쳐, Spark SQL, Spark Streaming, Zepplin | 10H |
프로젝트 팀 및 주제 선정 | 프로젝트 팀 선정, 주제 선정, 데이터 선정 및 분석방법론 설계 | 14H |
프로젝트 수행 | 팀 프로젝트 및 특강 | 69H |
프로젝트 발표 및 보완 | 프로젝트 발표식, 보완 개선 | 7H |