빅데이터&AI를 위한 통계 (데이터 사이언스 첫단추)

line
  • 과정번호MF10000005
  • 교육시간2일 / 14시간
  • LEVEL100
  • 수강료0원

교육모집정보

교육기간(시작일~종료일) 수업시간 환급여부 수강료 환급금액우선대상(대기업) 신청하기
line

교육개요

· 데이터 분석의 진짜 출발점을 겪어보고, 업무에 맞게 현실적인 데이터 분석을 시작할 수 있도록 도와드립니다.
· 머신러닝을 기술적으로만 공부하다 보면, 현실속에서 어떤 맥락으로 사용하는지를 놓치게 됩니다.
· 빅데이터를 어떻게 분석해야 하는지 맥락을 놓친 채 아키텍쳐에만 집중하면 본질을 놓칩니다.
· 통계적인 사고는, 올바른 시작점과 맥락을 제시해줍니다.
line

교육대상

· 데이터 분석, 머신러닝을 업무에 적용하고 싶어도 어디서 부터 시작해야 할지 모르는 사람

· 데이터 분석과 통계를 공부했지만, 어떻게 적용해야 할지 막막한 사람

· 머신러닝 이전에 고민해야만 하는 기본적인 지점들을 고민하고 싶은 사람 

line

특이사항

[선수지식]

· 평균, 표준편차 등의 단어를 전혀 모르면 강의를 따라가기 어렵습니다.

· 엑셀 등을 이용하여 차트를 띄워본 적이라도 있다면 강의 수강이 가능합니다.



[강의특징]

· 토론형 강의 입니다. 데이터 사이언스는 팀플레이 입니다.

· 기초 과정이므로, 교육과정은 탄력적으로 운영됩니다.

· 데이터 분석 계획과 분석 결과에 집중합니다. Python, R 등의 문법에는 집중하지 않습니다.

· 도구는 필요하면 가져다가 씁니다. 특정 도구에 집착하지 않습니다.

[기대효과]

· 분석적인 사고, 통계적인 사고를 배웁니다. 테크닉 자체에 홀리지 않고 본질에 집중할 수 있게 됩니다.

· 정말 데이터 분석을 어디서 시작하는지를 알게 됩니다.

· ​'빅데이터 하긴 해야 되는데' : 막막하기만 하던 마음에 이정표를 세울 수 있습니다.

· 머신러닝이나 통계를 어떤 상황맥락속에 엮어내며, 어떻게 의사결정에 활용하는지 알 수 있습니다.

·​ 데이터 분석을 시작할 때 겪는 많은 실수들을 미리 겪어볼 수 있습니다.

· p-value, 가설 검정 등의 용어들의 맥락을 정리합니다. 

커리큘럼

  • 1

    Day

  • Module 1 : 현실에서 출발하기

     · 데이터 과학 큰 그림

     · 진짜 데이터 분석 기획/계획 overview

    ​ · 인사이트란 무엇인가

    ​ · 분석계획은 어떻게 세우는가


    Module 2 : 정말 뭘 분석할지 모를 때 : EDA

     · 탐색적 데이터 분석을 통해 얻어야 하는 것

     · 분석용 시각화 vs 발표용 시각화

     · 가설을 구체화 하는 네가지 방법

     · 전처리 계획, 데이터 수집 계획


    Module 3: 연결 다리 : from EDA to CDA

     · EDA로부터 무엇을 넘겨 받아야 하는가

     · 실험을 계획하는 방법

     · 실험을 통해 무엇을 얻어야 하는가 

  • 2

    Day

  • Module 4 : 확증적 데이터 분석 : CDA

     · 왜 가설 검정을 하는가

     · 가설 검정 테크닉들의 속 사정

    ​ · 언제부터 머신러닝인가?

    ​ · 다시 한 번 : 인과 관계와 재현성, 그리고 진짜 원하던 것


    Module 5 : (+Optional) 종합 실습

     · 시뮬레이션과 샘플링 : 통계, 분석, 코딩 종합 실습

     · 모델링 계획

     · Signal & Noise : 머신러닝의 앞과 뒤