Career/빅데이터 분석기사

빅데이터분석기사 실기 :: 신유형 작업형3 소개, 변경사항, 공부방법

옐루비(YellowBee) 2023. 5. 22. 17:09

빅데이터분석기사 실기 관련 Kdata 데이터자격검정 사이트에 올라온 공지사항입니다.

빅데이터분석기사 실기시험의 출제유형이 아래와 같이 변경됨을 안내합니다.


변경내용 : 기존 단답형 10문제를 작업형 신규 유형인 '작업형 제3유형'으로 대체
변경시기 : 제6회 빅데이터분석기사 실기시험(2023.06.24)부터 적용




변경에 따른 작업형 유형별 문제수 및 배점은 위의 표와 같으며
각 유형별 예시 문제는 빅데이터분석기사 체험환경(링크)을 통해 확인할 수 있습니다.

제 6회 실기시험을 응시예정인 와중에 충격적인 소식...
(예시도 없이 새로 공부하려면,,ㅜㅜㅜ)
단답형 10문제가 신 유형인 작업형 제 3유형 2문제로 변경된다는 사실!
무려 30점의 배점입니다.


제 나름대로 공부한 '단답형'→'작업형 3' 신유형 소개 및 공부방법을 소개하려고 합니다. 그래도 처음 출시되는 유형이다보니 비교적 쉽게 출제될 것으로 예상됩니다.
(첫 빅데이터 분석기사 시험 수준도 쉽게 출제된 편)
 
이번 변경공지사항에 따른 작업형 3 유형에 대한 힌트는 딱 1개가 전부입니다.
바로, 빅데이터분석기사 체험환경에 예시문제 입니다. (dataq 제공 링크)

구름EDU - 모두를 위한 맞춤형 IT교육

구름EDU는 모두를 위한 맞춤형 IT교육 플랫폼입니다. 개인/학교/기업 및 기관 별 최적화된 IT교육 솔루션을 경험해보세요. 기초부터 실무 프로그래밍 교육, 전국 초중고/대학교 온라인 강의, 기업/

edu.goorm.io

예시문제를 살펴보면 통계함수를 다루는 유형임을 알 수 있습니다.

귀무가설, 대립가설, 표본평균, 검정통계량, P-value

scipy 라이브러리를 사용할 확률이 높고, 작업형 3의 하위 3개의 문제가 존재합니다.
(a), (b), (c) 중 (c) 번문제는 채택/기각 중 선택이 가능합니다.


즉, 작업형 유형별로 구분을 해보면

작업형13문제(30점)데이터 전처리
작업형21문제(40점)분류/예측 모델링
작업형32문제(30점)가설 검정

작업형3은 가설검정에 대한 문제가 출제됩니다.
결국, 60점 이상의 점수 획득을 위해선 가설검정에 대한 공부 및 실습이 필요한 상황입니다.


빅데이터 분석 기사에서의 가설검정의 정의, 방법을 가볍게 정리하려고합니다.
통계적으로 데이터를 분석하여 어떤 주장이나 가설이 맞는지 틀린지를 결정하는 과정을 의미합니다.
가설검정은 데이터를 사용하여 특정 가설에 대한 증거를 찾는 데 사용되며,
주로 데이터로부터 얻은 통계량과 확률 모형을 기반으로 수행됩니다.
가설검정은 일반적으로 두 가지 가설을 설정하여 이루어집니다.
 
이를 귀무가설(H0, null hypothesis)대립가설(H1 또는 HA, alternative hypothesis)이라고 합니다.
귀무가설은 일반적인 상태로서 아무런 변화나 효과가 없다는 가설입니다.
대립가설은 귀무가설에 반대되는 주장이나 원하는 변화를 나타내는 가설입니다.
가설검정의 과정

가설 설정: 귀무가설(H0)과 대립가설(H1)을 설정합니다.

유의수준 설정: 유의수준(α)을 결정합니다. 유의수준은 귀무가설을 기각하는 기준이 되는 확률값입니다.
일반적으로 0.05(5%) 또는 0.01(1%)이 사용됩니다.

검정 통계량 계산: 적절한 통계량을 사용하여 데이터에서 계산합니다.
검정 통계량은 주로 표본 평균, 표본 비율, 표본 분산 등이 사용됩니다.

유의확률 계산: 검정 통계량으로부터 유의확률(p-value)을 계산합니다.
유의확률은 귀무가설이 참일 때, 해당 검정 통계량이 나타날 확률을 의미합니다.

결론 도출: 유의확률과 설정한 유의수준을 비교하여 귀무가설을 기각하거나 기각할 수 없는지 결정합니다.
유의확률이 유의수준보다 작으면 귀무가설을 기각하고, 유의확률이 유의수준보다 크면 귀무가설을 기각할 수 없습니다.

가설검정은 데이터 분석에서 중요한 도구로 사용되며, 가설을 검증하고 의사결정에 도움을 주는 과정입니다.
유의수준을 설정함으로써 귀무가설을 기각할지 말지를 결정할 수 있습니다.
 
유의수준은 통계적으로 유의한 결과를 얻기 위해 우리가 감수할 수 있는 오류의 최대 수준을 나타냅니다.
일반적으로 유의수준은 0.05(5%) 또는 0.01(1%)으로 설정됩니다.
(이는 통계적으로 유의한 결과를 얻기 위해 5% 또는 1%의 오류를 감수할 수 있다는 의미)
 
예를 들어, 유의수준을 0.05로 설정한 경우, 유의확률(p-value)이 0.05보다 작으면 귀무가설을 기각하고,
유의확률이 0.05보다 크면 귀무가설을 기각할 수 없습니다.

더보기

유의수준은 연구의 목적이나 분석의 중요성에 따라 조정될 수 있습니다.

더 높은 유의수준을 선택하면 귀무가설을 기각하기 위해 더 강한 증거가 필요하게 되며,

반대로 더 낮은 유의수준을 선택하면 귀무가설을 기각하기 위해 상대적으로 적은 증거만 필요합니다.

작업형 3의 예시 문제를 보면 귀무가설의 채택, 기각 여부까지 대답해야하는 형식으로 출제되었습니다.

+ 추가적인 가설검정에 대한 실습은 차차 업로드할 예정입니다.
 
단답형 문제의 삭제 및 AII 작업형(실습) 문제로 변경됨에 따라 비전공자가 독학으로 공부하기는 더 어려워졌다고 예상되며, 많은 실습과 코드에 적응하는 것이 중요해보입니다.


+ 다들 6회 빅분기 실기 시험접수 하셨나요~?
23/5/22~5/26까지 신청이 가능하니 참고하시길!

빅데이터분석기사 제 6회 시험접수기간

데이터자격시험

대용량의 데이터 집합으로부터 유용한 정보를 찾고 결과를 예측하기 위해 목적에 따라 분석기술과 방법론을 기반으로 정형/비정형 대용량 데이터를 구축, 탐색, 분석하고 시각화를 수행하는 업

www.dataq.or.kr