최근 수정 시각 : 2024-02-09 15:50:19

빅데이터분석기사

컴퓨터 분야 자격 제도
{{{#!wiki style="margin: 0 -10px -5px; min-height: 26px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -6px -1px -11px"
<colbgcolor=#f5f5f5,#333> 국가기술자격 기술사 정보관리기술사 컴퓨터시스템응용기술사 정보통신기술사
기사 정보처리기사 정보보안기사 전자계산기조직응용기사 전자계산기기사
빅데이터분석기사 로봇소프트웨어개발기사 임베디드기사 정보통신기사
산업기사 정보처리산업기사 정보보안산업기사 사무자동화산업기사
컴퓨터응용가공산업기사 전자계산기제어산업기사 정보통신산업기사
기능사 정보처리기능사 정보기기운용기능사 전자계산기기능사
컴퓨터응용선반기능사 컴퓨터응용밀링기능사 전자캐드기능사
컴퓨터그래픽스운용기능사 웹디자인기능사 전자출판기능사
서비스분야
국가기술자격
전자상거래관리사
전자상거래운용사
컴퓨터활용능력
( 1급/ 2급)
멀티미디어콘텐츠
제작전문가

( 산업기사급)
게임국가기술자격
(기획/그래픽/프로그래밍)
( 기사급)
전산회계운용사 한글속기 워드프로세서 사회조사분석사
국가공인
민간자격
전산세무회계 ERP정보관리사 AT 자격시험 IT+정보활용능력인증
네트워크관리사1) PC정비사 리눅스마스터 SQLD
SQLP RFID GL/SL e-Test ITQ
GTQ/ GTQi2) DIAT PC활용능력평가 PC Master(정비사)
IEQ 데이터아키텍처 데이터분석 전문가/준전문가( ADP/ ADsP) SW테스트전문가3)
국가등록
민간자격
SW코딩자격 AIFB 문서실무사 COS Pro
한글플러스 엑셀플러스 파워포인트플러스 CAS활용능력
디지털영상편집 수사속기 코딩활용능력
국제자격 ICDL MOS OCJP OCP
SCEA CC
(Cisco Certificated)
CISA CISSP
PMP ACE Test
※ 부분공인민간자격은 공인민간자격에만 기재하고 따로 주석을 첨부함.
1) 네트워크관리사는 2급만 국가공인자격임. (1급은 등록민간자격)
2) GTQ 및 GTQi는 1급/2급만 국가공인자격임. (GTQ/GTQi 3급 및 GTQid는 등록민간자격)
3) SW테스트전문가는 일반등급만 국가공인자격임. (고급은 등록민간자격)
}}}}}}}}}
빅데이터분석기사
빅데이터分析技士
Engineer Big Data Analysis
중분류 211. 정보기술
관련부처 과학기술정보통신부
통계청
시행기관 한국데이터산업진흥원
1. 개요2. 상세
2.1. 신설2.2. 기본정보2.3. 시험정보
2.3.1. 응시자격 2.3.2. 합격기준 및 기타2.3.3. 필기
2.3.3.1. 빅데이터 분석 기획2.3.3.2. 빅데이터 탐색2.3.3.3. 빅데이터 모델링2.3.3.4. 빅데이터 결과 해석
2.3.4. 실기
2.3.4.1. 제공환경2.3.4.2. 검정과목
3. 논란 및 사건사고4. 기타5. 둘러보기

1. 개요

자격시험 소개 사이트

대한민국 기사 자격증. 2019년에 창설되었다. 유사자격증인 ADP, ADsP와 통합되는 안과 별개로 추진되는 안이 논의되었으나 결국 별개의 자격증으로 확정되었다. ADP, ADsP, 빅데이터분석기사 모두 한국데이터산업진흥원에서 주관한다는 점과 출제 기준에서 상당한 공통점을 보이나 난이도의 차이가 있다. 공식적이진 않지만 일반적으로 ADsP < 빅데이터분석기사 < ADP 순으로 인식된다. 따라서 빅분기를 취득한 경우 ADsP를 따는 것은 그다지 권장되지 않는다. ADP를 따기 위해서거나, 자격증은 다다익선이라고 생각하는 사람의 경우는 따도 무관하며 시험범위도 상당히 겹쳐 빅분기 합격자라면 어렵지 않게 합격가능하다.

빅데이터분석기사 시험은 2021년 4월 17일 첫 시험을 치렀고, 1년에 2회 실시한다. 이 자격의 주관은 과학기술정보통신부 통계청이며, 자격증에는 과학기술정보통신부장관 통계청장이 적혀 나온다. 자격증은 상장형과 카드형 실물자격증으로 발급된다. 카드형은 2023년부터 발급이 가능해졌으며 발급비용으로 약 6천원 정도를 받는다. 발급까지는 약 2주 정도 소요된다.

2. 상세

2.1. 신설

[ 공고문 보기 ]
파일:20200131_101351_671.jpg

수탁기관 심의결과 2020년 1월 28일부로 2020년 12월 31일까지 약 1년간 한국데이터산업진흥원이[1] 빅데이터 분석기사 수탁기관으로 지정되었다. 관련 공지에 따르면 주무부처가 수탁기관 변경을 요청하지 않으면 자동 연장된다고 써있는 것으로 보아 계속 한국데이터산업진흥원이 수탁업무를 수행할 것으로 보인다.

2.2. 기본정보

  • 자격분류: 국가기술자격
  • 시행기관: 한국데이터산업진흥원
  • 응시자격: 제한있음(국가기술자격법 시행령 별표4의2) [2]
  • 근거법: 국가기술자격법 및 동법 시행령
  • 자격개요: 빅데이터분석기사란 한국데이터산업진흥원에서 시행하는 빅데이터분석기사 시험에 합격하여 그 자격을 취득한 자를 말한다.
  • 자격특징: 대용량의 데이터 집합으로부터 유용한 정보를 찾고 결과를 예측하기 위해 목적에 따라 분석기술과 방법론을 기반으로 정형/비정형 대용량 데이터를 구축, 탐색, 분석하고 시각화를 수행한다.
  • 응시수수료: 필기 17,800원, 실기 40,800원
  • 홈페이지: https://www.dataq.or.kr

2.3. 시험정보

2.3.1. 응시자격 [3]

다음 중 하나에 해당하는 사람 (※ 졸업증명서 및 경력증명서 제출 필요)
  • 대학졸업자등 또는 졸업예정자 (전공 무관)
  • 기사 등급 이상의 자격을 취득한 사람 (종목 무관)
  • 3년제 전문대학 졸업자등으로서 졸업 후 1년 이상 직장경력이 있는 사람 (전공, 직무분야 무관)
  • 2년제 전문대학 졸업자등으로서 졸업 후 2년 이상 직장경력이 있는 사람 (전공, 직무분야 무관)
  • 기사 수준 기술훈련과정 이수자 또는 그 이수예정자 (종목 무관)
  • 산업기사 등급 이상의 자격을 취득한 후 1년 이상 직장경력이 있는 사람 (종목, 직무분야 무관)
  • 산업기사 수준 기술훈련과정 이수자로서 이수 후 2년 이상 직장경력이 있는 사람 (종목, 직무분야 무관)
  • 기능사 등급 이상의 자격을 취득한 후 3년 이상 직장경력이 있는 사람 (종목, 직무분야 무관)
  • 4년 이상 직장경력이 있는 사람 (직무분야 무관)

2.3.2. 합격기준 및 기타

  • 필기: 100점을 만점으로 하여 과목당 40점 이상, 전 과목 평균 60점 이상
  • 실기: 100점을 만점으로 하여 60점 이상
  • 필기시험에 합격한 자에 대하여는 필기시험 합격자 발표일로부터 2년간 필기시험을 면제한다.

2.3.3. 필기

구분 과목명 배점
1과목 빅데이터 분석기획 25
2과목 빅데이터 탐색 25
3과목 빅데이터 모델링 25
4과목 빅데이터 결과 해석 25

시험 방식은 객관식, 각 과목당 20문제로 구성되어 있다. 시험 시간은 총 120분이다. 과목당 8문제 이상을 맞혀야 하며, 한 과목이라도 8문제 미만으로 맞힐 경우 총점이 평균 60점 이상이라도 과락으로 불합격이다. 문제는 공개하지 않으며, 시험장에서 시험지를 걷어간다. 현행 기사 제도에서는 유일한 필기 비공개 시험이다. [4][5] 최초 시행된 2021년 제2회 필기시험에서는 예상보다 통계 관련 문제가 많이 나와 수험생들을 멘붕에 빠트렸다. 합격률이 한 자릿수가 아니냐는 의견도 나왔으나 필기 합격률은 40%대로 꽤 높은 편이다.
2.3.3.1. 빅데이터 분석 기획
주요항목 세부항목 세세항목
빅데이터의 이해 빅데이터 개요 및 활용 빅데이터의 특징
빅데이터의 가치
데이터 산업의 이해
빅데이터 조직 및 인력
빅데이터 기술 및 제도 빅데이터 플랫폼
빅데이터와 인공지능
개인정보 법·제도
개인정보 활용
데이터 분석 계획 분석 방안 수립 분석 로드맵 설정
분석 문제 정의
데이터 분석 방안
분석 작업 계획 데이터 확보 계획
분석 절차 및 작업 계획
데이터 수집 및 저장 계획 데이터 수집 및 전환 데이터 수집
데이터 유형 및 속성 파악
데이터 변환
데이터 비식별화
데이터 품질 검증
데이터 적재 및 저장 데이터 적재
데이터 저장
2.3.3.2. 빅데이터 탐색
주요항목 세부항목 세세항목
데이터 전처리 데이터 정제 데이터 정제
데이터 결측값 처리
데이터 이상값 처리
분석 변수 처리 변수 선택
차원축소
파생변수 생성
변수 변환
불균형 데이터 처리
데이터 탐색 데이터 탐색 기초 데이터 탐색 개요
상관관계 분석
기초통계량 추출 및 이해
시각적 데이터 탐색
고급 데이터 탐색 시공간 데이터 탐색
다변량 데이터 탐색
비정형 데이터 탐색
통계기법 이해 기술통계 데이터요약
표본추출
확률분포
표본분포
추론통계 점추정
구간추정
가설검정
2.3.3.3. 빅데이터 모델링
주요항목 세부항목 세세항목
분석모형 설계 분석절차 수립 분석모형 선정
분석모형 정의
분석모형 구축 절차
분석 환경 구축 분석 도구 선정
데이터 분할
분석기법 적용 분석기법 회귀분석
로지스틱 회귀분석
의사결정나무
인공신경망
서포트벡터머신
연관성분석
군집분석
고급 분석기법 범주형 자료 분석
다변량 분석
시계열 분석
베이지안 기법
딥러닝 분석
비정형 데이터 분석
앙상블 분석
비모수 통계
2.3.3.4. 빅데이터 결과 해석
주요항목 세부항목 세세항목
분석모형 평가 및 개선 분석모형 평가 평가 지표
분석모형 진단
교차 검증
모수 유의성 검정
적합도 검정
분석모형 개선 과대적합 방지
매개변수 최적화
분석모형 융합
최종모형 선정
분석결과 해석 및 활용 분석결과 해석 분석모형 해석
비즈니스 기여도 평가
분석결과 시각화 시공간 시각화
관계 시각화
비교 시각화
인포그래픽
분석결과 활용 분석모형 전개
분석결과 활용 시나리오 개발
분석모형 모니터링
분석모형 리모델링

2.3.4. 실기

실기 프로그램은 R(프로그래밍 언어) 또는 Python 중에서 수험자가 직접 선택하여 응시 가능하다. 시험 시간은 180분.

제5회 실기시험까지 단답형 10문제(각 3점씩)와 데이터 전처리 능력을 보는 작업형1 3문제(각 10점씩), 제공되는 데이터를 전처리하여 예측 모델링을 수행하는 작업형2 1문제(40점)가 출제되었으나, 제6회 실기시험부터는 단답형 10문제가 없어지고 가설검정 능력을 평가하는 작업형3 2문제(30점)가 출제된다. 총점 60점을 넘으면 합격한다.

실제 6회 시험에서는 작업형3 문제가 3문제 출제되었고, 출간된 교재나 강의에서 다루는 범위가 아닌 회귀 문제도 나왔다.
문제 오류로 인해서 전원 정답처리된 문제가 2문제 가량 있었는데, 시험 유형 자체가 자리를 잡지 못하고 매번 유형이 바뀌고 있는 점이 수험생들에게는 난이도 떡상의 요인이 될 것으로 보인다.

작업형3 문제를 풀기 위해서는 통계학 개론 수준의 내용은 알고 있어야 하는 만큼 철저한 코딩 준비가 필요하다.

7회 시험에서는 작업형 1과 작업형 2는 무난하게 나왔고 이전 기출과 비슷한 난이도로 출제된 것으로 보인다.
작업형 3 문제에서는 파이썬 기준 scipy 라이브러리 안에 있는 stats 모듈로는 도저히 풀수 없는 문제들만 나왔고, statsmodels 모듈을 알아야 풀 수 있는 문제만 출제되었다. 출제 기조가 statsmodels 모듈만을 활용할 수 있어야 문제를 풀 수 있는 방향으로 변모하였다.
2.3.4.1. 제공환경
클라우드 기반 코딩 플랫폼이 제공된다. 특징이라면 시각화 패키지가 제공되지 않는다. Jupyter Notebook처럼 셀 혹은 줄 단위로 실행시킬 수 없고, 전체 코드를 한 번에 실행해야 한다. 또한 자동완성 기능도 제공되지 않으므로 유의할 것. 즉 코드를 완벽하게 외워야 한다.[6]코드 실행시간은 최대 1분이며, 1분을 넘기면 자동 실행취소된다. 아래 링크의 환경을 참고.
2.3.4.2. 검정과목
검정과목은 1개로 '빅데이터 분석 실무'이며 주요 항목은 아래와 같다.
  • 데이터 수집 작업
  • 데이터 전처리 작업
  • 데이터 모형 구축 작업
  • 데이터 모형 평가 작업

3. 논란 및 사건사고

  • 1회 시험: 1회 필기 시험 접수 시작일인 2020년 11월 23일에 사이트가 먹통이 되어 아무도 접수하지 못하고 일정이 늦춰졌다. 뉴스기사 2020년 11월 말부터 코로나 확산세가 심해져서 12월 19일에 예정이었던 제 1회 시험이 취소되고 2021년 2회차 시험으로 미뤄졌다.[7]나흘 앞두고 갑작스러운 취소 통보가 논란이 되었으며, 주관기관의 무능함을 고발하는 청와대 국민청원이 올라오기도 하였다. 뉴스기사 국민청원
  • 2회 시험: 첫 시험은 여러모로 문제가 많은 시험으로 평가된다.
    - 출제경향 및 복수정답 인정: 빅데이터분석기사이지만 사실상 통계학 위주로 출제되어 통계분석기사가 아니냐는 말이 돌 정도로 편향된 출제경향을 보였으며, 오탈자가 난무하는 것은 기본이고 심지어 두 문제는 주관기관에서 복수정답으로 인정하는 사태까지 벌어졌다. 진흥원 공지
- 작업형2 채점오류 사태: 실기 작업형2 1문제 같은 경우 응시자들의 점수가 만점(40점)과 0점이라는 극단적인 분포로 갈라져 있으며, 파이썬으로 코드를 제출한 경우가 만점이 많고 R로 코드를 제출한 경우가 0점이 많은 것으로 나타났다. 이는 시스템 오류 때문인 것으로 밝혀졌고, 이에 대해 당시 긴급공지가 올라왔다. 진흥원 측에서는 전수조사를 실시한 결과를 수험자 개별로 문자를 발송하여 변동 여부를 통보하였으며, 사전사후 검사결과를 비교할 수 있도록 공개할 것임을 공지하였고 실기 재검토 결과를 안내하였다. 관련공지1 관련공지2 진흥원에 직접 방문하여 코드 확인을 한 사례가 존재한다. 방문 후기 이 글에서처럼 코드 실행 시간의 1분 준수 여부가 매우 큰 제약점으로 작용하였으며, 향후 시험을 준비하는 수험생들이 반드시 염두에 두어야 할 사항이다. 무능원이라는 말이 돌 정도로 여러 가지 측면에서 주관기관 대응이 미흡한 점이 눈에 띄며, 빅분기 역시 큐넷으로 이관하는 것이 좋겠다는 의견이 수험생들 사이에서 전반적으로 돌고 있다.
이 채점 번복 사태는 2021년 국정감사에도 소환됐다. [국감2021] 불합격→합격 489명··· K-DATA, 허술한 시험관리 논란 채점 프로그램의 오류 때문으로 드러났으며, 2000여 명 중 489명이 불합격에서 합격으로, 19명이 합격에서 불합격으로 합격여부가 번복됐다.
  • 2022년 국정감사에서도 다시 소환됐다. 與 허은아 "빅데이터분석기사 시험, 매회 문제 오류" 코로나19로 인해 취소된 제1회 자격시험 이후 실질적으로 시행된 제2회 자격시험부터 제5회 자격시험까지 총 4회 시험에서 매번 정답이 2개 이거나, 정답이 없거나, 지문의 데이터간 '콤마(,)'가 누락됐거나, 보기가 2개 중복 되거나 등의 문제 오류가 발생했다고 한다.
  • 6회 시험: 6회 실기 시험부터는 통계분석을 다루는 작업형3이 신설되었는데, R과 달리 파이썬에서는 사전 안내된 패키지로 해당 문제를 완전히 푸는데 제약이 있다는 항의가 있었다. 시험장에서는 해당 패키지를 불러오는 것이 가능했지만 진흥원이 사전 사용가능한 패키지로 안내하지않았기에 출제오류에 해당한다는 것. 물론 유도 공식들을 전부 알거나 하면 패키지를 쓰지않아도 푸는 것이 가능하긴 했지만, 사실상 그런 사람이 얼마나 있겠는가. 이의제기에 진흥원에서 출제오류를 인정하고 작업형3의 일부문제를 전원 정답처리하는 것으로 마무리되었다. 작업형3번 패키지 누락관련 일부 문항 전원 정답처리 해당 시험에서는 결과적으로 정답 처리가 되지는 않았지만 작업형1 문항이 중의적으로 해석된다는 이의제기도 있었는데[8], 7회부터는 패키지 사전 안내 공지가 생략되었고(대신 시험장에서 설치패키지를 볼 수 있는 명령어가 제공됐다.) 작업형1 유형의 경우 중의적 해석에 대한 이의제기 여부를 사전차단하기 위함인지(..) 모두 짧게 끊은 문장으로 문제가 나왔다.[9]

4. 기타

종목 개발 연구에 따르면 ADsP ADP 사이의 수준이다.

2020년에 정보처리기사가 개정되어 난이도가 올라가자 정보처리기사를 징검다리 삼아 다른 기사 응시자격을 갖추려던 비전공자들이 전자계산기조직응용기사나 빅데이터분석기사를 대신 보겠다고 하기도 했다. 하지만 빅데이터 분야가 상당한 통계학 지식을 요구하는지라 비전공자가 접근하기엔 어려울 것으로 보인다.

역사가 오래되지 않은데다 문제를 공개하지 않다보니 응시자들의 기억에 의존하여 문제가 복원된 것이 전부여서 준비하는 것이 영 순탄치 않은 시험이다. 게다가 위 사건사고에서 보다시피 출제오류나 문항오류도 빈번해 수험생들의 원성이 자자하다. 출제경향도 시험에 따라 들쑥날쑥하다는 평가가 있었으나, 점점 안정화되고 있다는 평도 있다.
실기시험의 경우, 상술됐다시피 구름이라는 IDE 환경에서 실시하는데, 코랩이나 주피터 노트북에서 연습을 하다가 시험장에서 처음 써보면 구리고 안 되는 게 많아서 매우 당황스러울 수 있다. 사전에 시험환경 체험 페이지를 이용하여 연습해보는 것을 권장한다.

팁이라면, 1분 내 코드가 반드시 동작되어야 하므로 길고 복잡한 코드는 추천되지 않는다. 사실상 합격 유무를 가르는 40점짜리 작업형2에서 하이퍼 파라미터 등을 튜닝하기 위해 복잡한 코드를 쓰는 것보다 전처리 후 단순히 모델 두세 개 정도를 디폴트 값으로 돌려보고 가장 모델링 점수가 좋은 것으로 제출하는 것이 좋다.

시험마다 다르긴 하나, 매 시험 응시자는 약 6천명이며, 최종합격자는 2천명 정도인 듯하다. 4회 시험까지는 필기 합격률이 50%가 안 되었으나 5회부터는 60% 정도로 올라왔고, 대신에 실기시험 합격률이 약 60%에서 50%정도로 하락했다.

5. 둘러보기

🏬 사회과학 조사·연구 방법론 둘러보기
{{{#!wiki style="margin: 0px -10px -5px; min-height: 26px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -5px -2px -11px"
<colbgcolor=#C1F3FF>📝 서론 <colbgcolor=#F7FFFF,#191919> 사회과학 · 과학적 방법 · 사회조사 · 연구 · 가설 · 이론( 이론적 조망) · 연구윤리
🔍 조사방법론 I 변인 · 정의 · 상관관계와 인과관계 · 실험( 실험설계 · 통제 · 통제집단과 실험집단) · 사례연구
자료 · 자료수집( 면접법 · 초점집단면접법 · 질문지법 · 관찰법) · 코딩
📈 조사방법론 II 표본조사 · 지표 · 측정 · 신뢰도와 타당도 · 지수 · 척도
📊 사회통계 통계적 방법 · 기술통계학 · 확률 및 분포 · 추론통계학 · SPSS · 분석기법( 분산분석 · 회귀분석)
👔 공인 자격증 사회조사분석사 · 빅데이터분석기사 · 국가공인 데이터분석 전문가
📂 메타 문서 연구방법론 관련 정보
상기 문서들은 한국통계진흥원 및 한국산업인력공단의 출제범위에 의거하여 엄격히 망라되어 있으며, 동 기관의 과목별 구분·명명에 의거하여 조사방법론은 2파트로 구분됨
}}}}}}}}} ||



[1] ADP, ADsP, SQLP, SQLD 등의 데이터 관련 자격증 시험을 주관 [2] 본디 기사 시험 응시 자격은 관련 학과 학사 학위(또는 취득 예정자), 또는 현업에서 일정 기간 이상의 종사를 요구한다. 그러나 " 국가기술자격의 종목별 관련학과 고시"( #)에서 '정보기술' 분야에 포함되는 정보관리기술사, 컴퓨터시스템응용기술사, 전자계산기조직응용기사, 정보처리기사, 정보보안기사, 빅데이터분석기사, 사무자동화산업기사, 정보처리산업기사, 정보보안산업기사의 8개 자격은 모든 학과가 응시 가능하다. 즉, 4년제 대학교만 졸업하면 관련 학과를 졸업했다고 인정한다는 의미이다. [3] 국가기술자격법 시행령 별표4의2 [4] 타 기사시험도 인터넷에서는 공개하지 않으나, 문제지를 회수하지 않아 각종 웹사이트에서 시험문제가 공유된다. [5] 2021년까지 정보보안기사도 비공개였지만 2022년 KCA 한국방송통신전파진흥원으로 이관되면서 공개되었다. [6] help나 dir 등은 사용가능함. [7] 즉 빅분기는 사실상 2회시험이 초대 시험이다. [8] 연도별 월평균을 구하는 문제였다. [9] 7회부터는 답안제출 방식도 변경되었으며, 메모장도 시스템에 내장된 메모장만 쓸 수 있도록 변경됐다.

분류