빅데이터분석기사

[빅데이터분석기사 필기] 4회 기출 문제 정리

Jia H 2025. 3. 21. 11:08

02. PB-EB-ZB-YB

04. 스파크: 인메모리

05. API GW(게이트웨이): 시스템의 전방에 위치, 클라이언트로부터 다양한 서비스를 처리, 내부 시스템으로 전달 미들웨어

11. 빅데이터 분석 기획 절차: 범위 설정 → 프로젝트 정의 → 수행계획 수립 → 위험계획 수립

15. 개인정보차등보호: 개인정보에 노이즈 추가해서 개인정보보호와 데이터분석 모두 진행하는 방법

19. HDFS: Apache Hadoop, 마스터-슬레이브(노드), 추가O 수정X

23. Min-Max(정규화): 0~1 

25. 결정계수(R^2)=상관계수(r)^2

26. 변동률: 기하평균 / 변동계수:분산(표준편차, 평균)

28. 꼬리-왜도(왼쪽꼬리 음수, 오른쪽꼬리 양수), 평균쪽으로 밀집

30. 패널 데이터: 시간에 따라(같은 사람에 대해 1,2,3년 등 여러 해)

38. 표준화: Z=(X−μ)/ σ, 평균을 빼고 표준편차로 나눔

39. 초기하분포: 각 시행 독립X(성공횟수 고정), 성공확률 일정하지 않음(비복원추출)

40. 양측검정(α-Z): 10%-1.645, 5%-19.6, 1%-2.576 / 단측검정: 10%-1.282, 5%-1.645, 1%-2.326

44. 선형회귀분석 오차항 특성: 평균 0, 등분산성, 독립성, 정규성

45. 단순: 다항식 / 라쏘: 절대값 / 릿지: 제곱 / 엘라스틱: 결합

46. 로지스틱: 확률 예측, 0~1

47. 오즈(Odds): 사건이 일어날 확률과 일어나지 않을 확률의 비율 / log연산 통해 0~1 logit 획득

51. 선험적규칙(Apriori): 연관분석 / 윌콕슨순위합: 비모수 검정 방법

53. 맨하튼거리: 수평/수직 거리 합

55. 추세 요인: 중/장기적, 빈번한 발생 빈도 없는 패턴

57. 오토인코더: 비지도학습, 사전학습, 차원축소, 노이즈 제거, 과적합/학습어려움/복원품질 이슈

59. 배깅: 부트스트랩 샘플(중복 허용)-예측 결합 / 부스팅: 이전 모델 오류 개선 / 스태킹: 여러 모델 결합 / 보팅: 여러 모델 다수결

60. 윌콕슨 부호순위:일변량, 순위합:이변량 / 주로 30개 이하 작은 샘플

61. ROC: x축(1-특이도), y축(민감도)

63. 실루엣 계수: 군집 품질 평가 지표

69. 카이제곱값 = Σ (Oi - Ei)^2 / Ei

70. F-통계량: p-value < 유의수준(α)이면 귀무가설 기각

71. 정준연결(Canonical link): 로그함수-포아송 분포

76. 비교그래프: 바, 라인, 레이더, 히트맵