02. PB-EB-ZB-YB
04. 스파크: 인메모리
05. API GW(게이트웨이): 시스템의 전방에 위치, 클라이언트로부터 다양한 서비스를 처리, 내부 시스템으로 전달 미들웨어
11. 빅데이터 분석 기획 절차: 범위 설정 → 프로젝트 정의 → 수행계획 수립 → 위험계획 수립
15. 개인정보차등보호: 개인정보에 노이즈 추가해서 개인정보보호와 데이터분석 모두 진행하는 방법
19. HDFS: Apache Hadoop, 마스터-슬레이브(노드), 추가O 수정X
23. Min-Max(정규화): 0~1
25. 결정계수(R^2)=상관계수(r)^2
26. 변동률: 기하평균 / 변동계수:분산(표준편차, 평균)
28. 꼬리-왜도(왼쪽꼬리 음수, 오른쪽꼬리 양수), 평균쪽으로 밀집
30. 패널 데이터: 시간에 따라(같은 사람에 대해 1,2,3년 등 여러 해)
38. 표준화: Z=(X−μ)/ σ, 평균을 빼고 표준편차로 나눔
39. 초기하분포: 각 시행 독립X(성공횟수 고정), 성공확률 일정하지 않음(비복원추출)
40. 양측검정(α-Z): 10%-1.645, 5%-19.6, 1%-2.576 / 단측검정: 10%-1.282, 5%-1.645, 1%-2.326
44. 선형회귀분석 오차항 특성: 평균 0, 등분산성, 독립성, 정규성
45. 단순: 다항식 / 라쏘: 절대값 / 릿지: 제곱 / 엘라스틱: 결합
46. 로지스틱: 확률 예측, 0~1
47. 오즈(Odds): 사건이 일어날 확률과 일어나지 않을 확률의 비율 / log연산 통해 0~1 logit 획득
51. 선험적규칙(Apriori): 연관분석 / 윌콕슨순위합: 비모수 검정 방법
53. 맨하튼거리: 수평/수직 거리 합
55. 추세 요인: 중/장기적, 빈번한 발생 빈도 없는 패턴
57. 오토인코더: 비지도학습, 사전학습, 차원축소, 노이즈 제거, 과적합/학습어려움/복원품질 이슈
59. 배깅: 부트스트랩 샘플(중복 허용)-예측 결합 / 부스팅: 이전 모델 오류 개선 / 스태킹: 여러 모델 결합 / 보팅: 여러 모델 다수결
60. 윌콕슨 부호순위:일변량, 순위합:이변량 / 주로 30개 이하 작은 샘플
61. ROC: x축(1-특이도), y축(민감도)
63. 실루엣 계수: 군집 품질 평가 지표
69. 카이제곱값 = Σ (Oi - Ei)^2 / Ei
70. F-통계량: p-value < 유의수준(α)이면 귀무가설 기각
71. 정준연결(Canonical link): 로그함수-포아송 분포
76. 비교그래프: 바, 라인, 레이더, 히트맵
'빅데이터분석기사' 카테고리의 다른 글
[빅데이터분석기사 필기] 2회 기출 문제 정리 (0) | 2025.03.25 |
---|---|
[빅데이터분석기사 필기] 3회 기출 문제 정리 (0) | 2025.03.22 |
[빅데이터분석기사 필기] 5회 기출 문제 정리 (0) | 2025.03.20 |
[빅데이터분석기사 필기] 6회 기출 문제 정리 (0) | 2025.03.19 |
[빅데이터분석기사 필기] 7회 기출 문제 정리 (0) | 2025.03.18 |