2025/03 30

[SQLD] 39회 (복원)기출문제 오답노트

01. 다음 중 데이터베이스 논리 모델에 대한 설명으로 올바르지 않은 것은? ①  개념 데이터 모델은 사용자 관점에서 데이터 요구사항을 식별한다.② 논리 데이터 모델은 M:N 관계 해소, 식별자 확정, 정규화, 무결성 정의 등을 수행한다.③ 논리 모델은 데이터베이스 구축을 위해서만 사용되는 것이다.④ 데이터가 물리적으로 저장되는 방법을 정의하는 것이 물리적 모델이다.✅ 정답더보기③ 논리 모델은 데이터베이스 구축을 위해서만 사용되는 것이다.   05. 다음 보기 중 슈퍼/서브타입 데이터 모델의 변환타입에 대한 설명으로 옳은 것은?① One to One이란 개별로 생성되는 트랜잭션에 대해서는 개별 테이블로 구성하는 것으로 테이블의 수가 많아진다.② Plus Type은 하나의 테이블을 생성하는 것으로 조인(J..

SQLD 2025.03.31

[SQLD] 데이터 모델링의 이해 출제예상문제(20문항)

01. 다음 중 가장 추상화 수준이 높은 데이터베이스 모델링은 어느 것인가?① 개념적 모델링② 물리적 모델링③ 논리적 모델링④ 추상적 모델링 ✅ 정답더보기① 개념적 모델링데이터 모델링은 개념적 데이터 모델링 → 논리적 데이터 모델링 → 물리적 데이터 모델링 순으로 수행하며 단계가 진행될 수록 추상화 수준은 점점 낮아진다.모델링 단계설명개념적 데이터 모델링가장 먼저 수행하는 데이터 모델링으로 높은 추상화 수준에서 업무와 개념 중심으로 모델링을 수행논리적 데이터 모델링개념적 모델링을 기본으로 키, 속성, 관계 등을 정의하며 정규화를 통한 중복 저장의 최소화, 식별자의 확정 등을 수행물리적 데이터 모델링추상화 수준이 가장 낮은 단계로서 데이터베이스를 실제로 구축하고 성능, 보안, 저장 등 물리적인 수준에서 모..

SQLD 2025.03.28

[빅데이터분석기사 필기] 2~8회 기출 정리

[1과목]데이터 거버넌스: 원칙, 조직, 프로세스 데이터 엔지니어: 마이그레이션, 모니터링데이터 아키텍트: 구조, 설계 관리데이터 개발자: 개발데이터 기획자: 요구사항 정의, 기획 빅데이터 분석 절차: 분석 기획 → 데이터 준비 → 데이터 분석 → 평가 및 전개 → 시스템 구현빅데이터 분석 기획 절차: 범위 설정 → 프로젝트 정의 → 수행계획 수립 → 위험계획 수립데이터분석 마스터플랜: 분석대상 수행과제 도출 → 우선순위 평가 → 단기적 세부 이행 계획 → 중장기 분석 로드맵 수립 데이터 준비 단계: 수집, 탐색, 전처리, 정제, 변환, 통합데이터 준비 과정: 수집 → 정제 → 변환 → 전처리 → 저장 및 활용 (CCTPS) 상향식접근법: 프로세스 분류 → 프로세스 흐름 분석 → 분석요건 식별 → 분석요..

[빅데이터분석기사 필기] 2회 기출 문제 정리

08. 상향식접근법: 프로세스 분류 → 프로세스 흐름 분석 → 분석요건 식별 → 분석요건 정의22. 래퍼기법의 래퍼: 변수들을 wrapping해서 변수 set을  조합하는 것25. SMOTE: Synthetic minority Over-sampling Technique30. 평행좌표그래프: 여러 차원의 데이터 / 스몰멀티플즈: 여러 그래프37. 점추정 방법: 적률법, 평균제곱오차, 최대가능도추정법40. 유의수준(α): 1종오류확률, β: 2종오류, 위험도=α+β 47. k-fold: 훈련데이터: 데이터 충분하지 않을 때 용이48. 다차원척도법: 데이터를 다차원공간에 나타내 유사성, 차이 시각적으로58. 합성곱신경망(CNN)에서 특징맵(피처맵) 크기 = (input - filter + 2*padding) ..

[빅데이터분석기사 필기] 3회 기출 문제 정리

04. Tajo: 하둡 기반 ETL과 Low-Latency, Long Term Query, AD Hoc Query10. 데이터분석 마스터플랜: 분석대상 수행과제 도출 → 우선순위 평가 → 단기적 세부 이행 계획 → 중장기 분석 로드맵 수립22. PCA: 상관행렬, 공분산행렬25. 변수 변환 기법 중 스케일링: 최소-최대 정규화, 표준화, 최대-절대값 정규화(-1~+1)32. 공분산분석 ⊃ 일원(독립변수1개), 이원(독립변수2개)37. 중심극한정리: 표본의 크기가 커질수록 정규 분포39. 모평뷴/모분산 통계량 4가지 준거: 불편성, 일치성, 유효성, 충분성. 47. 시그모이도(0~1) 하이퍼볼릭탄젠트(-1~1)49. SVM: 고차원에서의 특징추출이 어려운 경우 차원의 저주 회피50. SVM 커널: 선형 커..

[빅데이터분석기사 필기] 4회 기출 문제 정리

02. PB-EB-ZB-YB04. 스파크: 인메모리05. API GW(게이트웨이): 시스템의 전방에 위치, 클라이언트로부터 다양한 서비스를 처리, 내부 시스템으로 전달 미들웨어11. 빅데이터 분석 기획 절차: 범위 설정 → 프로젝트 정의 → 수행계획 수립 → 위험계획 수립15. 개인정보차등보호: 개인정보에 노이즈 추가해서 개인정보보호와 데이터분석 모두 진행하는 방법19. HDFS: Apache Hadoop, 마스터-슬레이브(노드), 추가O 수정X23. Min-Max(정규화): 0~1 25. 결정계수(R^2)=상관계수(r)^226. 변동률: 기하평균 / 변동계수:분산(표준편차, 평균)28. 꼬리-왜도(왼쪽꼬리 음수, 오른쪽꼬리 양수), 평균쪽으로 밀집30. 패널 데이터: 시간에 따라(같은 사람에 대해 1,..

[빅데이터분석기사 필기] 5회 기출 문제 정리

02. 데이터 엔지니어: 마이그레이션, 모니터링 / 아키텍트: 구조, 설계 관리 / 개발자: 개발 / 기획자: 요구사항 정의, 기획06. 전이 학습: 이미 학습된 모델 반영 재학습 효율up / 강화 학습:  보상 최대화, 시행착오 통해 최적 찾기09. WBS: Work Breakdown Structure13. 스캠퍼(SCAMPER): 브레인스토밍 기법21. 레버리지: 이상치 측정, 0~126. 더미 코딩: 원-핫 인코딩에서 하나의 범주 제거(차원 감소, 다중공선성 완화)27. 클래스 불균형 방안: 임계값 이동, 비용 함수 민감 학습, 오버샘플링/언더샘플링29. Cov(X,Y)=0이면 독립이 아니라 선형 관계가 없는 것, 공분산: 선형관31. 피어슨 상관계수 |r| >= 0/8~0.9 변수 제거 고려36...

[빅데이터분석기사 필기] 6회 기출 문제 정리

06. 데이터 거버넌스: 원칙, 조직, 프로세스08. DB to DB: DW, DM / FTP: 대량(로그,백업) / OpenAPI: 외부 서비스 / HTTP: 웹 15. 데이터 준비 단계: 수집, 탐색, 전처리, 정제, 변환, 통합18. 평활화: 노이즈 제거, 추세 파악, 예측 모델 개선 / 가우시안 필터, 이동평균, 로컬 회귀19. 분산파일시스템: 네크워트를 통해 호스트에 있는 데이터 접근22. 데이터 준비 과정: 수집 → 정제 → 변환 → 전처리 → 저장 및 활용 (CCTPS)23. 다중대치법: 여러 예측값 생성 후 선택25. 데이터 이상값 발생 원인: 입력오류, 측정오류, 처리오류, 표본오류(크기/편향) / 보고오류 ≠ 이상값26. 레버리지: 회귀진단 이상값, 영향값 탐색 / AIC(Akaike ..

[빅데이터분석기사 필기] 7회 기출 문제 정리

07. HDFS: 네임노드가 망가지면 정상적인 작동 못함, 범용 하드웨어 사용(확장성)-수평적 확장11. 분석기획 우선순위 고려요소: 중요도, 분석가능성, ROI(Return On Investment)12. CRISP-DM 절차: 업무 이해 → 데이터 이해 → 평가 → 전개13. 빅분단계: 기획 → 데이터 준비 → 데이터 분석 → 모델 평가 → 모델 적용 및 배포19. Nosql DB: MongoDB(doc), DynamoDB(key-val), Cassandra(col)22. 구분자: 쉼표, 세미콜론, 탭 등 데이터 나누는 특정 문자(기호);25. 일변량 이상값 검출방법: IQR(사분위수), 산포도, 3*표준편차26. 평균쪽으로 쏠림=평균 반대쪽으로 꼬리 생28. 분산 변수선택: 분산이 작은 데이터 제거..

[빅데이터분석기사 필기] 8회 기출 문제 정리

05. 데이터 분석 단계: 데이터 확인 및 추출, 데이터 모델링, 모델링 적용 및 운영방안06. 데이터 탐색 단계: 유의미한 변수 고르기09. 빅데이터 분석 절차: 분석 기획 → 데이터 준비 → 데이터 분석 → 평가 및 전개 → 시스템 구현12. 서열변수: 순서/간격 불균등, 등간변수: 간격 일정, 절대적인 0 없음, 비율변수: 간격 일정, 절대적인 0 존재13. 정규화: 일정한 범위(like 0~1), 표준화: 평균0 표준편차1, 범주화: 연속→범주, 일반화: 포괄적인 범주, 정형화: 비정형→정형16. 데이터 웨어하우스 특징: 주제 지향적, 통합성, 시계열적, 비휘발성, 분석 최적화, 대용량 처리, ETL 프로세스 활용17. 분산파일시스템: HDFS, CephFS, GlusterFS, MooseFS, ..