책에 내용이 없는 문제들이 많아서 좀 당황스럽다.
다른 챕터와 내용이 겹쳤거나 내용이 그냥 missing이거나 한 듯...
[틀린 문제]
05. 다변량 데이터를 탐색하기 위한 기법의 연결이 알맞지 않은 것은?
① 변수들 간의 관계: 다중회귀분석, 로지스틱회귀, 분산분석
② 차원축소: 주성분분석, 정준상관분석
③ 개체분류: 판별분석, 다차원척도법
④ 교차분석: 다변량분산분석
✅ 다변량 분산분석: 변수들 간의 관계를 분석, 교차분석과 다변량분산분석 모두 변수들 간의 관계 분석 기법
06. 교차분석 기법에 대한 설명으로 가장 알맞은 것은?
① 1개 또는 그 이상의 범주 변수에 대해 교차시켜 빈도를 분석하다.
② 교차표의 차이가 통계적으로 유의한지는 카이제곱검정을 통해 확인 가능하다.
③ 교차분석은 피벗테이블, 분할표분석과 선택적으로 쓰인다.
④ 변수 간의 관계가 상호 의존적인지에 대한 검증만 가능하다.
07. 다차원척도법에 대한 설명으로 가장 적절하지 않은 것은?
① 개체들 사이의 유사성, 비유사성을 측정하여 2차원 또는 3차원의 공간에 점으로 표현한다.
② 개체들을 원래의 차원보다 낮은 차원 공간에 위치시켜 관계 파악을 쉽게 할 수 있다.
③ 거리 계산에는 주로 마할라노비스거리 측정을 활용한다.
④ 구간변수가 비율변수일 떄는 계량적으로, 순서변수일 때는 비계량적으로 사용한다.
✅ 거리 계산에는 주로 유클리디안 알고리즘을 사용
08. 주성분분석에 대한 설명으로 가장 알맞은 것은?
① 원 변수의 직교 선형결합으로 표혀하여 모든 변수에 영향이 있다.
② 인자들의 직교 선형결합으로 원 변수들을 표현하며 그룹 내 변수 간 상관계수가 높다.
③ 적절한 인자의 수를 구하고 변수들을 그룹화하여 관계를 알아본다.
④ 요인점수를 주성분점수와 유사하게 활용 가능하다.
✅ 2, 3, 4는 요인분석(FA)에 해당
14. 다음 중 웹 크롤링에 대한 설명 중 틀린 것은?
① 웹 크롤러를 이용해 www를 탐색해 정보를 얻어내는 컴퓨터 프로그램이다.
② 웹 페이지 크롤링을 통해 직접 접근해 정보를 수집하거나 자동 이메일 수집 또는 웹 유지관리를 위해 사용된다.
③ Scrapping은 웹 페이지의 내용 전체를 웹 코드까지 가져오지만, 크롤링은 Scrapping 이외에도 웹에서 전달하고자 하는 콘텐츠를 데이터화하는 것까지 포함된다.
④ 크롤러 구현 방법 중 Scrapy 라이브러리를 통해 html을 파싱하여 크롤러를 구현한다.
✅ 크롤러 라이브러리: Beautiful soap, lxml, curl / 근데 Scrapy로도 구현할 수 있는 거 아닌가? 왜 틀렸는지 이해는 되지 않는다.
19. 두 개 이상의 범주를 갖는 하나의 실험 요인(독립변수)에 대한 평균 차이를 검정하는 분석기법은 무엇인가?
① 상관관계분석
② 일원분산분석
③ 이원분산분석
④ 공분산분석
✅ 일원분산분석: 두 개 이상의 범주를 갖는 하나의 변수에 대한 평균 차이를 검정하는 방법
[헷갈린 문제]
04. 다변량 데이터에 대한 설명으로 가장 알맞은 것은?
① 하나의 변수만을 측정하여 얻게 되는 변수의 값으로 데이터 요약과 패턴 확인이 목적이다.
② 두 변수 간의 관계를 분석하며 키와 몸무게의 관계 등을 예로 들 수 있다.
③ 데이터 간의 이질성과 차별성을 확인하는 것이 주 목적이다.
④ '감기가 걸린 원인이 나이, 성별, 몸무게와 관련이 있을까?'라는 명제를 들 수 있다.
✅ 다변량: 두 개 이상의 변수를 측정하여 얻어지는 값
'빅데이터분석기사' 카테고리의 다른 글
[빅데이터분석기사 필기] 기술통계(2) (0) | 2025.03.03 |
---|---|
[빅데이터분석기사 필기] 기술통계(1) (0) | 2025.03.02 |
[빅데이터분석기사 필기] 고급 데이터 탐색 (1) | 2025.03.01 |
[빅데이터분석기사 필기] 데이터 탐색 기초 출제예상문제 오답노트 (0) | 2025.02.28 |
[빅데이터분석기사 필기] 데이터 탐색 기초 (2) | 2025.02.28 |