[틀린 문제]
02. 탐색적 데이터 분석(EDA)의 목적에 대한 설명으로 가장 부적절한 것은?
① 데이터에 대한 전반적인 이해를 통해 분석 가능한 데이터인지 확인하는 단계이다.
② 탐색적 데이터 분석 과정은 데이터에 포함된 변수의 유형이 어떻게 되는지를 찾아가는 과정이다.
③ 데이터를 시각화하는 것만으로는 이상점(Outlier) 식별이 잘 되지 않는다.
④ 알고리즘이 학습을 얼마나 잘 하느냐 하는 것은 전적으로 데이터의 품질과 데이터에 담긴 정보량에 달려 있다.
✅ 4번도 문제가 참... 전적으로 데이터에 달려 있진 않고 알고리즘의 구조와 선택, 하이퍼파라미터 튜닝 등 있잖아요...
33. 다음 중 데이터시각화 방법에 대한 설명으로 가장 적절한 것은?
① 데이터 시각화는 탐색적 데이터 분석에서 선택 과정으로 수치 기반의 복잡한 분석보다 직관적으로 통찰력을 얻을 수 있는 장점이 있다.
② 관계시각화의 방법은 스케터플롯, 버블차트, 히스토그램이 대표적이다.
③ 시각화 방법에는 시간, 분산, 관계, 비교, 공간시각화로 구분할 수 있다.
④ 인간의 정보 처리 능력을 단편화하여 정보를 직관적으로 이해할 수 있다.
✅ 1번: 선택이 아니라 필수 과정, 2번 히스토그램은 분포에 가깝지 않나..?
✅ 시각화 방법: 비교(Comparison), 관계(Relationship), 분포(Distribution), 구성(Composition), 공간(Geospatial)
34. 다음 중 정보시각화 방법과 유형의 연결이 올바르지 않은 것은?
① 시간시각화: 막대그래프, 누적막대그래프, 점그래프
② 분포시각화: 파이차트, 도우넛차트, 트리맵, 누적연속그래프
③ 공간시각화: 스케터플롯, 버블차트
④ 비교시각화: 히트맵, 체르노페이스, 스타차트, 평행좌표계
✅ 관계시각화: 스케터플롯, 버블차트
40. 상자그림에 대한 설명으로 부적절한 것은?
① 중위수는 상자 안에 선으로 표시되며, 관측치의 절반은 이 값보다 크거나 같고 절반은 작거나 같다.
② 사분위간 범위 상자는 데이터의 중간 50%를 보여주며, 1사분위수와 3사분위수 간의 거리를 보여준다.
③ 수염은 이상치를 제외하고 데이터 값의 하위 25%, 상위 25%의 범위를 나타낸다.
④ 상자그림에서는 그룹의 산포를 알 수 있으며, 그룹 간의 차이가 통계적으로 유의한지 여부도 확인할 수 있다.
✅ 3번 이상치를 제외함!
42.히스토그램은 표로 되어 있는 도수분포표를 그래프로 나타낸 것이다. 다음 중 히스토그램에 대한 설명으로 부적절한 것은?
① 히스토그램에서는 가로축이 계급, 세로축이 도수를 나타낸다. 계급은 보통 변수의 구간이며, 서로 겹치지 않는다.
② 히스토그램은 표본의 크기가 작아도 각 막대의 높이가 데이터 분포의 형상을 잘 표현해낸다.
③ 히스토그램의 분포로 어떤 구간의 데이터가 가장 많은지를 예측할 수 있다.
④ 막대그래프는 가로를 생각하지 않지만, 히스토그램은 가로와 세로를 모두 생각해야 한다.
✅ 문제가 진짜 별로.. 막대그래프도 가로를 생각해야하지 않나? 순서가 중요하지 않을 뿐..
[헷갈린 문제]
08. 공분산의 수식으로 가장 알맞은 것은?
① 공분산 수식
② 피어슨 상관계수
③ 스피어만 순위 상관계수
④ 켄달 순위 상관계수
25. 다음 중 평균에 대한 설명으로 가장 옳지 않은 것은?
① 평균은 관측치의 절대 크기의 중앙이므로 모든 관측치를 저한 값을 관측값의 개수(n)로 나눈 값을 의미한다.
② 평균값과 관측치 값이 같을 수 있다.
③ 소수의 극단치에 영향을 받지 않는다.
④ 극단치가 존재하지 않으면 평균과 중앙값은 거의 일치한다.
✅ 1번 절대 크기의 중앙? 무슨 말이지 표현이 굉장히 모호하고, 문제가 점점 별로라는 것을 느낀다..
31. 다음 중 오른쪽으로 긴 꼬리를 갖는 분포의 왜도로 가장 적합한 것은?
① 왜도 < 0
② 왜도 = 0
③ 왜도 > 0
④ 왜도 = 1
✅ 3차 적률이 큰 양수값이 돼서 0보다 큼!
39. 시각적 데이터 탐색의 그래프에 대한 설명 중 틀린 것은?
① 막대그래프는 막대의 높이가 특정 집계에 비례하여 계급을 비교하기 위해 주로 사용되는 그래프이다.
② 선그래프는 선의 기울기가 완만할수록 변화가 크다는 것을 의미한다.
③ 도수다각형은 연결된 직선의 모양 떄문에 꺽은선그래프라고 한다.
④ 도수분포표이 계급의 수와 간격이 변하면 히스토그램의 모양도 변한다.
✅ 도수다각형 = 꺽은선그래프
'빅데이터분석기사' 카테고리의 다른 글
[빅데이터분석기사 필기] 고급 데이터 탐색 출제예상문제 오답노트 (0) | 2025.03.01 |
---|---|
[빅데이터분석기사 필기] 고급 데이터 탐색 (1) | 2025.03.01 |
[빅데이터분석기사 필기] 데이터 탐색 기초 (2) | 2025.02.28 |
[빅데이터분석기사 필기] 분석 변수 처리 출제예상문제 오답노트 (0) | 2025.02.27 |
[빅데이터분석기사 필기] Day8: 분석 변수 처리 (0) | 2025.02.27 |