2025/04/02 5

회귀모델의 진단: 영향값과 이상값 진단방법

🚀 모델 진단(Model Diagnostic)- 선형성, 독립성, 정규성, 등분산성 진단- 다중회귀분석에서는 다중공선성도 확인✅️ 모델 진단구분설명독립변수와 종속변수 간의 선형성- 예측하고자 하는 독립변수 X와 종속변수 Y간에 선형성을 만족하는 특성을 의미- 선형회귀분석에서 중요한 기본 가정(비선형회귀분석에서는 해당하지 않음)오차의 독립성- 예측의 오차값들은 서로 독립적이라는 가정, 예측값의 변화에 따라 오차항이 특정한 패턴을 가져서는 안 됨- 일반적으로 더빈-왓슨(Durbin-Watson) 통계량을 이용하여 독립성을 검정오차의 정규성오차의 분포가 정규분포를 만족하는지 여부샤피로-윌크 검정(Shapiro-Wilk Test)- 오차항이 정규분포를 추종하는지  알아보는 검정으로, 회귀분석에서 모든 독립변수..

연관분석 측정지표: 지지도(Support), 신뢰도(Confidence), 향상도(Lift)

🚀 연관분석(Association Analysis)- 종속변수가 미존재하는 비지도학습의 한 종류, 즈로 거래 구매항복에 존재하는 품목들 간의 연관성 규칙 추론에 사용 ✅️ 연관분석 장점 및 단점구분주요 내용설명장점결과 이해도 높음조건 반응으로 표현되는 연관분석 결과 이해도가 높음종속변수가 없어 유용분석 방향이나 목적이 특별히 없는 경우 유용계산 용이계산이 간단함(지지도, 신뢰도, 향상도)단점연산량 많음계산하는 연산 데이터양이 많음분석 지표 명확화 필요너무 상세한 세분화된 품목을 가지고 규칙을 찾으면 의미 없는 분석(적절한 품목 세분화 필요)충분한 데이터 필요거래량이 적은 품목은 거래수가 적어 규칙 발견 시 제외 필요  ✅️ 연관분석을 위한 3가지 측정지표측정기준수식설명지지도(Support)P(X∩Y)-..

군집분석의 척도: 비유사도 척도, 유사도 척도

🚀 군집분석(Clustering Analysis)- 여러 개체(데이터) 중에서 유사한 속성을 지닌 대상을 몇 개의 집단으로 그룹화한 다음, 각 집단의 성격을 파악함으로써 데이터 전체의 구조에 대해 이해하고자 하는 탐색적 분석 방법- 장점: 탐색적인 기법, 다양한 형태 데이터에 적용 가능, 분석 방법에 적용 용이- 단점: 분석자에 의해 결과가 달라질 수 있음, 가중치 및 거리의 정의가 어려움, 초기 군집 수 K 결정이 어려움(비계층적 군집화) ✅️ 군집분석 다차원 변수의 유사도 및 유사도계수 기반 분류구분주요 내용설명비유사도(거리 기반)유클리드거리(Euclid Distance)- 다차원 분산형 차트에서 변수값 쌍의 관계 표현, 두 점의 직선거리, 기하학적 최단거리마할라노비스 거리(Mahalanobis)-..

카테고리 없음 2025.04.02

기울기 소멸 문제(Vanishing Gradient Problem) 및 해결 방법

🚀 기울기 소멸 문제- 기울기 소멸 문제: 역전파 알고리즘으로 가중치를 수정할 때, 은닉층으로 오차가  거의 전달되지 않는 문제- 인공신경망 활성화 함수의 출력값이 곱해지다 보면 가중치에 따른 결과값의 기울기가 0이 되어버림- 인공지능 2차 암흑기의 주요 원인 (1차: 퍼셉트론의 한계, 계산 자원의 부족) ✅️ 기울기 소멸 문제의 주요 발생 원인구분발생 원인시그모이드 함수의 사용- 시그모이드 함수는 0과 1사이의 값을 출력- 역전파 알고리즘을 수행하기 위해 결사하강법을 이용하여 은닉층의 출력값을 미분하게 되는데 표현값은 0~0.25 사이의 값으로 전달- 따라서 미분 계속 반복 시 0에 가까운 값 되어 가중치를 학습하지 못함- 하이퍼볼릭탄젠트(Tanh) 함수 또한 동일 현상 발생초기 파라미터(가중치) 정..

인공신경망 활성화 함수(Active Function) 종류

🚀 은닉층의 활성화 함수 종류- 입력된 데이터의 가중합을 출력신호로 변환하여, 은닉층의 출력값을 특정 범위의 실수값으로 정규화- 은닉층과 출력층 사이에서 각 출력값을 제한, 은닉층에서 사용되는 활성화 함수구분수식도식설명항등 함수(=선형 함수)(Identity Function)입력값을 그대로 출력하는 선형 함수. 주로 회귀 문제에서 사용됨계단 함수(Step function)임계값을 기준으로 출력을 0 또는 1로 결정. 신경망 초창기 모델에서 사용되었으나, 역전파 불가능 문제로 잘 사용되지 않음부호 함수(Sign Function) 입력의 부호에 따라 -1, 0, 1로 출력. 퍼셉트론에서 사용되었으나, 미분 불가능 문제로 잘 사용되지 않음시그모이드 함수(로지스틱 함수)(Sigmoid Function) 출력을..