07. HDFS: 네임노드가 망가지면 정상적인 작동 못함, 범용 하드웨어 사용(확장성)-수평적 확장11. 분석기획 우선순위 고려요소: 중요도, 분석가능성, ROI(Return On Investment)12. CRISP-DM 절차: 업무 이해 → 데이터 이해 → 평가 → 전개13. 빅분단계: 기획 → 데이터 준비 → 데이터 분석 → 모델 평가 → 모델 적용 및 배포19. Nosql DB: MongoDB(doc), DynamoDB(key-val), Cassandra(col)22. 구분자: 쉼표, 세미콜론, 탭 등 데이터 나누는 특정 문자(기호);25. 일변량 이상값 검출방법: IQR(사분위수), 산포도, 3*표준편차26. 평균쪽으로 쏠림=평균 반대쪽으로 꼬리 생28. 분산 변수선택: 분산이 작은 데이터 제거..