본문 바로가기

공부/데이터

(10)
상관도 분석에 사용되는 방법: 피어슨/스피어만 순위/켄달 순위 상관계수 상관도 분석의 중요성상관도 분석은 데이터 과학, 통계학, 사회과학 등 다양한 분야에서 중요한 도구이다. 이 분석을 통해 우리는 두 변수 간의 관계를 이해하고, 이를 바탕으로 더 복잡한 분석이나 예측 모델을 구축할 수 있다. 상관 분석은 변수들 사이의 연관성을 파악하고, 이를 통해 데이터에 숨겨진 패턴과 인사이트를 발견하는 데 중요한 역할을 한다. 상관 분석의 정의 및 방법상관 분석은 두 변수 간의 관계의 강도와 방향을 측정하는 통계적 방법이다. 이는 변수들 사이의 선형적 또는 비선형적 관계를 파악하는 데 사용된다. 이러한 분석을 수행하기 위해 주로 사용되는 세 가지 기법이 있다: 피어슨 상관 계수, 스피어만 순위 상관 계수, 그리고 켄달 순위 상관 계수. 각각의 방법은 데이터의 특성과 분석 목적에 따라 ..
차원축소기법, 데이터의 복잡성을 단순화하는 접근법 차원축소란? 차원 축소는 고차원의 데이터를 저차원의 데이터로 변환하는 과정이다. 이 과정을 통해 데이터의 핵심적인 특성을 유지하면서, 계산의 복잡성을 줄이고, 데이터를 시각화하기 쉽게 만든다. 차원 축소는 주로 빅데이터 분석, 시각화, 그리고 기계 학습 모델의 성능 향상을 위해 사용된다. 차원의 저주 고차원 데이터는 '차원의 저주'라는 문제를 일으킨다. 이는 데이터의 차원이 증가함에 따라, 필요한 데이터의 양이 기하급수적으로 증가하고, 모델의 성능이 저하될 수 있다. 차원 축소는 이러한 문제를 완화하는 데 도움이 된다. 주요 차원 축소 알고리즘 1. 주성분 분석 (PCA) 개념: 데이터의 분산을 최대로 보존하는 축을 찾아, 고차원 데이터를 저차원으로 투영한다. 사용 분야: 데이터 시각화, 노이즈 필터링,..