본문 바로가기

데이터마이닝2

[DataMining] 선형회귀모형 선형회귀모형과 로지스틱 회귀모형은 용도가 다르다. 선형회귀모형은 예측을 위한 회귀모형이고, 로지스틱 회귀모형은 분류를 위한 회귀모형이다. 1. 선형회귀모형의 정의 총 n개의 객체중에 i번째 객체에 대한 연속형 목표변수 값을 $Y_i$라고 한다. 입력변수들의 값을 X1i, X2i, ..., Xpi라고 할 때 선형회귀모형은 아래와 같이 정의할 수 있다. - 상수 $\beta$ 회귀모수(regression parameters) 또는 회귀계수(regression coefficients)라고 한다. - 오차 $\epsilon_i$는 $Y_i$의 근사에서 오차항이라고 한다. - 가정 각 객체들의 오차는 서로 독립(independent)이고 평균이 0인 일정한 분산(constant variance)을 가진 정규분포(.. 2022. 4. 4.
[DataMining] 데이터마이닝이란? 1. 데이터마이닝의 개념 데이터마이닝은 대용량 데이터로부터 이 데이터 안에 존재하는 관계, 패턴 규칙 등을 찾고 모델링해서 유용한 지식을 추출하는 작업이다. 대량의 데이터를 모아서 활용할 수 있고 실시간으로 데이터의 큰 특징을 뽑아내서 분석으로 가치를 창출할 수 있다. 데이터마이닝을 이해하기 위해서는 모수적 모형과 알고리즘 접근 방법을 비교해 봐야 한다. 두 가지 방법중 하나를 사용할 수도 있고 두가지 방법을 다 사용해서 데이터를 분선할 수 있다. 1) 모수적 모형 접근법 모수적 모형 접근법은 모형을 설정하고 단순선형회귀분석과 같이 수치적으로 파라미터를 찾아내서 데이터를 적합하는 것이다. 로지스틱 회귀모형, 선형 회귀 분석, 나이브베이즈, 단순 신경망 등에 쓰인다. 장점 - 더 단순하기 때문에 결과를 이.. 2022. 4. 3.
728x90
반응형
LIST