본문 바로가기

Data Science/Data Mining3

[DataMining] 로지스틱회귀모형 로지스틱 회귀모형이란? 목표변수가 두 개의 범주를 가진 이항형인 경우 선형회귀모형을 적용하면 0 또는 1과 다른 예측값을 얻거나 범위를 넘어선 값이 나올 수도 있다. 이것을 방지하기 위해 목표변수의 값이 1인 확률의 로짓변환과 입력변수들의 선형함수 관계로 나타내는 로지스틱 회귀모형을 사용하게 된다. 예를 들어 목표변수의 두 범주 값 ‘신용이 좋다’는 1, ‘신용이 나쁘다’는 0인 경우에 로지스틱 회귀모형이 필요하고 목표변수가 두 값 중에 하나("실패" 0과 "성공" 1 중에 주로 "성공" 1)를 가지는 확률을 모형화 한다. 1. 로지스틱회귀모형의 정의 총 n의 객체(subject) 중에 i번째 객체에 대한 두 개의 범주(성공 또는 실패)를 가지는 이항형 목표변수 값을 $Y_i$로 두고 입력변수들의 값을 .. 2022. 4. 5.
[DataMining] 선형회귀모형 선형회귀모형과 로지스틱 회귀모형은 용도가 다르다. 선형회귀모형은 예측을 위한 회귀모형이고, 로지스틱 회귀모형은 분류를 위한 회귀모형이다. 1. 선형회귀모형의 정의 총 n개의 객체중에 i번째 객체에 대한 연속형 목표변수 값을 $Y_i$라고 한다. 입력변수들의 값을 X1i, X2i, ..., Xpi라고 할 때 선형회귀모형은 아래와 같이 정의할 수 있다. - 상수 $\beta$ 회귀모수(regression parameters) 또는 회귀계수(regression coefficients)라고 한다. - 오차 $\epsilon_i$는 $Y_i$의 근사에서 오차항이라고 한다. - 가정 각 객체들의 오차는 서로 독립(independent)이고 평균이 0인 일정한 분산(constant variance)을 가진 정규분포(.. 2022. 4. 4.
[DataMining] 데이터마이닝이란? 1. 데이터마이닝의 개념 데이터마이닝은 대용량 데이터로부터 이 데이터 안에 존재하는 관계, 패턴 규칙 등을 찾고 모델링해서 유용한 지식을 추출하는 작업이다. 대량의 데이터를 모아서 활용할 수 있고 실시간으로 데이터의 큰 특징을 뽑아내서 분석으로 가치를 창출할 수 있다. 데이터마이닝을 이해하기 위해서는 모수적 모형과 알고리즘 접근 방법을 비교해 봐야 한다. 두 가지 방법중 하나를 사용할 수도 있고 두가지 방법을 다 사용해서 데이터를 분선할 수 있다. 1) 모수적 모형 접근법 모수적 모형 접근법은 모형을 설정하고 단순선형회귀분석과 같이 수치적으로 파라미터를 찾아내서 데이터를 적합하는 것이다. 로지스틱 회귀모형, 선형 회귀 분석, 나이브베이즈, 단순 신경망 등에 쓰인다. 장점 - 더 단순하기 때문에 결과를 이.. 2022. 4. 3.
728x90
반응형
LIST