[Forecasting] 예측 데이터
1. 시계열의 정의 1) 시계열이란? 시간에 따라서 관측된 자료를 말한다. 관측 시점과 관측시점 사이의 시차간격이 중요하다 $Y_t$ : t=1, 2, 3, ... 시간 t를 하첨자로 표현한다. 2) 횡단면 데이터 3) 시계열의 예 경제 시계열 : 국내총생산(GDP), 소비자 물가지수 등 물리 시계열 : 일일 강수량, 기온, 지짂 발생 건수 등 경영 시계열 : 상품의 판매량, 매출액 인구 시계열 : 총인구, 농가수 통신공학 시계열 : (0,1)-확률과정 사회 시계열 : 교통사고 건수, 범죄발생 수 2. 시계열 도표 시간의 경과에 따라 시계열 값이 변하는 것을 그림으로 나타낸 것이다. 직관적으로 시계열 자료가 가지는 특징을 파악할 수 있다. ex) 1인당 국민소득 3. 시계열의 변동요인 1) 시계열의 정보..
2022. 4. 6.
[Regression] 가중회귀
1. 가중회귀란? 잔차의 분산이 일정하지 않아서 최소제곱법 가정을 사용할 수 없는 경우에 가중회귀를 사용한다. 가중치를 적절하게 부여하여 가중된 잔차 제곱합을 최소화함으로써 분산이 일정한 잔차를 만들어낼 수 있다. 2. 가중회귀분석 평균이 0이고 분산이 σ2인 정규분포라고 가정했을 때 이 오차항의 분산이 오차항마다 다른 경우 이럴 때 가중최소제곱법을 사용하여 가중값을 제곱하여 적합시킨다. > x = c(1, 2, 3, 4, 5) > y = c(2, 3, 5, 8, 7) > w = 1/x > # 가중치를 w로 한 가중회귀모형을 적합시키기 > w.lm = lm(y ~ x, weights=w) > summary(w.lm) Call: lm(formula = y ~ x, weights = w) Weighted R..
2022. 3. 31.