우리는 언제나 미래를 궁금해 하고 미래의 불확실성을 없애고 싶어한다.
리매를 예측해서 미리 예방을 하거나 합리적이고 효율적인 의사결정을 하기 위해 예측이 필요하다.
예측 결과는 시간이 지나면서 실제 결과와 비교된다. 예측 결과와 실제 결과와의 차이를 예측오차라고 하며 이것을 줄이기 위해 노력하고 있다.
예측 사례를 보면
생활과 가장 밀접한 기상예측은 오차가 적을 때도 있고 클 때도 있지만 확률을 통해 예측을 한다.
통계청에서는 저출생 고령화의 우려로 인구를 예측하기 위해 인구수의 추세를 계산한다. 이 때 범위예측을 사용한다.
한국은행에서는 1년에 4회 분기별로 경제성장률을 예측한다. 기간이 멀어질수록 불확실성이 커지기 때문에 fan chart band도 늘어나게 된다.
구글에서는 검색데이터를 분석해서 준실시간으로 분석 결과를 확인할 수 있어서 최근 트랜드를 알 수 있다.
이 외에도 선거 결과 예측, 월드컵 같은 스포츠 결과 예측, 로또 번호 예측 등 인간의 기본적인 활동이다.
예측 과정
예측 목표 수립 -> 예측 관련 정보 수집 -> 예측의 실시 -> 예측의 평가
- 예측정보 : 수치정보와 판단정보
- 수치정보가 충분하다면 객관적 예측을 하게 된다.
- 수치정보가 부족하거나 모형을 만들기 어렵다면 전문가의 자문을 더해 판단정보를 통해 예측을 하게 된다.
예측 방법
- 주관적 예측 : 전문가들이 경험 또는 느낌을 바탕으로 실시하는 예측이다. 많은 사람에 의해 실시되고, 이중 몇 사람의 예측은 항상 객관적 예측보다 훨씬 우월하다.
- 객관적 예측 : 변수들의 관계를 수리(통계) 모형으로 표현하고, 이 관계가 미래에도 지속될 것으로 보고 실시하는 예측이다. 이론적 근거를 제시핛 뿐만 아니라 예측에 따른 오차에 대한 통계적 관리가 가능하다.
예측은 주관적 예측+객관적 예측을 합쳐서 하게 된다.
예측 오류 사례
1987 블랙먼데이 예측
2008 글로벌 금융위기 예측
블랙스완
주관적 예측방법
1. 주관적 예측방법
주관적 예측은 전문가들이 통찰력, 식견, 영감을 바탕으로 실시한다.
2. 델파이 방법
델파이 방법(Delphi method)은 전문가 집단의 의견을 종합하여 합의적인 판단을 도출하는 방법이다.
- 전문가 집단 구성
- 전문가 집단에 예측설문조사
- 조사결과를 전문가 집단에 제공
- 전문가 집단의 예측 수정
- 예측결과의 합의
3. 주관적 예측의 문제점
- 전문가의 느낌으로만 정도 높은 예측이 어렵다.
- 전문가 선정이 어렵다.
- 전문가의 성실한 답변 여부 확인이 어렵다.
4. 주관적 예측의 사례
객관적 예측방법
1. 예측모형의 종류
객관적 예측에서는 통계학 이론을 바탕으로 하여 수리적 함수와 오차로 구성된 예측모형을 이용한다.
예측모형은 이론 모형과 비이론 모형으로 구분한다.
2. 이론 예측모형
이론을 바탕으로 작성되며 단일방정식 모형과 연립방정식 모형으로 구분한다.
1) 단일방정식
$Y_t = \alpha + \beta X_t + \epsilon_t$
ex) 경제규모( Y )가 인구 규모( X )에 비례해서 커지는 경향을 모형화
2) 연립방정식 모형
$C_t = \alpha + \beta Y_t + \gamma C_{t-1} + \epsilon_t$
$Y_t = C_t + Z_t$
소득(Y)은 소비지출(C)에 영향을 주며 소비지출은 기타요인(Z)과 함께 소득을 결정한다.
3. 비이론 예측모형
변수내 또는 변수들간에 어떤 특정한 관계가 앞으로도 지속될 것으로 보고 만든 모형이다.
- 시계열 모형 : 과거의 패턴 및 경제변수간 관계를 바탕으로 작성한다.
-> 단기예측에는 우수하나 이론적 근거가 취약하여 장기예측과 정책효과를 측정에는 취약하다.
$Y_t = Y_{t-1} + \epsilon_t$
시나리오 예측
1. 시나리오 예측이란?
미래에 일어날 수 있는 여러가지 상황을 고려하여 몇 개 시나리오를 만들고
이에 따라 시나리오별 복수의 예측을 하여 단순히 과거를 연장하는 방식의 예측을 보완한다.
ex) 소련붕괴, 쉘의 1973 유가급등
2. 시나리오 예측의 필요성
장기예측의 경우 불확실성이크기 때문에 하나의 값으로 미래 예측이 어렵다.
예측모형작성과 평가
1. 예측모형 작성 3단계
모형의 식별 => 모형의 추정 => 모형의 진단
2. 예측의 종류
3. 예측의 평가
실제값과 예측값의 차이를 바탕으로 한 통계량을 이용한다.
- RMSE(root mean square error)
- RMS%E(root mean square percent error)
'Data Science > Forecasting' 카테고리의 다른 글
[Forecasting] 부분자기상관과 시계열의 주파수 분석 (0) | 2022.04.20 |
---|---|
[Forecasting] 예측 데이터 분석의 기초 (10) | 2022.04.07 |
[Forecasting] 예측 데이터 (3) | 2022.04.06 |
댓글