본문 바로가기

Data Science/Forecasting4

[Forecasting] 부분자기상관과 시계열의 주파수 분석 부분자기상관 1. 표본부분자기상관계수 1) 시계열 $Z_{t+h}$로부터 $Z_{t+1}$, ..., $Z_{t+h-1}$의 영향력을 제거 2) 시차가 h인 표본부분자기상관계수 2. 부분상관도표 x축 시차(h) , y축 표본부분자기상관계수 -> 부분자기상관계수가 유의적으로 0과 다른지 검정한다 검정을 위해서는 분포가 필요하다. 1) 백색잡음계열 2) 시계열의 주파수 분석 1. 시계열의 주파수 정보 시계열은 특정한 주기의 변동들이 모여서 만들어진다. - 주기가 긴 시계열은 저주파 변동을 가진 시계열이다. - 주기가 짧은 시계열은 고주파 변동을 가진 시계열이다. 2. 삼각함수 주기를 잘 대표할 수 있도록 측정하는 것이 삼각함수다. 3. 시계열의 주파수 정보 - 시계열 $f$ :주파수즉단위시간당순환의수를의미 .. 2022. 4. 20.
[Forecasting] 예측 데이터 분석의 기초 시계열의 요약 1. 시계열의 중심측도 - 표본평균 - 중앙값 크기순으로 나열할 때 중앙의 값이다. 특이값이 있을 경우 영향을 줄이기 위해 중앙값을 찾아서 평균을 계산하는데 도움을 준다. - 최빈값 빈도가 가장 많은 값이다. 투표결과처럼 가장 많이 출현한 데이터를 측정한다. 2. 시계열의 산포 - 표본분산 - 표본 표준편차 - 사분위편차 특이값의 영향을 줄이기 위해 중심값을 확인하여 보정하는 것이다. 3. 시계열의 사례 - 경제성장률 추이 GDP는 계절조정계열과 원계열 두가지 형태로 발표된다. 경제성장률은 계정조정계열의 전기대비 증감률로 확인한다. 시계열의 분포 1. 시계열분포란? 시계열 값들이 얼마나 퍼져있고 공통점을 가지고 있는지 개형을 파악하는 것이다. - 히스토그램(histogram) - 확률밀도함.. 2022. 4. 7.
[Forecasting] 예측 데이터 1. 시계열의 정의 1) 시계열이란? 시간에 따라서 관측된 자료를 말한다. 관측 시점과 관측시점 사이의 시차간격이 중요하다 $Y_t$ : t=1, 2, 3, ... 시간 t를 하첨자로 표현한다. 2) 횡단면 데이터 3) 시계열의 예 경제 시계열 : 국내총생산(GDP), 소비자 물가지수 등 물리 시계열 : 일일 강수량, 기온, 지짂 발생 건수 등 경영 시계열 : 상품의 판매량, 매출액 인구 시계열 : 총인구, 농가수 통신공학 시계열 : (0,1)-확률과정 사회 시계열 : 교통사고 건수, 범죄발생 수 2. 시계열 도표 시간의 경과에 따라 시계열 값이 변하는 것을 그림으로 나타낸 것이다. 직관적으로 시계열 자료가 가지는 특징을 파악할 수 있다. ex) 1인당 국민소득 3. 시계열의 변동요인 1) 시계열의 정보.. 2022. 4. 6.
[Forecasting] 예측이란? 우리는 언제나 미래를 궁금해 하고 미래의 불확실성을 없애고 싶어한다. 리매를 예측해서 미리 예방을 하거나 합리적이고 효율적인 의사결정을 하기 위해 예측이 필요하다. 예측 결과는 시간이 지나면서 실제 결과와 비교된다. 예측 결과와 실제 결과와의 차이를 예측오차라고 하며 이것을 줄이기 위해 노력하고 있다. 예측 사례를 보면 생활과 가장 밀접한 기상예측은 오차가 적을 때도 있고 클 때도 있지만 확률을 통해 예측을 한다. 통계청에서는 저출생 고령화의 우려로 인구를 예측하기 위해 인구수의 추세를 계산한다. 이 때 범위예측을 사용한다. 한국은행에서는 1년에 4회 분기별로 경제성장률을 예측한다. 기간이 멀어질수록 불확실성이 커지기 때문에 fan chart band도 늘어나게 된다. 구글에서는 검색데이터를 분석해서 준.. 2022. 4. 5.
728x90
반응형
LIST