Analysis Time series data Mining

Analysis Time series data Mining

fandyofficialltutorial.com
Tuesday, October 18, 2016

Jenis-jenis data  dalam teori analisis time series
  • Cross sectional
    artinya itu data yang dikumpulkan dalam satu waktu. Contoh:data PDB Indonesia berdasarkan provinsi tahun 2012
  • Time series
    artinya data yang dikumpulkan dalam satu series waktu. Contoh: data PDB Indonesia tahun 1997-2012
  • Panel 
    merupakan data gabungan cross sectional dan time series. Contoh: data PDB Indonesia berdasarkan provinsi tahun 1997-2012


untuk kali ini kita akan membahas data time series, untuk data cross sectional mungkin dah sering dengan analisis regresi. sedangkan untuk data panel mungkin tingkatannya lebih tinggi, jadi ane belom bahas. masalahnya  belum belajar gan.


Inti dari belajar TS adalah forecasting. Dalam metode forecasting dapat digolongkan sebagai berikut: 


Disini kita akan focus untuk bagian sebelah kiri yaitu time series method. Selain itu, dalam time series hal yang perlu diperhatikan yaitu jenis datanya. Jenis data ini sangat berpengaruh bagaimana kita menggunakan metode yang tepat pada setiap jenis data.


Berikut jenis data time series dan metode forecesting:

1. Data Stasioner



Data stasioner terjadi bila data berfluktuasi di sekitar rata-rata dan varian yang konstan seperti pada gambar diatas.
Contoh: Data penjualan mobil yang konstan

Metode yang dapat digunakan:

  • Naïve Models 
  • Simple Averages 
  • Moving Averages 
  • Single Exponential Smoothing


2. Data Trend

  

Data Trend erjadi bilamana kenaikan atau penurunan sekuler jangka panjang dalam data. Contoh: penigkatan PDB indonesia dari tahun ke tahun


Metode yang dapat digunakan:


  • Naïve models
  • Double Moving Averages
  • Double Exponential Smothing


3. Data Siklus


  
Data ini terjadi bila data dipengaruhi oleh fluktuasi.

Metode yang dapat digunakan data siklus:


  • Naïve Models
  • Winter’s Model


4. Data Musiman



Data dikatakan data musiman jika terjadi bilamana suatu deret dipengaruhi oleh faktor musiman. Contoh: data produksi durian.


Metode yang dapat digunakan untuk data musiman:


  • Naïve Models
  • Winter’s Model


Selain metode diatas ada satu metode lagi yang paling sering digunakan. Karena kelebihannya yang dapat digunakan hamper di semua jenis data TS yaitu ARIMA(box-jenkins). Untuk semua metode yang saya sebutkan tidak akan saya bahas pada postingan kali ini saya akan melanjutkan di postingan selanjutnya.


Metode-metode diatas memiliki kekurangan dan kelebihan tersendiri. Tapi, untuk menentukan model yang terbaik kita dapat melakukan beberapa pendekatan. Berikut ada beberapa cara untuk melihat model terbaik yang dapat digunakan:


  • MSE(mean square error)/MSD 
  • MAD(mean absolute deviation) 
  • MAPE(mean absolute percentage error)





Yang perlu diperhatikan model dikatakan baik ketika nilai tersebut yang paling kecil. Biasanya dalam melakukan analisis pada software statistic biasanya ada output seperti itu. Jadi, tidak perlu susah-susah.