R İle Tek Denklemli Doğrusal Ve Doğrusal Olmayan Zaman Serileri Analizi Hakkında
R ile Tek Denklemli Doğrusal ve Doğrusal Olmayan Zaman Serileri Analizi
Zaman serileri analizi, belirli bir zaman aralığında düzenli aralıklarla toplanan verileri inceleyerek gelecekteki değerleri tahmin etmeyi veya altta yatan örüntüleri anlamayı amaçlayan güçlü bir istatistiksel yöntemdir. Finans, ekonomi, mühendislik, sosyal bilimler gibi pek çok alanda yaygın olarak kullanılır. R programlama dili, geniş paket kütüphanesi ve güçlü görselleştirme yetenekleriyle zaman serileri analizi için oldukça popüler bir tercihtir.
Bu kapsamda, R ile tek denklemli doğrusal (lineer) ve doğrusal olmayan (non-lineer) zaman serisi modellerinin temel prensiplerini ve uygulamalarını inceleyeceğiz.
Zaman Serileri Analizi Nedir?
Bir zaman serisi, belirli bir zaman dilimi boyunca sıralanmış gözlemlerden oluşan bir veri kümesidir. Örneğin, aylık enflasyon oranları, günlük borsa kapanış fiyatları veya saatlik sıcaklık değerleri birer zaman serisidir.
Zaman serileri analizinin temel hedefleri şunlardır:
Tanımlama: Serinin temel özelliklerini, yani trend, mevsimsellik ve döngüsellik gibi bileşenlerini belirlemek.
Açıklama: Serideki değişimin nedenlerini ve diğer değişkenlerle olan ilişkilerini araştırmak.
Tahmin: Gelecekteki değerleri öngörmek.
Kontrol: Serinin davranışını istenen yönde etkileyecek müdahaleleri planlamak.
Doğrusal Zaman Serileri Analizi (Lineer Modeller)
Doğrusal modeller, zaman serisindeki mevcut değeri, geçmişteki değerlerin veya hata terimlerinin doğrusal bir kombinasyonu olarak ifade etmeye çalışır. Bu modeller, genellikle serinin durağan (stationary) olduğu varsayımı altında iyi sonuçlar verir. Durağanlık, bir zaman serisinin ortalamasının, varyansının ve otokorelasyon yapısının zaman içinde sabit kalması anlamına gelir.
Temel Kavramlar
Trend: Serinin uzun dönemli artış veya azalış eğilimi.
Mevsimsellik: Belirli ve düzenli zaman aralıklarında (örneğin, yıllık, aylık) tekrarlayan örüntüler.
Döngüsellik: Belirli bir periyodu olmayan, daha uzun dönemli inişler ve çıkışlar.
Gürültü/Düzensizlik: Serideki açıklanamayan rastgele dalgalanmalar.
Otokorelasyon: Bir gözlemin geçmiş gözlemleriyle olan korelasyonu.
R'da Uygulama Yaklaşımı
R'da zaman serileri analizi için yaygın olarak forecast, tseries, ggplot2, xts ve zoo gibi paketler kullanılır.
İlk adım genellikle zaman serisi verisini R ortamına yüklemek ve bir zaman serisi nesnesine dönüştürmektir. Ardından, serinin trend, mevsimsellik ve rastlantısal bileşenlerini ayırmak için görsel ve istatistiksel yöntemler kullanılır.
Çoğu doğrusal modelin durağanlık varsayımı gerektirmesi nedeniyle, serinin durağan olup olmadığı Görsel Kontrol, Otokorelasyon Fonksiyonu (ACF) ve Kısmi Otokorelasyon Fonksiyonu (PACF) Grafikleri ile veya Birim Kök Testleri (ADF, KPSS gibi) kullanılarak kontrol edilir. Durağanlık sağlanana kadar fark alma (differencing) gibi dönüşümler uygulanabilir.
ARIMA Modelleri (Otoregresif Entegre Hareketli Ortalama)
ARIMA(p, d, q)(P, D, Q)s modeli, zaman serilerindeki otokorelasyonu, fark alma süreçlerini ve mevsimsel bileşenleri ele alan en yaygın doğrusal modellerden biridir.
p: Otoregresif (AR) bileşeninin gecikme sayısı.
d: Fark alma (differencing) sayısı (durağanlık sağlamak için).
q: Hareketli Ortalama (MA) bileşeninin gecikme sayısı.
(P, D, Q)s: Mevsimsel bileşenler (P: mevsimsel AR, D: mevsimsel fark, Q: mevsimsel MA, s: mevsimsel periyot).
Model belirlenirken, auto.arima() gibi fonksiyonlar AIC/BIC gibi bilgi kriterlerini kullanarak otomatik olarak en iyi ARIMA modelini bulabilir. Modelin kalıntıları (hata terimleri) analiz edilerek (örneğin, Ljung-Box testi ile) beyaz gürültü olup olmadığı kontrol edilir.
ETS Modelleri (Üstel Düzeltme Modelleri)
ETS (Error, Trend, Seasonality) modelleri, trend ve mevsimsel bileşenleri üstel düzeltme ile modelleyen bir başka popüler doğrusal zaman serisi modelidir. ARIMA'dan farklı olarak, durağanlık varsayımı gerektirmez ve genellikle otomatik olarak belirlenebilir. Bu modeller de tahminde oldukça etkilidir.
Doğrusal Olmayan Zaman Serileri Analizi (Non-Lineer Modeller)
Doğrusal modeller, çoğu zaman serisini açıklayabilirken, bazı serilerde doğrusal olmayan davranışlar gözlemlenebilir. Bu davranışlar ani sıçramalar, eşik etkileri, asimetrik tepkiler veya değişen volatilite (heteroskedastisite) şeklinde olabilir. Bu durumlarda doğrusal olmayan modellere ihtiyaç duyulur.
Neden Doğrusal Olmayan Modeller Tercih Edilir?
Asimetrik Davranış: Serinin yukarı ve aşağı hareketlere farklı tepkiler vermesi (örneğin, finans piyasalarında düşüşlerin daha hızlı olması).
Eşik Etkileri: Belirli bir eşik değer aşıldığında serinin davranışının aniden değişmesi.
Değişen Volatilite: Serinin varyansının zaman içinde değişmesi. Özellikle finansal getiri serilerinde yaygındır.
Limit Döngüler: Serinin belirli bir aralıkta salınım yapması, ancak tam bir döngü olmaması.
Yaygın Doğrusal Olmayan Model Türleri
R'da doğrusal olmayan zaman serisi analizi için çeşitli paketler ve model türleri mevcuttur:
ARCH/GARCH Modelleri (Otokorelasyonlu Koşullu Heteroskedastisite / Genelleştirilmiş ARCH): Volatilitenin zaman içinde kümelendiği, yani büyük değişimleri büyük değişimlerin, küçük değişimleri küçük değişimlerin takip ettiği seriler için kullanılır. Özellikle finansal getiri serilerinde yaygındır. R'da rugarch paketi bu model için kullanılır.
Eşik Otoregresif (Threshold Autoregressive - TAR) ve Düz Geçişli Otoregresif (Smooth Transition Autoregressive - STAR) Modeller: Serinin farklı eşik değerlerine göre farklı doğrusal süreçler izlediği durumlar için kullanılır. tsDyn paketi bu modellere destek verir.
Markov Geçişli Modeller (Markov Switching Models): Serinin farklı rejimler (states) arasında geçiş yaptığı ve her rejimin farklı bir dinamik gösterdiği durumlar için kullanılır. MSwM gibi paketler kullanılabilir.
Yapay Sinir Ağları (ANN) ve Derin Öğrenme (Deep Learning): Karmaşık doğrusal olmayan ilişkileri yakalayabilen, veri odaklı modellerdir. nnet, tensorflow ve keras gibi genel makine öğrenimi paketleri, zaman serileri için özel adaptasyonlar gerektirir.
Model Seçimi ve Değerlendirme
Doğrusal veya doğrusal olmayan bir model seçerken, sadece modelin karmaşıklığına değil, aynı zamanda verinin yapısına ve tahmin performansına da odaklanılmalıdır.
Model Seçim Kriterleri
Bilgi Kriterleri: AIC (Akaike Bilgi Kriteri) ve BIC (Bayesgil Bilgi Kriteri) gibi kriterler, modelin uyumunu ve karmaşıklığını dengeleyerek en iyi modeli seçmeye yardımcı olur. Daha düşük değerler tercih edilir.
Kalıntı Analizi: Modelin kalıntılarının (tahmin hataları) beyaz gürültü (yani, otokorelasyonsuz, sabit varyanslı ve normal dağılımlı) olup olmadığı kontrol edilir. Ljung-Box testi otokorelasyonu test etmek için yaygın olarak kullanılır.
Out-of-Sample Performans: Modelin eğitim verisi üzerinde ne kadar iyi uyduğunu değil, daha önce görmediği veriler üzerinde ne kadar iyi tahmin yaptığını değerlendirmek önemlidir. Bunun için RMSE (Root Mean Squared Error) ve MAE (Mean Absolute Error) gibi hata metrikleri kullanılır.
Görsel Uyum: Tahminlerin gerçek verilerle görsel olarak ne kadar uyumlu olduğuna bakmak, modelin performansını sezgisel olarak anlamaya yardımcı olur.
Sonuç
R, tek denklemli doğrusal ve doğrusal olmayan zaman serileri analizi için kapsamlı ve esnek araçlar sunar. Doğrusal modeller (özellikle ARIMA ve ETS), birçok zaman serisi problemi için güçlü ve güvenilir tahminler sağlarken, doğrusal olmayan modeller (GARCH, TAR gibi) serideki daha karmaşık, asimetrik ve eşik tabanlı davranışları yakalamak için vazgeçilmezdir.
Doğru modelin seçimi, serinin doğasına, analizin amacına ve beklenen tahmin performansına bağlıdır. Her zaman serisi projesinde, veriyi dikkatlice görselleştirmek, durağanlık varsayımlarını test etmek ve modelin kalıntılarını analiz etmek, güvenilir ve isabetli sonuçlar elde etmek için kritik adımlardır.
Zaman serileri analizi yolculuğunuzda R'ın sunduğu bu geniş imkanları keşfetmeye hazır mısınız?