Text
Pemanfaatan Large Language Models(LLMs) untuk Peramalan Probabilistik Penjualan Ritel di Indonesia
Penelitian ini mengevaluasi efektivitas Large Language Models (LLMs) dalam peramalan probabilistik Indeks Penjualan Ritel di Indonesia. Data yang dianalisis berupa indeks penjualan ritel bulanan dari Bank Indonesia, mencakup periode Januari 2012 hingga Januari 2025 untuk tujuh kategori produk. Berbagai model peramalan deret waktu dikembangkan menggunakan AutoGluon Time Series, termasuk baseline model (SeasonalNaive), model machine learning tabular (Recursive Tabular dan Direct Tabular), model statistik klasik (AutoETS, Dynamic Optimized Theta, dan NPTS), model deep learning (Temporal Fusion Transformers, PatchTST, TiDE, dan DeepAR), serta model berbasis transformer dari keluarga Chronos dan Chronos Bolt. Penelitian ini membandingkan performa model LLM (dengan pendekatan zero-shot dan fine-tuning) dengan model non-LLM (menggunakan pendekatan auto-tuning dan manual-tuning). Seluruh model dievaluasi menggunakan tujuh metrik: Scaled Quantile Loss (SQL), Weighted Quantile Loss (WQL), Mean Absolute Error (MAE), Mean Squared Error (MSE), Root Mean Squared Error (RMSE), Mean Absolute Percentage Error (MAPE), dan Symmetric MAPE (SMAPE). Model Chronos [base] yang telah difine-tune menunjukkan kinerja terbaik secara keseluruhan dengan hasil kesalahan terendah: SQL = 0,274, WQL = 0,136, MAE = 0,184, MAPE = 0,267, MSE = 0,059, RMSE = 0,243, dan SMAPE = 0,218. Hasil ini menunjukkan potensi besar dari model berbasis LLM dalam meningkatkan akurasi peramalan penjualan ritel di Indonesia, khususnya dalam menangkap tren jangka panjang, meskipun tantangan masih ada dalam memodelkan fluktuasi jangka pendek.
No other version available