Skip to main content

One post tagged with "ARIMA"

View All Tags

Dự báo chuỗi thời gian với mô hình ARIMA

· 2 min read

Mô hình ARIMA (AutoRegressive Integrated Moving Average) là một trong những phương pháp phổ biến để dự báo chuỗi thời gian. Trong bài viết này, chúng ta sẽ thực hiện xây dựng mô hình ARIMA để phân tích dữ liệu Close của cổ phiếu.

1️⃣ Cài đặt thư viện cần thiết

Trước tiên, chúng ta cần cài đặt thư viện statsmodels nếu chưa có:

pip install statsmodels pandas numpy

2️⃣ Xây dựng mô hình ARIMA

Dưới đây là các bước chính để xây dựng mô hình ARIMA:

from statsmodels.tsa.arima.model import ARIMA
import pandas as pd


# Dữ liệu mẫu (có thể thay thế bằng dữ liệu thực tế)
data = pd.DataFrame({
'Datetime': ["2025-03-07", "2025-03-10", "2025-03-11", "2025-03-12", "2025-03-13"],
'Close': [26650.0, 26450.0, 26450.0, 26300.0, 26100.0],
'High': [26800.0, 26750.0, 26450.0, 26700.0, 26450.0],
'Low': [26350.0, 26400.0, 26100.0, 26200.0, 26100.0],
'Open': [26500.0, 26700.0, 26300.0, 26500.0, 26350.0],
'Volume': [12984900, 11003400, 12961400, 8814301, 13510500]
})

# Bước 1: Khởi tạo & Xây dựng mô hình ARIMA
model = ARIMA(data['Close'], order=(5, 1, 0)) # Ví dụ với tham số (p, d, q)

# Bước 2: Huấn luyện mô hình

print(model_fit.summary())

# In ra tóm tắt mô hình
print(model_fit.summary())

3️⃣ Giải thích các tham số mô hình ARIMA

Mô hình ARIMA có ba tham số chính (p, d, q):

p (AutoRegressive - AR): Số lượng độ trễ của chuỗi thời gian. d (Differencing - I): Số lần lấy sai phân để làm dừng chuỗi. q (Moving Average - MA): Số bậc của trung bình trượt.

💡 Ví dụ: (5,1,0): Sử dụng 5 độ trễ, lấy sai phân 1 lần, và không có trung bình trượt. (2,1,2): Sử dụng 2 độ trễ, lấy sai phân 1 lần, và 2 bậc trung bình trượt.

📌 Kết luận Mô hình ARIMA là một công cụ mạnh mẽ để dự báo chuỗi thời gian. Tuy nhiên, việc lựa chọn tham số (p, d, q) phù hợp yêu cầu kiểm tra tính dừng của dữ liệu và tinh chỉnh để đạt kết quả tối ưu.

🔥 Ở bài viết tiếp theo, chúng ta sẽ sử dụng ADF Test để kiểm định tính dừng của chuỗi thời gian! 🚀