Hồi quy tuyến tính đa biến là một phương pháp thống kê được sử dụng để mô hình hóa mối quan hệ giữa một biến phụ thuộc và hai hoặc nhiều biến độc lập bằng cách khớp một phương trình tuyến tính với dữ liệu quan sát được. Hồi quy tuyến tính đa biến giải thích cách một số biến dự báo đồng thời ảnh hưởng đến một biến kết quả.
Các thành phần chính của hồi quy tuyến tính đa biến:
- Biến phụ thuộc (Y): Đây là biến mà chúng ta muốn dự đoán. Nó thường được gọi là "biến mục tiêu" hoặc "biến phản hồi".
- Các biến độc lập (X1, X2, ..., Xn): Đây là các biến mà chúng ta sử dụng để dự đoán biến phụ thuộc. Chúng thường được gọi là "biến dự báo" hoặc "biến giải thích".
- Mô hình hồi quy: Phương trình của hồi quy tuyến tính đa biến có dạng sau:
Y = beta_0 + beta_01* X1 + beta_2*X2 + ... + beta_n* Xn
trong đó:
Y là biến phụ thuộc. X1, X2, ..., Xn là các biến độc lập.
beta_0 là hằng số (hệ số chặn). beta_1, beta_2, ..., beta_n là các hệ số hồi quy biểu thị ảnh hưởng của các biến độc lập tương ứng lên biến phụ thuộc.
Ứng dụng: - Kinh tế (dự đoán thu nhập); - Y tế (phân tích yếu tố rủi ro); - Kỹ thuật; - Khoa học xã hội; - Dự báo kinh doanh.
Ví dụ: Dự đoán giá nhà dựa trên: - Diện tích nhà; - Số phòng ngủ; - Tuổi của nhà
Trong ứng dụng, mỗi đối tượng Object_k (object_1, object_2 ... object_m) được mô tả bởi các biến độc lập (Xk – đặc trưng, i = 1...n) và một biến phụ thuộc (Yk – mục tiêu). Phương pháp bình phương tối thiểu thông thường (OLS) được sử dụng để tính toán các giá trị tối ưu của các hệ số (beta_0, beta_1, beta_2, ..., beta_n). Giá trị mục tiêu được tính bằng:
Y = beta_0 + beta_01 * P1 + beta_2 * P2 + ... + beta_n * Pn
trong đó: P1, P2...Pn là các biến dự báo của mục tiêu. Ứng dụng lưu trữ dữ liệu cho nhiều mô hình hồi quy trong cơ sở dữ liệu (DB) loại SQLite có tên AppMultipleLinearRegression.db. Các mô hình hồi quy được phân biệt bằng tên.
Màn hình khởi động của ứng dụng (App Multiple Linear Regression Solver) hiển thị danh sách các mẫu mô hình hồi quy (trong danh sách xoay) và các nút để kích hoạt các chức năng tạo (Mẫu mới), tải (Tải), lưu (Lưu), lưu dưới dạng (Lưu dưới dạng), tính toán (Tính toán) và xóa (Xóa) các mẫu mô hình hồi quy. Từ màn hình chính, thông qua các phần tử menu, bạn cũng có thể truy cập các chức năng như chọn ngôn ngữ, lưu và sao chép cơ sở dữ liệu, khởi tạo cơ sở dữ liệu với dữ liệu mẫu và các chức năng phụ trợ như trợ giúp ứng dụng, cài đặt và liên kết đến trang web mô tả tất cả các ứng dụng của tác giả. Các chức năng tạo (Mẫu mới) bao gồm hộp thoại nhập kích thước ma trận nơi nhập dữ liệu của mẫu mới – số hàng (số hàng bao gồm dữ liệu dự đoán P1, P2,...Pn – hàng cuối cùng) và số cột (số cột bao gồm dữ liệu phụ thuộc Y1, Y2,...Yk – cột cuối cùng). Sau đó, bảng được tạo để nhập dữ liệu liên quan. Bảng đã điền phải được đặt tên trước khi lưu. Chức năng Tải sẽ xóa bảng.
Bảng đã lưu cũ có thể được hiển thị bằng cách chọn từ danh sách xoay. Bảng hiển thị có thể được tính toán và kết quả sẽ xuất hiện trong hộp thoại Kết quả ứng dụng. Chức năng In có thể được thực thi từ hộp thoại này vào tệp AppMultipleLinearRegressionSolver.txt. Chức năng In bao gồm hoạt động Lưu cơ sở dữ liệu/Lưu tệp, trong đó chọn thư mục để lưu tệp. Sau khi chọn thư mục, nút lưu sẽ xuất hiện. Từ cùng hoạt động đó, có thể hiển thị nội dung của tệp đã chọn, đổi tên tệp hoặc thư mục, tạo thư mục mới và cũng có thể xóa tệp đã chọn.
Hồi quy tuyến tính đa biến là một công cụ phân tích dữ liệu mạnh mẽ, nhưng nó phải được sử dụng thận trọng và hiểu rõ những hạn chế của nó. Nhược điểm: Nhạy cảm với hiện tượng đa cộng tuyến (mối tương quan mạnh giữa các biến độc lập). Không phải lúc nào cũng nắm bắt được các mối quan hệ phi tuyến tính. Cần phải thẩm định và kiểm tra kỹ lưỡng các giả định.
Lần cập nhật gần đây nhất
6 thg 3, 2026