多元线性回归是一种统计方法,它通过将线性方程拟合到观测数据,来模拟一个因变量与两个或多个自变量之间的关系。多元线性回归解释了多个预测变量如何同时影响结果变量。
多元线性回归的主要组成部分:
- 因变量 (Y):这是我们想要预测的变量。它通常也称为“目标变量”或“响应”。
- 自变量 (X1, X2, ..., Xn):这些是我们用来预测因变量的变量。它们通常也称为“预测变量”或“解释变量”。
- 回归模型:多元线性回归方程的形式如下:
Y = β₀ + β₀₁ * X1 + β₂ * X2 + ... + βₙ * Xn
其中:
Y 是因变量。X1, X2, ..., Xn 是自变量。
β₀ 是常数(截距)。 beta_1、beta_2、…、beta_n 是回归系数,表示相应自变量对因变量的影响程度。
应用领域:- 经济学(收入预测);- 医疗保健(风险因素分析);- 工程学;- 社会科学;- 商业预测。
示例:基于以下因素预测房价:- 房屋面积;- 卧室数量;- 房屋房龄
在应用程序中,每个对象 Object_k(object_1、object_2、…、object_m)都由自变量(Xki – 特征,i = 1…n)和一个因变量(Yk – 目标值)描述。使用诸如普通最小二乘法 (OLS) 之类的方法来计算系数(beta_0、beta_1、beta_2、…、beta_n)的最优值。目标值计算公式为:
Y = beta_0 + beta_01 * P1 + beta_2 * P2 + ... + beta_n * Pn
其中:P1, P2...Pn 为目标值的预测变量。
应用程序将多元回归模型的数据保存在名为 AppMultipleLinearRegression.db 的 SQLite 数据库 (DB) 中。回归模型通过名称进行区分。
应用程序(多元线性回归求解器)的启动界面会显示回归模型示例列表(以下拉列表形式),以及用于创建(新建示例)、加载(加载)、保存(保存)、另存为(另存为)、计算(计算)和删除(删除)回归模型示例的按钮。在主界面,您还可以通过菜单访问语言选择、保存和复制数据库、使用示例数据初始化数据库等功能,以及应用程序帮助、设置等辅助功能,并可访问包含所有应用程序描述的网站链接。
创建新样本的功能包括一个对话框,用于输入矩阵大小,输入新样本的数据——行数(包括预测数据 P1、P2...Pn 的行,直至最后一行)和列数(包括因变量数据 Y1、Y2...Yk 的列,直至最后一列)。然后生成一个表格,用于输入相关数据。填充的表格必须先命名才能保存。“加载”功能用于清除表格。
可以通过从下拉列表中选择来显示之前保存的表格。可以计算显示的表格,并将结果显示在“应用程序结果”对话框中。“打印”功能可以从此对话框执行,并将结果输出到 AppMultipleLinearRegressionSolver.txt 文件。“打印”功能包含“保存数据库/保存文件”活动,用于选择保存文件的文件夹。选择文件夹后,会出现保存按钮。在同一活动中,还可以显示所选文件的内容、重命名文件或文件夹、创建新文件夹以及删除所选文件。
多元线性回归是一种强大的数据分析工具,但必须谨慎使用,并了解其局限性。
缺点:对多重共线性(自变量之间存在强相关性)较为敏感。并非总能捕捉到非线性关系。需要仔细验证和检查假设。