رگرسیون خطی چندگانه یک روش آماری است که برای مدلسازی رابطه بین یک متغیر وابسته و دو یا چند متغیر مستقل با برازش یک معادله خطی به دادههای مشاهده شده استفاده میشود. رگرسیون خطی چندگانه توضیح میدهد که چگونه چندین پیشبینیکننده به طور همزمان بر یک متغیر نتیجه تأثیر میگذارند.
اجزای اصلی رگرسیون خطی چندگانه:
- متغیر وابسته (Y): این متغیری است که میخواهیم پیشبینی کنیم. اغلب به آن "متغیر هدف" یا "پاسخ" نیز گفته میشود.
- متغیرهای مستقل (X1، X2، ...، Xn): اینها متغیرهایی هستند که ما برای پیشبینی متغیر وابسته استفاده میکنیم. آنها اغلب "پیشبینیکننده" یا "متغیرهای توضیحی" نیز نامیده میشوند.
- مدل رگرسیون: معادله رگرسیون خطی چندگانه به شکل زیر است:
Y = beta_0 + beta_01* X1 + beta_2*X2 + ... + beta_n* Xn
که در آن:
Y متغیر وابسته است. X1، X2، ...، Xn متغیرهای مستقل هستند.
beta_0 ثابت (عرض از مبدا) است. beta_1، beta_2، ...، beta_n ضرایب رگرسیون هستند که تأثیر متغیرهای مستقل مربوطه را بر متغیر وابسته نشان میدهند.
کاربردها: - اقتصاد (پیشبینی درآمد)؛ - مراقبتهای بهداشتی (تحلیل عامل ریسک)؛ - مهندسی؛ - علوم اجتماعی؛ - پیشبینی کسبوکار.
مثال: پیشبینی قیمت خانه بر اساس: - اندازه خانه؛ - تعداد اتاق خواب؛ - سن خانه
در برنامه، هر شیء Object_k (object_1، object_2 ... object_m) توسط متغیرهای مستقل (Xki - ویژگیها، i = 1...n) و یک متغیر وابسته (Yk - هدف) توصیف میشوند. روشی مانند حداقل مربعات معمولی (OLS) برای محاسبه مقادیر بهینه ضرایب (beta_0، beta_1، beta_2، ...، beta_n) استفاده میشود. مقدار هدف با استفاده از فرمول زیر محاسبه میشود:
Y = beta_0 + beta_01* P1 + beta_2 *P2 + ... + beta_n* Pn
که در آن: P1، P2...Pn پیشبینیکنندههای هدف هستند.
برنامه، دادههای مدلهای رگرسیون چندگانه را در پایگاه داده (DB) از نوع SQLite با نام AppMultipleLinearRegression.db ذخیره میکند. مدلهای رگرسیون بر اساس نام از هم متمایز میشوند.
صفحه شروع برنامه (App Multiple Linear Regression Solver) لیستی از نمونههای مدلهای رگرسیون (در لیست چرخان) و دکمههایی را برای فعال کردن توابع ایجاد (نمونه جدید)، بارگذاری (Load)، ذخیره (Save)، ذخیره به عنوان (Save as)، محاسبه (Calculate) و حذف (Delete) نمونههای مدلهای رگرسیون نمایش میدهد. از صفحه اصلی، از طریق عناصر منو، میتوانید به توابعی مانند انتخاب زبان، ذخیره و کپی کردن پایگاه داده، مقداردهی اولیه پایگاه داده با دادههای نمونه و توابع کمکی مانند کمک برای برنامه، تنظیمات و پیوندی به وبسایت با توضیحات همه برنامهها توسط نویسندگان دسترسی داشته باشید.
توابع ایجاد (نمونه جدید) شامل کادر محاورهای برای وارد کردن اندازه ماتریس است که در آن دادههای نمونه جدید - تعداد سطرها (تعداد سطرها برای دادههای پیشبینیشده P1، P2...Pn - آخرین سطر) و تعداد ستونها (تعداد ستونها برای دادههای وابسته Y1، Y2،...Yk - آخرین ستون) - وارد میشوند. سپس جدولی برای وارد کردن دادههای مربوطه ایجاد میشود. جدول پر شده باید قبل از ذخیره نامگذاری شود. تابع Load جدول را پاک میکند.
جدول ذخیره شده قدیمی ممکن است با انتخاب از لیست چرخان نمایش داده شود. جدول نمایش داده شده ممکن است محاسبه شود و راهحل در کادر محاورهای App results ظاهر شود. تابع Print را میتوان از این کادر محاورهای در فایل AppMultipleLinearRegressionSolver.txt اجرا کرد. چاپ شامل فعالیت Save Db/Save file با انتخاب پوشهای است که فایل در آن ذخیره میشود. پس از انتخاب پوشه، دکمهای برای ذخیره ظاهر میشود. از همان فعالیت میتوان محتوای فایل انتخاب شده، تغییر نام فایل یا پوشه، ایجاد پوشه جدید و همچنین حذف فایل انتخاب شده را نشان داد.
رگرسیون خطی چندگانه یک ابزار قدرتمند تجزیه و تحلیل دادهها است، اما باید با احتیاط و درک محدودیتهای آن استفاده شود. معایب: به همخطی چندگانه (همبستگی قوی بین متغیرهای مستقل) حساس است. همیشه روابط غیرخطی را در بر نمیگیرد. نیاز به اعتبارسنجی و بررسی دقیق فرضیات دارد.
تاریخ بهروزرسانی
۱۵ اسفند ۱۴۰۴