רגרסיה לינארית מרובה היא שיטה סטטיסטית המשמשת למידול הקשר בין משתנה תלוי אחד לשני משתנים בלתי תלויים או יותר על ידי התאמת משוואה לינארית לנתונים שנצפו. רגרסיה לינארית מרובה מסבירה כיצד מספר גורמים מנבאים משפיעים בו זמנית על משתנה תוצאה.
מרכיבים עיקריים של רגרסיה לינארית מרובה:
- משתנה תלוי (Y): זהו המשתנה שאנו רוצים לחזות. לעתים קרובות הוא נקרא גם "משתנה היעד" או "תגובה".
- משתנים בלתי תלויים (X1, X2, ..., Xn): אלו המשתנים בהם אנו משתמשים כדי לחזות את המשתנה התלוי. לעתים קרובות הם נקראים גם "גורמים מנבאים" או "משתנים מסבירים".
- מודל רגרסיה: למשוואה של רגרסיה לינארית מרובה יש את הצורה הבאה:
Y = beta_0 + beta_01* X1 + beta_2*X2 + ... + beta_n* Xn
כאשר:
Y הוא המשתנה התלוי. X1, X2, ..., Xn הם המשתנים הבלתי תלויים.
beta_0 הוא הקבוע (נקודת החיתוך). beta_1, beta_2, ..., beta_n הם מקדמי הרגרסיה המצביעים על השפעת המשתנים הבלתי תלויים המתאימים על המשתנה התלוי.
יישומים: - כלכלה (ניבוי הכנסה); - בריאות (ניתוח גורמי סיכון); - הנדסה; - מדעי החברה; - חיזוי עסקי.
דוגמה: ניבוי מחיר בית על סמך: - גודל הבית; - מספר חדרי השינה; - גיל הבית
באפליקציה כל אובייקט Object_k( object_1, object_2 ... object_m) מתואר על ידי משתנים בלתי תלויים (Xki – מאפיינים, i = 1...n) ומשתנה תלוי אחד (Yk - יעד). שיטה כמו ריבועים פחותים רגילים (OLS) משמשת לחישוב הערכים האופטימליים של המקדמים (beta_0, beta_1, beta_2, ..., beta_n). ערך היעד מחושב על ידי:
Y = beta_0 + beta_01* P1 + beta_2 *P2 + ... + beta_n* Pn
כאשר: P1, P2...Pn הם מנבאים של היעד.
האפליקציה שומרת נתונים עבור מודלי רגרסיה מרובים במסד נתונים (DB) מסוג SQLite בשם AppMultipleLinearRegression.db. מודלי הרגרסיה נבדלים בשמותיהם.
מסך הפתיחה של האפליקציה (App Multiple Linear Regression Solver) מציג רשימה של דוגמאות של מודלי רגרסיה (ברשימת ספינר) וכפתורים להפעלת הפונקציות ליצירה (דגימה חדשה), טעינה (Load), שמירה (Save), שמירה בשם (Save as), חישוב (Calculate) ומחיקה (Delete) של דוגמאות של מודלי רגרסיה. מהמסך הראשי, דרך רכיבי התפריט, ניתן גם לגשת לפונקציות כגון בחירת שפה, שמירה והעתקה של מסד הנתונים, אתחול מסד הנתונים עם נתוני דוגמה, ופונקציות עזר כגון עזרה עבור האפליקציה, הגדרות וקישור לאתר האינטרנט עם תיאור של כל היישומים על ידי המחברים.
הפונקציות ליצירת (דגימה חדשה) כוללות את תיבת הדו-שיח להזנת גודל המטריצה בה הזנת נתוני דגימה חדשה - מספר השורות (מספר השורות הכוללות עבור נתונים צפויים P1, P2...Pn - שורה אחרונה) ומספר העמודות (מספר העמודות הכוללות עבור נתונים תלויים Y1, Y2,...Yk - עמודה אחרונה). לאחר מכן, יוצרים טבלה להזנת נתונים רלוונטיים. יש לתת שם לטבלה המאוכלסת לפני השמירה. הפונקציה "טען" נקה את הטבלה. ייתכן שהטבלה השמורה הישנה מוצגת על ידי בחירה מרשימת ספינרים. ניתן לחשב את הטבלה המוצגת והפתרון מופיע בתיבת הדו-שיח "תוצאות האפליקציה". ניתן לבצע את הפונקציה "הדפסה" מדי-שיח זה בקובץ AppMultipleLinearRegressionSolver.txt. הפונקציה "הדפסה" כוללת את פעילות "שמירה מסד נתונים/שמירה" לפיה נבחרה התיקייה שבה לשמור את הקובץ. לאחר בחירת התיקייה מופיע כפתור "שמירה". מאותה פעילות, ניתן להציג את תוכן הקובץ שנבחר, לשנות שם של קובץ או תיקייה, ליצור תיקייה חדשה וגם למחוק את הקובץ שנבחר. רגרסיה לינארית מרובה היא כלי רב עוצמה לניתוח נתונים, אך יש להשתמש בה בזהירות ובהבנת מגבלותיה. חסרונות: רגיש למולטי-קולינריות (קורלציה חזקה בין משתנים בלתי תלויים). לא תמיד לוכד קשרים לא ליניאריים. דורש אימות ובדיקה מדוקדקים של הנחות.
עדכון אחרון בתאריך
6 במרץ 2026