მრავალჯერადი ხაზოვანი რეგრესია არის სტატისტიკური მეთოდი, რომელიც გამოიყენება ერთ დამოკიდებულ ცვლადსა და ორ ან მეტ დამოუკიდებელ ცვლადს შორის ურთიერთობის მოდელირებისთვის, ხაზოვანი განტოლების დაკვირვებულ მონაცემებზე მორგებით. მრავალჯერადი ხაზოვანი რეგრესია განმარტავს, თუ როგორ მოქმედებს ერთდროულად რამდენიმე პროგნოზირების ფაქტორი შედეგობრივ ცვლადზე.
მრავალჯერადი ხაზოვანი რეგრესიის ძირითადი კომპონენტები:
- დამოკიდებული ცვლადი (Y): ეს არის ცვლადი, რომლის პროგნოზირებაც გვსურს. მას ხშირად ასევე უწოდებენ „სამიზნე ცვლადს“ ან „რეაგირებას“.
- დამოუკიდებელი ცვლადები (X1, X2, ..., Xn): ეს არის ცვლადები, რომლებსაც ვიყენებთ დამოკიდებული ცვლადის პროგნოზირებისთვის. მათ ხშირად ასევე უწოდებენ „პროგნოზირების“ ან „განმარტებით ცვლადებს“.
- რეგრესიის მოდელი: მრავალჯერადი ხაზოვანი რეგრესიის განტოლებას აქვს შემდეგი ფორმა:
Y = beta_0 + beta_01* X1 + beta_2*X2 + ... + beta_n* Xn
სადაც:
Y არის დამოკიდებული ცვლადი. X1, X2, ..., Xn არის დამოუკიდებელი ცვლადები.
beta_0 არის მუდმივა (კვეთა). beta_1, beta_2, ..., beta_n არის რეგრესიის კოეფიციენტები, რომლებიც მიუთითებენ შესაბამისი დამოუკიდებელი ცვლადების გავლენას დამოკიდებულ ცვლადზე.
გამოყენება: - ეკონომიკა (შემოსავლის პროგნოზირება); - ჯანდაცვა (რისკ-ფაქტორების ანალიზი); - ინჟინერია; - სოციალური მეცნიერებები; - ბიზნესის პროგნოზირება.
მაგალითი: სახლის ფასის პროგნოზირება შემდეგის მიხედვით: - სახლის ზომა; - საძინებლების რაოდენობა; - სახლის ასაკი
აპლიკაციაში თითოეული ობიექტი Object_k (object_1, object_2 ... object_m) აღწერილია დამოუკიდებელი ცვლადებით (Xki – მახასიათებლები, i = 1...n) და ერთი დამოკიდებული ცვლადით (Yk – სამიზნე). კოეფიციენტების ოპტიმალური მნიშვნელობების (beta_0, beta_1, beta_2, ..., beta_n) გამოსათვლელად გამოიყენება მეთოდი, როგორიცაა ჩვეულებრივი უმცირესი კვადრატების მეთოდი (OLS). სამიზნე მნიშვნელობა გამოითვლება შემდეგნაირად:
Y = beta_0 + beta_01* P1 + beta_2 *P2 + ... + beta_n* Pn
სადაც: P1, P2...Pn არის სამიზნე ცვლადის პროგნოზირების ფაქტორები.
აპლიკაცია ინახავს მონაცემებს მრავალი რეგრესიული მოდელისთვის მონაცემთა ბაზაში (DB) SQLite ტიპის, სახელწოდებით AppMultipleLinearRegression.db. რეგრესიული მოდელები გამოირჩევა სახელით.
აპლიკაციის (App Multiple Linear Regression Solver) გაშვების ეკრანზე ნაჩვენებია რეგრესიული მოდელების ნიმუშების სია (მბრუნავი სიის სახით) და ღილაკები ფუნქციების ჩასართავად, როგორიცაა: ახალი ნიმუში, ჩატვირთვა, შენახვა, როგორც, გამოთვლა და წაშლა. მთავარი ეკრანიდან, მენიუს ელემენტების საშუალებით, ასევე შეგიძლიათ წვდომა გქონდეთ ისეთ ფუნქციებზე, როგორიცაა ენის შერჩევა, მონაცემთა ბაზის შენახვა და კოპირება, მონაცემთა ბაზის ინიციალიზაცია ნიმუშის მონაცემებით და დამხმარე ფუნქციები, როგორიცაა აპლიკაციის დახმარება, პარამეტრები და ვებსაიტის ბმული ყველა აპლიკაციის აღწერით ავტორების მიერ.
შექმნის (New Sample) ფუნქციებში შედის დიალოგური ფანჯარა მატრიცის ზომის შესაყვანად, სადაც შეჰყავთ ახალი ნიმუშის მონაცემები - სტრიქონების რაოდენობა (წინასწარ განსაზღვრული მონაცემებისთვის P1, P2...Pn - ბოლო სტრიქონი) და სვეტების რაოდენობა (დამოკიდებული მონაცემებისთვის Y1, Y2,...Yk - ბოლო სტრიქონი). შემდეგ გენერირდება ცხრილი შესაბამისი მონაცემების შესაყვანად. შევსებულ ცხრილს შენახვამდე უნდა დაერქვას სახელი. ფუნქცია Load ასუფთავებს ცხრილს.
შესაძლოა, ძველი შენახული ცხრილი გამოჩნდეს მბრუნავი სიიდან შერჩევით. ნაჩვენები ცხრილი შეიძლება გამოითვალოს და ამოხსნა გამოჩნდება დიალოგურ App results-ში. ფუნქცია Print შეიძლება შესრულდეს ამ დიალოგურიდან AppMultipleLinearRegressionSolver.txt ფაილში. Print-ში შედის Save Db/Save ფაილის აქტივობა, რომლის მიხედვითაც შეირჩევა საქაღალდე, სადაც უნდა შეინახოს ფაილი. საქაღალდის არჩევის შემდეგ გამოჩნდება შენახვის ღილაკი. იგივე აქტივობით შეიძლება ნაჩვენები იყოს არჩეული ფაილის შინაარსი, ფაილის ან საქაღალდის გადარქმევა, ახალი საქაღალდის შექმნა და ასევე არჩეული ფაილის წაშლა.
მრავალჯერადი წრფივი რეგრესია არის მონაცემთა ანალიზის ძლიერი ინსტრუმენტი, მაგრამ ის უნდა იქნას გამოყენებული სიფრთხილით და მისი შეზღუდვების გაგებით.
ნაკლოვანებები: მგრძნობიარეა მულტიკოლინეარობის მიმართ (დამოუკიდებელ ცვლადებს შორის ძლიერი კორელაცია). ყოველთვის არ აღბეჭდავს არაწრფივ კავშირებს. საჭიროებს ფრთხილად ვალიდაციას და ვარაუდების შემოწმებას.