다중 선형 회귀는 관측 데이터에 선형 방정식을 적용하여 하나의 종속 변수와 두 개 이상의 독립 변수 간의 관계를 모델링하는 데 사용되는 통계적 방법입니다. 다중 선형 회귀는 여러 예측 변수가 결과 변수에 동시에 어떻게 영향을 미치는지 설명합니다.
다중 선형 회귀의 주요 구성 요소:
- 종속 변수(Y): 예측하고자 하는 변수입니다. 흔히 "목표 변수" 또는 "반응 변수"라고도 합니다.
- 독립 변수(X1, X2, ..., Xn): 종속 변수를 예측하는 데 사용하는 변수입니다. 흔히 "예측 변수" 또는 "설명 변수"라고도 합니다.
- 회귀 모델: 다중 선형 회귀 방정식은 다음과 같은 형태를 가집니다.
Y = β₀ + β₀₁*X1 + β₂*X2 + ... + βₙ*Xn
여기서:
Y는 종속 변수입니다. X1, X2, ..., Xn은 독립 변수입니다.
β₀는 상수항(절편)입니다. beta_1, beta_2, ..., beta_n은 해당 독립 변수가 종속 변수에 미치는 영향을 나타내는 회귀 계수입니다.
응용 분야: - 경제학(소득 예측); - 의료(위험 요인 분석); - 공학; - 사회 과학; - 사업 예측.
예시: 다음 변수를 기반으로 주택 가격 예측: - 주택 크기; - 침실 개수; - 주택 연식
이 앱에서 각 객체 Object_k(object_1, object_2 ... object_m)는 독립 변수(Xki - 특징, i = 1...n)와 하나의 종속 변수(Yk - 목표)로 설명됩니다. 최소제곱법(OLS)과 같은 방법을 사용하여 계수(beta_0, beta_1, beta_2, ..., beta_n)의 최적값을 계산합니다. 목표값은 다음 공식으로 계산됩니다.
Y = beta_0 + beta_01* P1 + beta_2 *P2 + ... + beta_n* Pn
여기서 P1, P2, ..., Pn은 목표값의 예측 변수입니다.
이 애플리케이션은 다중 회귀 모델 데이터를 AppMultipleLinearRegression.db라는 이름의 SQLite 데이터베이스(DB)에 저장합니다. 회귀 모델은 이름으로 구분됩니다.
애플리케이션(App Multiple Linear Regression Solver)의 시작 화면에는 회귀 모델 샘플 목록(스피너 목록)과 회귀 모델 샘플 생성(새 샘플), 불러오기(로드), 저장(저장), 다른 이름으로 저장(다른 이름으로 저장), 계산(계산), 삭제(삭제) 기능을 활성화하는 버튼이 표시됩니다. 메인 화면의 메뉴 요소를 통해 언어 선택, 데이터베이스 저장 및 복사, 샘플 데이터로 데이터베이스 초기화, 애플리케이션 도움말, 설정, 개발자가 제공하는 모든 애플리케이션 설명이 있는 웹사이트 링크와 같은 보조 기능에도 접근할 수 있습니다.
(새 샘플) 생성 기능에는 행렬 크기를 입력하는 대화 상자가 포함됩니다. 여기서 새 샘플의 데이터(행 수: 예측 데이터 P1, P2...Pn - 마지막 행 포함, 열 수: 종속 데이터 Y1, Y2...Yk - 마지막 열 포함)를 입력합니다. 그런 다음 관련 데이터를 입력할 테이블이 생성됩니다. 입력된 테이블은 저장하기 전에 이름을 지정해야 합니다. 로드 기능은 테이블을 초기화합니다.
이전에 저장된 테이블은 스피너 목록에서 선택하여 표시할 수 있습니다. 표시된 테이블에서 계산을 수행하고 결과를 앱 결과 대화 상자에 표시합니다. 이 대화 상자에서 인쇄 기능을 실행하여 AppMultipleLinearRegressionSolver.txt 파일을 저장할 수 있습니다. 인쇄 기능에는 저장/파일 저장 활동이 포함되어 있으며, 이 활동을 통해 파일을 저장할 폴더를 선택할 수 있습니다. 폴더를 선택하면 저장 버튼이 나타납니다. 같은 활동에서 선택한 파일의 내용을 표시하거나, 파일 또는 폴더 이름을 변경하거나, 새 폴더를 만들거나, 선택한 파일을 삭제할 수 있습니다.
다중 선형 회귀는 강력한 데이터 분석 도구이지만, 그 한계를 이해하고 신중하게 사용해야 합니다.
단점: 다중공선성(독립변수 간의 강한 상관관계)에 민감합니다. 비선형 관계를 항상 포착하는 것은 아닙니다. 신중한 검증과 가정 확인이 필요합니다.