하나의 입력으로 원하는 값을 예측할 때 사용할 수 있습니다.
예를들어, 내가 공부한 시간으로 시험에서 내가 몇점을 받을지 예측해 보는것 입니다.
아래는 sklearn을 사용한 Linear Regression 소스 코드 입니다.
예제코드
« 데이터 셋 »
« 그래프 표시 »
Linear Regression Warnings
선형 회귀 문제점
데이터가 선형으로 흩어져 있을때만 잘 동작한다.
– Solution: 1_데이터를 보정하여 선형으로 만든다. 2_Feature를 추가한다. 3_다른 모델을 사용한다.
선형 회귀는 Outliers 에게 민감합니다.
– Solution: 1_전처리에서 Outliers 제거
«참고 사진»
Multiple Linear Regression
여러개의 입력으로 원하는 값을 예측할 때 사용할 수 있습니다.
예를들어, “공부 시간” 뿐만 아니라 “집중도”도 함께 데이터 추가하여 점수를 예측해 보는 것 입니다.
공부량만으로 점수를 예측한 것보다 정확한 결과를 얻을 수 있을것 같습니다.
아래는 sklearn을 사용한 Multiple Linear Regression 소스 코드 입니다.
예제 코드
« 그래프 표시 »
공부량과 시험점수 2D 표시
공부량과 시험점수 3D 표시_1
공부량과 시험점수 3D 표시_2
공부량과 시험점수 3D 표시_3
데이터가 한 평면에 나타난 것을 확인
Multiple Linear Regression (보스턴 부동산 가격 예측)
Multiple Linear Regression 은 2개 이상의 입력을 사용한 데이터 예측 예제 입니다.
13가지의 입력으로 부동산 가격을 예상합니다.
아래는 sklearn에서 보스턴 부동산 가격 데이터셋으로 Multiple Linear Regression 소스 코드 입니다.