파이썬 선형회귀 소스코드 메모

Code Snippets 2021. 4. 30. 12:39
import numpy as np
import pandas as pd

df = pd.DataFrame({
		'name': [...],
		'gf': [...],
		'ga': [...],
		'points': [...] })
from sklearn import linear_model
from sklearn.model_selection import train_test_split  # 학습 데이터와 테스트 데이터를 나눠주는 모듈
from sklearn.metrics import mean_absolute_error  # 모델을 평가해주는 모듈

df_x = df[["gf", "ga"]]
df_y = df[["points"]]
df_x, df_y

train_x, test_x, train_y, test_y = train_test_split(df_x, df_y, test_size=0.2, random_state=1234)
model = linear_model.LinearRegression() # 선형 회귀 모델 생성
model.fit(train_x, train_y) # 학습
pred_y = model.predict(test_x)  # test_x에 대한 예측결과
pred_y = np.around(pred_y.flatten()).astype('int')  # test_y와 데이터형 맞추기
mae = mean_absolute_error(test_y, pred_y) # MAE 도출
pred_y, round(mae, 2)
admin