import numpy as np
import pandas as pd
df = pd.DataFrame({
'name': [...],
'gf': [...],
'ga': [...],
'points': [...] })
from sklearn import linear_model
from sklearn.model_selection import train_test_split # 학습 데이터와 테스트 데이터를 나눠주는 모듈
from sklearn.metrics import mean_absolute_error # 모델을 평가해주는 모듈
df_x = df[["gf", "ga"]]
df_y = df[["points"]]
df_x, df_y
train_x, test_x, train_y, test_y = train_test_split(df_x, df_y, test_size=0.2, random_state=1234)
model = linear_model.LinearRegression() # 선형 회귀 모델 생성
model.fit(train_x, train_y) # 학습
pred_y = model.predict(test_x) # test_x에 대한 예측결과
pred_y = np.around(pred_y.flatten()).astype('int') # test_y와 데이터형 맞추기
mae = mean_absolute_error(test_y, pred_y) # MAE 도출
pred_y, round(mae, 2)