首页
会员中心
到顶部
到尾部
Python教程

机器学习 - 多元回归

时间:2020/11/2 13:25:59  作者:  来源:  查看:0  评论:0
内容摘要:机器学习 - 多元回归多项式回归缩放多元回归(Multiple Regression)多元回归就像线性回归一样,但是具有多个独立值,这意味着我们试图基于两个或多个变量来预测一个值。请看下面的数据集,其中包含了一些有关汽车的信息。CarModelVolumeWeightCO2Toy...

机器学习 - 多元回归

多元回归(Multiple Regression)

多元回归就像线性回归一样,但是具有多个独立值,这意味着我们试图基于两个或多个变量来预测一个值。

请看下面的数据集,其中包含了一些有关汽车的信息。

CarModelVolumeWeightCO2
ToyotaAygo100079099
MitsubishiSpace Star1200116095
SkodaCitigo100092995
Fiat50090086590
MiniCooper15001140105
VWUp!1000929105
SkodaFabia1400110990
MercedesA-Class1500136592
FordFiesta1500111298
AudiA11600115099
HyundaiI20110098099
SuzukiSwift1300990101
FordFiesta1000111299
HondaCivic1600125294
HundaiI301600132697
OpelAstra1600133097
BMW11600136599
Mazda322001280104
SkodaRapid16001119104
FordFocus20001328105
FordMondeo1600158494
OpelInsignia2000142899
MercedesC-Class2100136599
SkodaOctavia1600141599
VolvoS602000141599
MercedesCLA15001465102
AudiA420001490104
AudiA620001725114
VolvoV7016001523109
BMW520001705114
MercedesE-Class21001605115
VolvoXC7020001746117
FordB-Max16001235104
BMW216001390108
OpelZafira16001405109
MercedesSLK25001395120

我们可以根据发动机排量的大小预测汽车的二氧化碳排放量,但是通过多元回归,我们可以引入更多变量,例如汽车的重量,以使预测更加准确。

工作原理

在 Python 中,我们拥有可以完成这项工作的模块。首先导入 Pandas 模块:

import pandas

Pandas 模块允许我们读取 csv 文件并返回一个 DataFrame 对象。

此文件仅用于测试目的,您可以在此处下载:cars.csv

df = pandas.read_csv("cars.csv")

然后列出独立值,并将这个变量命名为 X。

将相关值放入名为 y 的变量中。

X = df[['Weight', 'Volume']]y = df['CO2']

提示:通常,将独立值列表命名为大写 X,将相关值列表命名为小写 y

我们将使用 sklearn 模块中的一些方法,因此我们也必须导入该模块:

from sklearn import linear_model

在 sklearn 模块中,我们将使用 LinearRegression() 方法创建一个线性回归对象。

该对象有一个名为 fit() 的方法,该方法将独立值和从属值作为参数,并用描述这种关系的数据填充回归对象:

regr = linear_model.LinearRegression()regr.fit(X, y)

现在,我们有了一个回归对象,可以根据汽车的重量和排量预测 CO2 值:

# 预测重量为 2300kg、排量为 1300ccm 的汽车的二氧化碳排放量:predictedCO2 = regr.predict([[2300, 1300]])

实例

请看完整实例:

import pandasfrom sklearn import linear_modeldf = pandas.read_csv("cars.csv")X = df[['Weight', 'Volume']]y = df['CO2']regr = linear_model.LinearRegression()regr.fit(X, y)# 预测重量为 2300kg、排量为 1300ccm 的汽车的二氧化碳排放量:predictedCO2 = regr.predict([[2300, 1300]])print(predictedCO2)

结果:

[107.2087328]

运行实例

我们预测,配备 1.3 升发动机,重量为 2300 千克的汽车,每行驶 1 公里,就会释放约 107 克二氧化碳。

系数

系数是描述与未知变量的关系的因子。

例如:如果 x 是变量,则 2xx 的两倍。x 是未知变量,数字 2 是系数。

在这种情况下,我们可以要求重量相对于 CO2 的系数值,以及体积相对于 CO2 的系数值。我们得到的答案告诉我们,如果我们增加或减少其中一个独立值,将会发生什么。

实例

打印回归对象的系数值:

import pandasfrom sklearn import linear_modeldf = pandas.read_csv("cars.csv")X = df[['Weight', 'Volume']]y = df['CO2']regr = linear_model.LinearRegression()regr.fit(X, y)print(regr.coef_)

结果:

[0.00755095 0.00780526]

运行实例

结果解释

结果数组表示重量和排量的系数值。

Weight: 0.00755095Volume: 0.00780526

这些值告诉我们,如果重量增加 1g,则 CO2 排放量将增加 0.00755095g。

如果发动机尺寸(容积)增加 1 ccm,则 CO2 排放量将增加 0.00780526g。

我认为这是一个合理的猜测,但还是请进行测试!

我们已经预言过,如果一辆配备 1300ccm 发动机的汽车重 2300 千克,则二氧化碳排放量将约为 107 克。

如果我们增加 1000g 的重量会怎样?

实例

复制之前的例子,但是将车重从 2300 更改为 3300:

import pandasfrom sklearn import linear_modeldf = pandas.read_csv("cars.csv")X = df[['Weight', 'Volume']]y = df['CO2']regr = linear_model.LinearRegression()regr.fit(X, y)predictedCO2 = regr.predict([[3300, 1300]])print(predictedCO2)

结果:

[114.75968007]

运行实例

我们已经预测,配备 1.3 升发动机,重量为 3.3 吨的汽车,每行驶 1 公里,就会释放约 115 克二氧化碳。

这表明 0.00755095 的系数是正确的:

107.2087328 + (1000 * 0.00755095) = 114.75968


相关评论
广告联系QQ:45157718 点击这里给我发消息 电话:13516821613 杭州余杭东港路118号雷恩国际科技创新园  网站技术支持:黄菊华互联网工作室 浙ICP备06056032号