scikit-learn：如何缩放回预测结果中的 'y'

9 浏览2023年2月24日

匿名的 2023年2月24日

0 Comments

我正在尝试使用波士顿房屋数据集学习scikit-learn和机器学习。

我将初始数据集（'housing_X'和'housing_y'）分割如下：

from sklearn.cross_validation import train_test_split

X_train, X_test, y_train, y_test = train_test_split(housing_X, housing_y, test_size=0.25, random_state=33)

我对这两个数据集进行了缩放：

from sklearn.preprocessing import StandardScaler

scalerX = StandardScaler().fit(X_train)

scalery = StandardScaler().fit(y_train)

X_train = scalerX.transform(X_train)

y_train = scalery.transform(y_train)

X_test = scalerX.transform(X_test)

y_test = scalery.transform(y_test)

我创建了模型：

from sklearn import linear_model

clf_sgd = linear_model.SGDRegressor(loss='squared_loss', penalty=None, random_state=42)

train_and_evaluate(clf_sgd,X_train,y_train)

基于这个新的模型clf_sgd，我正在尝试根据X_train的第一个实例预测y。

X_new_scaled = X_train[0]

print (X_new_scaled)

y_new = clf_sgd.predict(X_new_scaled)

print (y_new)

然而，对我来说结果相当奇怪（1.34032174，而不是房屋价格的范围20-30）。

[-0.32076092 0.35553428 -1.00966618 -0.28784917 0.87716097 1.28834383

0.4759489 -0.83034371 -0.47659648 -0.81061061 -2.49222645 0.35062335

-0.39859013]

[ 1.34032174]

我猜这个值1.34032174应该被还原，但我一直在尝试找出如何做到这一点，但没有成功。欢迎任何提示。非常感谢。

Python/Scikit-Learn - 无法处理多类和连续值的混合

在Python脚本中出现错误 "Expected 2D array, got 1D array instead:"?

scikit-learn交叉验证，使用均方误差计算负值。

sckit-learn的fit()在标准化数据后会导致错误。

当对数据进行缩放时，为什么训练数据集使用'fit'和'transform'，而测试数据集只使用'transform'？

如何在scikit-learn中预测时间序列？

将model.predict()的结果与原始的pandas DataFrame进行合并？

使用K折交叉验证标准化数据

将您的数据进行重新整形，若您的数据只有一个特征，则使用array.reshape(-1,1)，若您的数据只包含一个样本，则使用array.reshape(1,-1)。

在model.predict()期间使用array.reshape(-1, 1)来重新调整您的数据？

Reverse Box-Cox变换

TypeError: float() argument must be a string or a number, not 'function' – Python/Sklearn

如何解决IndexError: invalid index to scalar variable

使用model.predict()预测数值时的线性回归错误

在train_test_split命令中，y的索引存在问题（在设置stratify时出现问题）。

在python-sklearn中遇到了"ValueError: Expected 2D array, got 1D array instead"的错误。

保存MinMaxScaler模型在sklearn中。

尝试训练简单线性回归算法。一直出现错误。

ConvergenceWarning: lbfgs失败收敛（status=1）：STOP: 总迭代次数达到限制

在scikit-learn中的预处理 - 单样本 - 弃用警告

scikit-learn：如何缩放回预测结果中的 'y'

0 答案