scikit-learn的LogisticRegression.predict_proba的返回值

5 浏览
0 Comments

scikit-learn的LogisticRegression.predict_proba的返回值

LogisticRegression.predict_proba 函数到底返回什么东西?

在我的例子中,我得到了如下的结果:

array([
    [4.65761066e-03, 9.95342389e-01],
    [9.75851270e-01, 2.41487300e-02],
    [9.99983374e-01, 1.66258341e-05]
])

通过使用 sigmoid 函数进行其他计算,我知道第二列是概率。文档中说第一列是 n_samples,但这是不可能的,因为我的样本是评论,是文本而不是数字。文档还说第二列是 n_classes。这肯定不可能,因为我只有两个类别(即 +1-1),而这个函数应该是用来计算样本属于某个类别的概率,而不是类别本身。

第一列到底是什么,为什么它会存在?

0