使用Python的pandas从数据框中创建matplotlib散点图。

7 浏览2023年4月18日

匿名的 2023年4月18日

0 Comments

如何使用Python中的matplotlib从pandas DataFrame制作一系列散点图的最佳方法？

例如，如果我有一个DataFrame df，其中有一些感兴趣的列，我通常会将所有内容转换为数组：

import matplotlib.pylab as plt
# df是一个DataFrame：获取col1和col2
# 如果有任何一个列中包含NA，则删除NA行
mydata = df[["col1", "col2"]].dropna(how="any")
# 现在用matplotlib绘图
vals = mydata.values
plt.scatter(vals[:, 0], vals[:, 1])

在绘图之前将所有内容转换为数组的问题是，它强制你退出数据框。

考虑以下两种情况，完整的数据框对于绘图是必不可少的：

例如，如果您现在想要查看在调用scatter时绘制的相应值的col3的所有值，并按该值对每个点进行染色（或调整大小）怎么办？您必须返回去，提取col1，col2的非NA值并检查它们的相应值。

有没有一种方法可以在保留数据框的同时进行绘图？例如：
```
mydata = df.dropna(how="any", subset=["col1", "col2"])
# 绘制col1和col2的散点图，根据col3的大小
scatter(mydata(["col1", "col2"]), s=mydata["col3"])
```

类似地，想象一下，如果您想要根据其某些列的值为每个点过滤或着色。例如，如果您想要自动绘制满足col1，col2某个截断的点的标签（标签存储在df的另一列中），或者像在R中使用数据框那样以不同颜色绘制这些点。例如：
```
mydata = df.dropna(how="any", subset=["col1", "col2"]) 
myscatter = scatter(mydata[["col1", "col2"]], s=1)
# 将所有col2值大于0.5的点以红色、较小的大小绘制
myscatter.replot(mydata["col2"] > 0.5, color="red", s=0.5)
```

如何实现这个？

编辑回复crewbum：

您说最好的方法是分别绘制每个条件（如subset_a，subset_b）。如果有很多条件，例如您想将散点图分成4种类型的点或更多类型，并使用不同的形状/颜色绘制每种类型，那么如何优雅地应用条件a，b，c等，并确保然后绘制“剩下”的（即不属于任何这些条件的）数据作为最后一步？

类似地，在您根据col3不同方式绘制col1，col2的示例中，如果有NA值破坏了col1，col2，col3之间的关联，该怎么办？例如，如果您想要根据它们的col3值绘制所有col2值，但某些行在col1或col3中有一个NA值，这将强制您首先使用dropna。所以您将执行以下操作：

mydata = df.dropna(how="any", subset=["col1", "col2", "col3")

然后您可以使用mydata进行绘图，如您所示-使用col3的值在col1，col2之间绘制散点图。但是mydata将缺少一些具有col1，col2值但对于col3而言是NA的点，而这些点仍然必须绘制...那么您将如何绘制数据的“剩余”部分，即不在过滤集mydata中的点？

当字符串数据传递给matplotlib API时，会绘制什么？

如何在子图中绘制多个数据框架

使用Seaborn绘制pandas DataFrame的多列数据。

按照列值给散点图上色

如何使用点绘制pandas数据框的两列数据

在pandas中绘制带有数据点的折线图

在柱状图上绘制pandas DataFrame的多列数据。

Plotly：如何从同一pandas数据框的不同列中在一个Plotly图表中绘制多条线？

如何按类别创建散点图

Python pandas，多条线的绘图选项

如何修复Python Pandas的图表？

使用Pandas在Matplotlib中设置Y轴

使用多个数据帧和列在同一图表上绘制pandas数据帧子图，显示相同的列。

如何使用pandas绘制有阴影条形图?

Jupyter如何将两个数据帧并排绘制

使用pandas绘制相关矩阵。

创建 Pandas Dataframe 在两个 Numpy 数组之间，然后绘制散点图。

使用多索引的Pandas绘图

在同一图中绘制Pandas数据框的多个列的箱线图（seaborn）

为pandas绘图添加x轴和y轴标签。

使用Python的pandas从数据框中创建matplotlib散点图。

0 答案