如何在数据框的一列中列出唯一名称?

9 浏览
0 Comments

如何在数据框的一列中列出唯一名称?

我想要在Pfam_domains列中找到至少出现过一次的所有名称。

这是我的数据框:

           TCID       Fonction        Genbank Uniprot Pfam_domains
0     3.A.1.1.1           MalE           MalE  P0AEX9      PF00528
1     3.A.1.1.1           MalF           MalF  P02916      PF01547
2     3.A.1.1.1           MalG           MalG  P68183      PF00528
3     3.A.1.1.1           MalK           MalK  P68187      PF00005
4     3.A.1.1.1           MalK           MalK  P68187      PF17912
..          ...            ...            ...     ...          ...
178  3.A.1.5.32  LAC30SC_07295  LAC30SC_07295  F0TFS7      PF00528
179  3.A.1.5.32  LAC30SC_07300  LAC30SC_07300  F0TFS8      PF00528
180  3.A.1.5.32  LAC30SC_07305  LAC30SC_07305  F0TFS9      PF00005
181  3.A.1.5.32  LAC30SC_07305  LAC30SC_07305  F0TFS9      PF08352
182  3.A.1.5.32  LAC30SC_07310  LAC30SC_07310  F0TFT0      PF00005

这是我的代码:

for i in range(1, len(df)-1):
    unite=pd.unique(df['Pfam_domains'][i])

在这里,问题是我只列出了所有域(所有域的所有出现次数)。

这是我想要输出的内容:

"PF00528"
"PF01547"
"PF00005"
...

0
0 Comments

问题的出现原因是用户想要找到一个方法来列出数据框中某一列的唯一名称。用户希望通过代码来实现这个目标。

为了解决这个问题,用户可以使用以下代码来获取数据框中某一列的唯一名称并进行排序:

unite = df['Pfam_domains'].unique()
unite.sort()

以上代码中,我们首先使用unique()函数来获取数据框中某一列的唯一值。然后,我们使用sort()函数对唯一值进行排序。

通过这个解决方法,用户可以很容易地获得数据框中某一列的唯一名称并按字母顺序进行排序。这样,用户就可以更方便地对数据进行分析和处理。

0
0 Comments

问题的出现原因是需要从一个数据框的一列中列出唯一的名称。解决方法是首先按照出现次数升序对值进行排序,然后使用

value_counts()

函数获取每个值的计数,最后再对计数进行降序排序。

具体的解决方法如下:

1. 首先使用

value_counts()

函数获取每个值的计数,并按照计数进行降序排序:

df.Pfam_domains.value_counts().sort_values(ascending=False)

这样就可以得到每个值出现的次数。

通过以上方法,可以满足要求列出至少出现一次的值。如果实际上需要列出出现多次的值,那么这个方法同样适用。

0