Python怎么实现分组聚合?Python对数据分组如何实现

在python数据分析之中对数据实施分组聚合是一种很常见的操作,主要的作用就是将不同的数据根据某些共同的特征划分到一个列或者是字段之中 。而python中要完成分组聚合操作的话就得使用到pandas库了,下文会有详细的示例和讲解 。

Python怎么实现分组聚合?Python对数据分组如何实现

文章插图
1.分组聚合操作的话只能够对有列和行的行列表格形式数据上进行操作,它的本质就是只获取某一行或者是某一列的某种数据,调用Dataframe创建合理的数据结构,代码如下:
import pandas as pdimport numpy as np%matplotlib inlinedf = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],                   'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],                   'C': np.random.randn(8),                   'D': np.random.randn(8)})2.有了测试数据之后就能够用它来完成分组聚合方法的使用了,那么首先就是获取单个列的所有值 。使用到的方法就是groupby了,代码如下:
df.groupby('A').sum()【Python怎么实现分组聚合?Python对数据分组如何实现】在通过这个分组聚合的方法所得到的结果实际上是整个列中行的数量,那么在这个方法之中去对两个列进行分组聚合统计之后可以调用mean()方法来获取平均值,代码示例如下所示:
df.groupby(['A','B'], as_index=False).mean()3.分组之后的数据实际上是可以不加链式方法而直接将这一组的数据返回,数据返回之后是一个可迭代对象的形式 。那么就可以使用for循环语句来迭代这个分组后的对象来实现获取值的操作了,详细代码示例如下所示:
g = df.groupby('A')for name,group in g:    print(name)   print(group)以上就是关于“Python怎么实现分组聚合?Python对数据分组如何实现”的全部内容了,希望对你有所帮助 。

    推荐阅读