Pandas数据分组的方法有哪些?Python第三方库pandas怎么分组

pandas是python程序开发过程之中经常会使用到的一个第三方库,它能够将数据转为行列表格形式表示出来并操作 。那么众多数据处理方式中,分组也是会使用到的 。下面就是要来详细讲解一下python第三方库pandas数据分组的方法,一起往下看看吧 。

Pandas数据分组的方法有哪些?Python第三方库pandas怎么分组

文章插图
一、单列分组
import pandas as pddata = pd.read_excel('1064.xlsx')data1 = data.groupby('course').apply(lambda t: t[(t['grade']==t['grade'].min()) ^ (t['grade']==t['grade'].max())])在上面的代码示例之中就是从xlsx文件之中读取出来数据并将其转为df结构,然后调用groupby方法来表示其是按照哪一列来进行分组的 。而后面链式调用的apply()方法之中放入的就是一个匿名函数,它就是数据分组之后需要进行计算的函数,最后将其给返回就形成了一个新的分组之后的表格 。
Pandas数据分组的方法有哪些?Python第三方库pandas怎么分组

文章插图


而示例之中函数的作用就是获取到分组之后该组中列grade的最大值与最小值,符号^表示该匿名函数会有两个表达式返回值 。
二、多列
而多列分组也是一样去调用groupby()方法,不过该方法传入的参数从字符串类型的列名,并从了包含有多个字符串列名的列表对象 。分组就会根据这两个列来完成,数据分组的本质就是将一个列之中相同值给取出来划分为一组,然后再根据自己需要只显示该组中的某些数据 。例如调用get方法即可获取该组中指定值的数据,代码示例如下所示:
groupby2=df1.groupby(["人群类型","人群数值"])groupby2.get_group(('一般用户',10)).head()【Pandas数据分组的方法有哪些?Python第三方库pandas怎么分组】总的来说,pandas数据分组使用的方法都是groupby() 。而该方法会将数据分组分为列重复数据划分为一组、对每组数据进行函数处理,最后返回值并将其合并为一个新的表格 。

    推荐阅读