pandas是python程序开发过程之中经常会使用到的一个第三方库,它能够将数据转为行列表格形式表示出来并操作 。那么众多数据处理方式中,分组也是会使用到的 。下面就是要来详细讲解一下python第三方库pandas数据分组的方法,一起往下看看吧 。
文章插图
一、单列分组
import pandas as pddata = pd.read_excel('1064.xlsx')data1 = data.groupby('course').apply(lambda t: t[(t['grade']==t['grade'].min()) ^ (t['grade']==t['grade'].max())])在上面的代码示例之中就是从xlsx文件之中读取出来数据并将其转为df结构,然后调用groupby方法来表示其是按照哪一列来进行分组的 。而后面链式调用的apply()方法之中放入的就是一个匿名函数,它就是数据分组之后需要进行计算的函数,最后将其给返回就形成了一个新的分组之后的表格 。
文章插图
而示例之中函数的作用就是获取到分组之后该组中列grade的最大值与最小值,符号^表示该匿名函数会有两个表达式返回值 。
二、多列
而多列分组也是一样去调用groupby()方法,不过该方法传入的参数从字符串类型的列名,并从了包含有多个字符串列名的列表对象 。分组就会根据这两个列来完成,数据分组的本质就是将一个列之中相同值给取出来划分为一组,然后再根据自己需要只显示该组中的某些数据 。例如调用get方法即可获取该组中指定值的数据,代码示例如下所示:
groupby2=df1.groupby(["人群类型","人群数值"])groupby2.get_group(('一般用户',10)).head()【Pandas数据分组的方法有哪些?Python第三方库pandas怎么分组】总的来说,pandas数据分组使用的方法都是groupby() 。而该方法会将数据分组分为列重复数据划分为一组、对每组数据进行函数处理,最后返回值并将其合并为一个新的表格 。
推荐阅读
- Python怎么读取csv数据并输出表格?Python如何美化表格并打印出来
- Pandas库替换空数据怎么做?Python第三方库pandas如何替换df空值
- 数据库中的索引是什么意思?
- 如何把华为手机数据迁移到小米手机 关于如何把华为手机数据迁移到小米手机
- wind数据库怎么使用?
- 中国经济与社会发展统计数据库
- 王者荣耀账号数据转移怎样操作
- 通俗的讲什么叫大数据 是什么文件
- 单词、成语等单词如何分组?
- 如何制作介绍景点的ppt