都知道python可以做数据分析/统计,我们经常会用到聚合函数,但是对于很多新手来说,对这个函数的理解还不是很透彻,所有今天的这篇文章有关于“什么是agg函数?python pandas中的agg函数用法”,下面跟着我一起来了解一下吧!
文章插图
Pandans中的agg函数通常跟groupby函数一起使用,可以对数据进行一些聚合的操作,比如求和、求最大值最小值等等 。下面举个例子向大家说明:
df = pd.read_excel(r"E:/HH/H1.xlsx")dfa b cbob 18 46millor 20 22bob 30 99bob 40 23【什么是agg函数?python pandas中的agg函数用法】先在E盘打开一个excel表,并将它的数据读出来 。
1、获取a分组后b列的最大值
df.groupby(by='a').agg({'b':'max'}) 运行结果:
a b bob 40millor 30在a列中我们发现有三个“bob”,这里是通过groupby和agg函数一起对a例进行分组,分为“bob”和“millor”两组,再从这两组中对b列进行操作,找出b列中这两组最大的数据 。
2、获取按a分组后a列的最大值和最小值
df.groupby(by='a').agg({'b':['max','min']}) B max mina bob 40 18millor 20 20这里是通过groupby和agg函数一起对a例进行分组,再从这两组中对b列进行操作,找出b列中的最大值和最小值 。
3、获取按a分组后b列的最大值和最小值以及c列的最大值
df.groupby(by='a').agg({'b':['max','min'], 'c':'min'}) b c max min mina bob 40 18 23millor 20 20 23通过groupby和agg函数对excel表中的数据进行操作首先先对a列进行分组操作,再从a列数据中,对b列、c列同时进行操作,找出b列中的最大值和最小值以及c列中的最小值 。
4、默认是以函数名称命名的,可以修改
agg函数中,默认的名称是用函数命名,但是我们可以对函数的名称进行修改,比如以下代码:
df.groupby(by='a').agg(b_min=pd.NamedAgg(column='b', aggfunc='min'),b_max=pd.NamedAgg(column='b', aggfunc='max')) b_min b_maxa bob 18 40millor 20 20上述代码中是简单的对一个函数名进行修改,我们发现之前的“b”,现在已经改了变成了我们设定的“b_min”、“ b_max”,对其他列也可以进行相同的操作,可以动手试试哦 。
以上就是关于“什么是agg函数?python pandas中的agg函数用法”的简单介绍,赶紧动手试试吧,以便于加深理解 。
推荐阅读
- 什么是groupby函数?python中聚合函数groupby的用法
- Python可变参数是什么?Python函数可变参数怎么写
- python中的枚举类是什么?如何进行枚举类的定义?
- 鲜花的拼音,鲜花的英语,鲜花的日语,鲜花的外语大全
- 淘宝新店前期怎么获取流量?引爆举措是什么?
- 天猫直营店商品是正品吗?与官方旗舰店有什么区别?
- 淘宝店铺基础建设核心要素是哪些?附设置详情
- 2021年开网店卖什么好?什么比较好卖?
- 开一个花店需要多少成本?
- 多肉缓苗期一般是多久?多肉植物缓苗技巧