今天的内容当中将会给大家带来有关pandas数据分析模块怎么在Python中使用?pandas数据分析模块的使用方法,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获 。
文章插图
一、创建对象
在使用数据模块之前,我们需要导入pandas,导入方法如下:
import pandas as pdimport numpy as npimport matplotlib.pyplot as plt这里常规的导入了三个模块 。
二、Series
它是一个拥有固定长度的有序字典,可以保存很多种数据,比方说整数、字符串、浮点数等等 。其中包括两种比较重要的属性,一个是index还有一个是values,数据可以是一个python字典 。使用的时候index都会有一个默认的下标存在,但是索引就会使用创建时的索引,以为它使用的是一个数组,你也可以指定一个name名字属性,如果要进行修改,就使用rename的方法下面看一个例子:
s1 = pd.Series(range(1, 5),index=list('ABCDE'))print(s1)# 下标和索引等同
print(s1['A'])
print(s1[0])
运行结果如下:
A 1B 2C 3D 4E 5dtype: int6411在这个例子中,我们是运用Series的方法对一组数组进行操作,在输出的时候可以发现利用元素的下标输出跟直接索引输出结果是一样的 。
【pandas数据分析模块怎么在Python中使用?pandas数据分析模块的使用方法】还可以连续取出多个值:
print(s1['A':'C'])print(s1[0:2])输出:
A 1B 2C 3dtype: int64A 1B 2dtype: int64通过上述例子中,可以发现在取值的时候,用下标取值和索引切片取值是区别的,区别在于下标取值的时候不包括结束的位置,而索引取值会把结束的位置也一起取出来 。
三、DataFrame
可以把它看成是一个sql表,在pandas中是比较常用的一种对象,它也像series一样,可以接受多种数据类型 。
举个例子:
h1 = pd.DataFrame(np.random.randint(1,5,(3,4)), - index=list('ABC'),columns=list('abcd'))上面的index表示的是对行可以进行索引,而colums表示的是对列的索引,在对某个字典的创建中,其中的键名就是表示的是一个列索引,键值可以看成是一个列表,它具有自动补齐功能 。
可以对一行或者一列进行单独取出
对列进行取值,取出来的是一个它的对象,如下:
print(h1['b'])print(h1['b'].values)也可以指定某一行或者某一列进行数据的取出
print(h1['a']['B'])print(h1['a'][1])这两种方式相同
取不连续多列,取连续多列,默认不支持连续,如果想不连续取出还需要用到高级索引 。
取不连续多列
print(h1[['a','d']])行索引,可以直接切片,但是默认不能不连续多行取值,下标也是一样
print('行索引取值##############')print(h1['A':'A'])如果要取连续多行就是h1['A':'C']
以上就是有关“pandas数据分析模块怎么在Python中使用?pandas数据分析模块的使用方法”的全部内容了,希望对大家的学习带来一定的帮助 。
推荐阅读
- 什么是agg函数?python pandas中的agg函数用法
- Pandas中函数有哪些?怎么使用pandas apply函数?
- PPT图表制作技巧与案例 PPT数据分析图制作教程
- 如何使用Excel 2010做数据分析工具?
- python的导入模块语句如何使用?python想要导入模块用什么语句?
- 如何查看python的模块成员?python的模块成员如何查看?
- python中的模块是什么意思?如何理解python中的模块?
- Python用turtle模块绘图怎么设置颜色?Python画笔颜色设置方法
- 手机淘宝店铺推荐模块怎么添加宝贝?
- Liunx运行python脚本报错为什么?Python脚本运行提示没有模块怎么办