Python怎么引入数据集?Python数据集如何处理

在python之中数据集指的是包含了数据的集合,在一般情况下数据集表示的都是保存了数据的文件,那么引入数据集就是打开文件并去读取的过程 。这篇文章文章会来讲解一下python引入和处理数据集的几个方法,一起往下看看吧 。

Python怎么引入数据集?Python数据集如何处理

文章插图
一、txt文件
txt类型的文件是最为基础的文本类型文件,虽然可以使用open()函数直接将其打开并把数据全部都给读取出来 。但是如果里面是以行列形式保存数据的话就需要用到numpy模块的loadtxt()方法了,它可以指定将数据集数据以原本的格式读取出来,示例如下:
# 导入模块from numpy import loadtxt# 文件路径filename=input("文件路径:")# 打开文件with open(filename,'rt',encoding='UTF-8') as raw_data:# 读取数据集    data=https://www.ycpai.cn/python/loadtxt(raw_data,delimiter=',') print(data)二、csv文件
csv类型的文件就是一个以表格形式来保存数据的文件类型,它可以在excel格式和csv格式之间进行转换 。而python对于csv类型的文件是有着一个标准库去可以实现读取操作的,示例如下:
from csv import readerimport numpy as npfilename=input("请输入文路径名: ")# 打开文件witho pen(filename,'rt',encoding='UTF-8') as raw_data:    # 读取数据集    readers=reader(raw_data,delimiter=',')    # 转为列表类型    x=list(readers)    # 转为数组类型    data=https://www.ycpai.cn/python/np.array(x) # 输出数据集内容 print(data)【Python怎么引入数据集?Python数据集如何处理】以上就是关于“Python怎么引入数据集?Python数据集如何处理”的全部内容了,想要了解更多python的实用知识和代码示例可以持续关注这个频道,每次更新都会有很多新的知识技术分享给大家 。

    推荐阅读