我们常常在下载网络素材时会下载很多的重复文件乱七八糟的 , 如果想对所有的文件进行整理 , 然后去重的操作就显得很重要了 , 本文主要讲解的是Python文件如何去重操作?如何使用代码对Python文件去重?希望可以帮助到大家 。
文章插图
有时候我们打开文件夹 , 会看到各种各样的文件 , 有的文件大小一样 , 有的文件是数据重复了 , 为了解决Python文件去重的问题 , 最主要的操作就是将我们重复的文件进行筛选 , 然后在将文件进行删除 , 如果文件是好几百个 , 手动删除会影响效率 , 所以我们可以使用代码来进行操作 。在Python中有一个内置函数----filecmp , 就是用来对文件进行比较的 , 我们可以使用它来操作 。函数的使用方法如下;
filecmp.cmp(f1, f2, shallow=True)它包含了三个参数 , 其中前两个参数表示的是需要比较的两个文件的路径 , shallow它默认的值就是true , 是比较两个文件的元数据 , 包括创建的时间、大小 , 如果为false的时候 , 表示在对比文件的时候 , 还需要对文件的内容进行对比 。
代码实现:
from pathlib import Pathimport filecmppath1 = [path for path in Path(r'D:\......').iterdir() if path.is_file()]for front in range(len(path1) - 1): for later in range(front + 1, len(path1)): if filecmp.cmp(path1[front], path1[later], shallow=False): path1[front].unlink() # 删除文件 break为了安全起见 , 可以手动创建一个文件夹 , 然后在文件夹下创建几个文件 , 在将对文件进行内容发写入 , 之后再将文件全部进行复制 。
【Python文件如何去重操作?如何使用代码对Python文件去重?】到此这篇关于Python文件如何去重操作?如何使用代码对Python文件去重?的文章就介绍到这了,更多相关Python文件去重内容可以继续关注了解 。
推荐阅读
- Python怎么操作Excel单元格?Python如何让表格单元格居中
- 利用for循环如何遍历python字典?for循环遍历python字典的三种方法
- 如何使用python中的lambda函数?python中lambda匿名函数详解
- 如何使用tkinter模块对窗口进行操作? tkinter模块操作窗口的简单使用方法
- Python如何对文件进行读写压缩操作?Python读写压缩文件的方法有哪些?
- Python字典如何操作查找数据?Python字典查找数据的基本方法
- Python怎么对图像加密?Python加密后的图像如何解密
- Python怎么用哈希实现密码加密?Python中密码怎么哈希加密
- Python如何抓取酷狗音乐榜单?怎么使用Python爬取酷狗音乐前500榜单
- 如何用Pycharm编辑器做断点调试?Pycharm断点调试快捷键是什么