pandas
小技巧系列是介绍的是使用pandas
分析数据时,最常用的一些操作技巧。
具体包括:
(资料图)
读取多个文件日常分析数据时,只有单一数据文件的情况其实很少见,更多的情况是,我们从同一个数据来源定期或不定期的采集了很多数据文件;或者从不同的数据源采集多种不同格式的数据文件。
本篇介绍读取多个文件的技巧。
修改列的名称重命名 pandas 数据中列的名称是一种常见的数据预处理任务。通常是因为原始数据中的列名称可能不够清晰或准确。例如,列名可能包含空格、大写字母、特殊字符或拼写错误。
本篇介绍修改列名称的技巧。
反转行列顺序反转pandas DataFrame的行列顺序是一种非常实用的操作。
本篇介绍几种pandas中常用的反转行列顺序的方法。
拆分列拆分列是pandas中常用的一种数据操作,它可以将一个包含多个值的列按照指定的规则拆分成多个新列,方便进行后续的分析和处理。
本篇简要介绍下pandas拆分列的常用方法。
数据转置所谓数据转置,就是是将原始数据表格沿着对角线翻折,使原来的行变成新的列,原来的列变成新的行,从而更方便地进行数据分析和处理。
本篇介绍几个数据转置常用的场景,感受下转置前后数据展示的区别。
category类型补充category类型在pandas基础系列中有一篇介绍数据类型的文章中已经介绍过。category类型并不是python中的类型,是pandas特有的类型。
本篇将补充介绍深入使用category类型时,经常会遇到的两个问题。
DataFrame显示参数我们在jupyter notebook中使用pandas显示DataFrame的数据时,由于屏幕大小,或者数据量大小的原因,常常会觉得显示出来的表格不是特别符合预期。
这时,就需要调整pandas显示DataFrame的方式。pandas为我们提供了很多调整显示方式的参数,具体参见文末附录中的链接。本篇介绍几个我经常用到的参数来抛砖引玉。
关键词: