扫码阅读
手机扫码阅读
pandas及常见数据处理基础

我们非常重视原创文章,为尊重知识产权并避免潜在的版权问题,我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容,访问作者的公众号页面获取完整文章。


Python学习杂记
扫码关注公众号
Pandas 数据分析库介绍:本文介绍了Python中最常用的数据分析库pandas,并提供了一系列基础知识和常用函数的使用方法,以帮助初学者理解如何进行高效的大型数据集操作。
导入数据:
演示了如何使用pandas导入Excel数据:
import pandas as pd
df1 = pd.read_excel('客户基本信息1.xlsx')
并提到pandas支持多种数据类型的文件读取。
更改标题和索引:
介绍了如何更改数据框(df1)的列标题和行索引:
df1.columns = ['A', 'B', 'C']
df1.index = ['A1', 'A2', 'A3', 'A4', 'A5', 'A6', 'A7']
数据切片(iloc和loc):
解释了iloc和loc的区别,示范了如何使用这两种方法进行数据切片。
数据的拼接:
演示了如何拼接两个数据表,并解释了如何使用不同的参数来保留特定数据。
删掉某些行和列的操作:
展示了如何删除数据框中的特定行和列。
新的数据更新:
讨论了如何向数据框中添加新列和新行,以及如何更新索引。
按某列数据分组:
详细说明了如何按照某个列进行数据分组,如何重置索引,以及如何设置小数点位数。
筛选数据:
讲述了单条件筛选和多条件筛选的方法,以及如何实现数据透视表的功能。
分箱:
介绍了如何对数据进行分箱处理。
计算某个数据出现的频次:
示例了如何计算数据中特定元素出现的频率。
隐藏某个字符:
提供了隐藏数据框中特定字符的技巧。
数据导出:
最后,教授了如何将处理后的数据导出到Excel文件。
想要了解更多内容?


Python学习杂记
扫码关注公众号
Python学习杂记的其他文章
folium的一些定制化操作
folium是一个非常好的画图包,可以在地图上标点、画线、标区域等。但有时候我们需要定制化的操作,本文将详细介绍一些常用的一些定制化方法。
定制Pandas导出数据表的式样
pandas是python中常用的数据处理库,但是其输出的数据样式比较粗糙,本文介绍如何定制pandas导出的式样。
Python的sys模块详解
sys是Python的内建模块,提供了对Python解释器使用或维护的一些变量的访问。
Python中的with语句:优化上下文资源管理
在 Python中,with语句是一种用于管理资源的方式。它提供了一种自动处理资源释放的机制,确保在代码块执行完后,相关的资源得到清理。
禁忌搜索算法原理介绍
禁忌搜索算法是一种用于解决组合优化问题的启发式搜索算法。
加入社区微信群
与行业大咖零距离交流学习


PMO实践白皮书
白皮书上线
白皮书上线