首页 > pandas 阅读数:224

Python pandas教程

Python pandas库图标pandas 库是用于数据分析的著名开源 Python 库。

pandas 是以 NumPy 为基础进行设计的,因此 pandas 不仅能与其他大多数模块兼容,而且还能借力 NumPy 模块强大的计算能力,因此,在数据分析中 pandas 和 NumPy 这两个模块经常是一起使用,用于数据挖掘和数据分析,同时也提供数据清洗功能。

注意:在安装 pandas 之前,先要安装 Python。

pandas 是目前所有使用 Python 语言研究和分析数据集的专业人士在做相关统计分析和决策时都需要使用的不可或缺的工具。pandas 的核心是 Series 和 DataFrame 两大数据结构,数据分析相关的所有事务都是围绕着这两种结构进行的。

Series 是一种类似于一维数组的对象,它是由一组数据(可以是 NumPy 中任意类型的数据)以及一组与之相关的数据标签组成的。

DataFrame 对象的数据结构与工作表(最常见的是 Excel 工作表)极为相似,其设计初衷是将 Series 的使用场景由一维扩展到多维。DataFrame 数据结构是由按一定顺序排列的多列数据组成的,各列的数据类型可以有所不同(数值、字符串或布尔值等)。

这套 Python pandas 的教程,它将教会你如何快速便捷的处理数据。

教程目录
1. Python pandas简介
2. Python pandas测试、安装与导入
3. pandas Series对象创建及常用操作
4. pandas DataFrame对象创建及常用操作
5. pandas index索引对象
6. pandas reindex重新索引
7. pandas层级索引
8. pandas数据结构之间的运算
9. pandas数据筛选与数据统计函数汇总
10. pandas apply()与DataFrame()函数
11. pandas Series和DataFrame的排序与排名
12. pandas文件读写简介
13. pandas文本文件的读写
14. pandas Excel文件的读写
15. pandas数据库的使用
16. Python JSON文件读写简明教程
17. pandas基本统计分析
18. pandas分组分析
19. pandas分布分析
20. pandas交叉分析
21. pandas结构分析
22. pandas相关分析
23. pandas重复值的处理
24. pandas缺失值的处理
25. pandas异常值的处理
26. pandas按键连接数据(merge()和join())
27. pandas沿轴连接数据(concat()和append())
28. pandas合并重叠数据(combine_first())
29. pandas数据的字段抽取与拆分
30. pandas数据的记录抽取
31. pandas重塑层次化索引(stack()和unstack())
32. pandas映射与数据转换
33. pandas排列与随机抽样
34. pandas日期转换、日期格式化和日期抽取
35. Python内置的字符串处理方法
36. Python正则表达式简明教程
37. pandas矢量化的字符串函数
相关链接: