首页 > pandas 阅读数:18

pandas文件读写简介

通过学习前面几节 pandas 数据分析基础知识,了解了 pandas 库中的 Series 和 DataFrame 两种核心数据结构及它们的常用操作,明确了 Python 的数据处理、数据计算和数据分析都是围绕着这两种数据结构展开的。

在现实世界中,数据的存储形式常分为文件和数据库两大类,具体见表 1。因此,为了实现数据处理,首先需要解决的问题是如何从文件或数据库中读取数据,并将其存储为 DataFrame 对象,或将处理后的 DataFrame 中的数据存储到文件或数据库中。
 
表 1:数据的存储形式
存储 存储形式 说明
文件 CSV 用“,”分割列的文件,又称为字符分隔文件
Excel 微软办公软件 Excel 文件
TXT 纯文本文件
JSON 一种轻量级的数据交换格式文件
数据库 MySQL 开源的数据库
Access 微软办公软件 Access 文件
SQL Server 微软企业级数据库
... 其他数据库

pandas 库为实现文件的读取与写入提供了专门的工具—— I/O API 函数,这些函数可分为完全对称的两大类——读取函数和写入函数。常用的读/写数据源主要有文本文件、Excel 文件、数据库文件和 JSON 文件,下面将分别介绍读/写这4类数据文件的操作。