Pandas 介绍
大约 1 分钟PythonPythonPandas
Pandas 介绍
1 简介
Pandas 是一个开源的 Python 数据分析和数据处理库,特别适合处理结构化数据。它基于 NumPy 构建,提供了快速便捷的数据操作工具。
常用功能
- 数据导入导出:从Excel、CSV、网页等多种来源读取数据
- 数据选择与过滤:可以通过标签(列名)或位置索引选择和过滤数据。
- 数据清洗与处理:支持缺失值处理、数据类型转换、重复值处理等操作。
- 数据聚合与分组:通过
groupby
、pivot_table
等方法进行数据分组和聚合操作。 - 数据统计与分析:提供多种统计函数,如均值、标准差、最大值、最小值等。
- 数据可视化:与
Matplotlib
集成,支持直接生成图表进行数据可视化。
2 学习前提
- Python
- Numpy
学习 Pandas 需要先掌握 Python 的基础语法~
3 安装
3.1 Anaconda
如果已经安装了 Anaconda,可以直接使用了,Anaconda中默认已经安装了 Pandas。
3.2 pip
安装 Python 环境后,可以使用 pip
命令可以快速安装 Pandas。
pip install pandas
安装 Pandas 后,会默认安装 Numpy。
4 使用
使用 import
即可导入 Pandas。
import pandas as pd
例子
创建一个包含姓名和年龄两列的表格信息。
import pandas as pd
data = {
'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35]
}
df = pd.DataFrame(data)
print(df)
name age
0 Alice 25
1 Bob 30
2 Charlie 35