跳至主要內容

Pandas 介绍

blacklad大约 1 分钟PythonPythonPandas

Pandas 介绍

1 简介

Pandas 是一个开源的 Python 数据分析和数据处理库,特别适合处理结构化数据。它基于 NumPy 构建,提供了快速便捷的数据操作工具。

常用功能

  • 数据导入导出:从Excel、CSV、网页等多种来源读取数据
  • 数据选择与过滤:可以通过标签(列名)或位置索引选择和过滤数据。
  • 数据清洗与处理:支持缺失值处理、数据类型转换、重复值处理等操作。
  • 数据聚合与分组:通过 groupbypivot_table 等方法进行数据分组和聚合操作。
  • 数据统计与分析:提供多种统计函数,如均值、标准差、最大值、最小值等。
  • 数据可视化:与 Matplotlib 集成,支持直接生成图表进行数据可视化。

2 学习前提

  1. Python
  2. Numpy

学习 Pandas 需要先掌握 Python 的基础语法~

3 安装

3.1 Anaconda

如果已经安装了 Anaconda,可以直接使用了,Anaconda中默认已经安装了 Pandas。

3.2 pip

安装 Python 环境后,可以使用 pip 命令可以快速安装 Pandas。

pip install pandas

安装 Pandas 后,会默认安装 Numpy。

4 使用

使用 import 即可导入 Pandas。

import pandas as pd

例子

创建一个包含姓名和年龄两列的表格信息。

import pandas as pd

data = {
    'name': ['Alice', 'Bob', 'Charlie'],
    'age': [25, 30, 35]
}
df = pd.DataFrame(data)
print(df)
      name  age
0    Alice   25
1      Bob   30
2  Charlie   35
上次编辑于:
贡献者: blacklad