一张表搞定 Pandas 核心功能,新手也能秒懂

谈到用Python做数据分析,那就少不了对Pandas库引用!针对繁多的函数;我在这里整理了 Pandas 核心功能,覆盖数据读取、清洗等常用方法。希望可以协助到有需要的小伙伴,快速上手项目。

一、数据创建与输入输出

用来“造数据、读文件、存文件”,是任何项目的第一步。

pd.DataFrame(), pd.Series()
pd.read_csv(), pd.read_excel()
df.to_csv(), df.to_excel()

技巧:

  • pd. 一般用于“读入文件”
  • df. 一般用于“输出文件”
  • CSV 是最通用格式,Excel 适合展示汇报

二、数据查看与信息统计

数据读进来,第一步要知道它“长啥样”。

df.head(), df.tail(), df.info(), df.describe()
df.columns, df.index, df.dtypes

技巧:

  • df.head() 看前 5 行
  • df.info() 看列名、类型、缺失值
  • df.describe() 自动统计平均值、标准差、分布范围

三、数据选择与索引

想取某几行某几列?这几招最常用!

df.loc[], df.iloc[], df.at[], df.iat[], df.filter()

技巧:

  • loc 是按名字取
  • iloc 是按位置取
  • filter 可以模糊匹配列名

四、数据清洗与缺失处理

数据不干净?这里是 Pandas 的杀手级功能!

df.dropna(), df.fillna(), df.replace(), df.drop()
pd.isnull()

技巧:

  • dropna() 删除缺失行
  • fillna() 用均值/中位数填补空值
  • replace() 替换错误值(如 “—” → NaN)

五、数据转换与重命名

想要统一格式?批量处理列?直接用这些。

df.astype(), df.apply(), df.rename()

技巧:

  • apply() = 批量应用函数
  • astype() = 改类型
  • rename() = 改列名(配合字典)

六、统计与聚合分析

一行就能算平均值、相关性、标准差。

df.sum(), df.mean(), df.std(), df.corr()

技巧:

  • corr() = 变量间相关性
  • mean() = 常用于 KPI 平均分析

七、分组与聚合操作

数据分析的灵魂操作,最像 Excel 透视表。

df.groupby(), df.agg(), df.transform()

技巧:

  • groupby('列') → 按列分组
  • agg() → 批量统计,如求和、均值、计数

八、数据排序与合并

数据太乱?轻松排序、拼接表格!

df.sort_values(), df.sort_index()
df.merge(), df.join(), pd.concat()

技巧:

  • merge() 类似 SQL join
  • concat() 纵向拼表

九、数据透视与变形

想做“长表转宽表”?就像 Excel 透视表。

df.pivot(), df.melt(), df.stack(), df.unstack()

技巧:

  • pivot():行列互转
  • melt():压平结构(长表)

十、时间序列与索引管理

Pandas 原生支持时间序列,超级强劲。

pd.to_datetime(), df.resample(), df.shift(), df.rolling()
df.set_index(), df.reset_index(), df.reindex()

技巧:

  • to_datetime() 转时间格式
  • resample() 做时间分组(如按月统计)
  • rolling() 做移动平均

十一、总结:一张表看全 Pandas 核心逻辑

一张表搞定 Pandas 核心功能,新手也能秒懂

#Python##Pandas##数据分析#

© 版权声明
THE END
如果内容对您有所帮助,就支持一下吧!
点赞0 分享
无语乐坛的头像 - 鹿快
评论 共5条

请登录后发表评论