Pandas

来自牛奶河Wiki
阿奔讨论 | 贡献2022年12月28日 (三) 11:27的版本 (创建页面,内容为“===Pandas 简介===     Pandas 是一个开放源码、BSD 许可的库,提供高性能、易于使用的数据结构和数据分析工具。Pandas 库基于 NumPy 库(提供高性能的矩阵运算)开发而来,可以与之配合使用。Pandas 提供了两种数据结构,分别是 Series(一维数组结构)与 DataFrame(二维数组结构) ===Pandas 基础=== ====Series==== *Series 类似表格中的一个列(column),类似于一…”)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳到导航 跳到搜索

Pandas 简介

    Pandas 是一个开放源码、BSD 许可的库,提供高性能、易于使用的数据结构和数据分析工具。Pandas 库基于 NumPy 库(提供高性能的矩阵运算)开发而来,可以与之配合使用。Pandas 提供了两种数据结构,分别是 Series(一维数组结构)与 DataFrame(二维数组结构)

Pandas 基础

Series

  • Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。
  • Series 由索引(index)和列组成,函数如下:
  • pandas.Series( data, index, dtype, name, copy)

DataFrame

  • DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。
  • DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。
  • pandas.DataFrame( data, index, columns, dtype, copy)
DataFrame
  • get column
    • df2.columns
    • df2.columns[0]
  • 删除 Apple 列值为空的行
    • df1.dropna(subset=['Apple'])