数据的聚合和分组
00 min
2024-5-13

统计函数

1、求最值

  • pd.Series.max():Series对象中的最大值
  • pd.Serise.min():Series对象中的最大值
  • pd.DataFrame.min(axis =0, skipna=True, level=None, numeric_only=None) df最小值
  • pd.DataFrame.min(axis =0, skipna=True, level=None, numeric_only=None) df最大值
    • axis:{index (0), columns (1)};计算方向
    • skipna:bool, default True;计算是否跳过缺失值,默认跳过
    • level (不做了解)
    • numeric_only:bool, default None;只包含浮点数、整型、布尔值列。如果没有,则尝试使用所有数据,然后只使用数值数据。
下面的例子会以pd.DataFrame.min方法的axis和skipna参数进行讲解
对于DataFrame的最值函数来说,默认都是从axis=0方向求最值,并且计算过程中默认也不会考虑缺省值。

2、求代表值

代表整个数据中心的值称为代表值。代表值有多个种类,在这里讲解平均值(mean)、中位数(median)和众数(mode)等代表值。
  • pd.DataFrame.mean(axis =0, skipna=True, level=None, numeric_only=None) df平均值
  • pd.DataFrame.median(axis =0, skipna=True, level=None, numeric_only=None) df中位数
  • pd.DataFrame.mode(axis =0, dropna=True, numeric_only=False) df众数
有些情况下数据可能存在多了众数。如果当DataFrame对象的元素全部是唯一值,那么所有元素出现的频率都是1,因此所有元素都是众数。

3、求方差