统计函数
1、求最值
- pd.Series.max():Series对象中的最大值
- pd.Serise.min():Series对象中的最大值
- pd.DataFrame.min(axis =0, skipna=True, level=None, numeric_only=None) df最小值
- pd.DataFrame.min(axis =0, skipna=True, level=None, numeric_only=None) df最大值
- axis:{index (0), columns (1)};计算方向
- skipna:bool, default True;计算是否跳过缺失值,默认跳过
- level (不做了解)
- numeric_only:bool, default None;只包含浮点数、整型、布尔值列。如果没有,则尝试使用所有数据,然后只使用数值数据。
下面的例子会以pd.DataFrame.min方法的axis和skipna参数进行讲解
对于DataFrame的最值函数来说,默认都是从axis=0方向求最值,并且计算过程中默认也不会考虑缺省值。
2、求代表值
代表整个数据中心的值称为代表值。代表值有多个种类,在这里讲解平均值(mean)、中位数(median)和众数(mode)等代表值。
- pd.DataFrame.mean(axis =0, skipna=True, level=None, numeric_only=None) df平均值
- pd.DataFrame.median(axis =0, skipna=True, level=None, numeric_only=None) df中位数
- pd.DataFrame.mode(axis =0, dropna=True, numeric_only=False) df众数
有些情况下数据可能存在多了众数。如果当DataFrame对象的元素全部是唯一值,那么所有元素出现的频率都是1,因此所有元素都是众数。