更新时间:2022年11月04日11时24分 来源:传智教育 浏览次数:
在Python中,我们可以通过dropna()方法来删除含有空值或缺失值的行或列,其语法格式如下:
dropna(axis=0, how='any', thresh=None, subset=None, inplace=False
上述方法中部分参数表示的含义如下:
(1)axis:确定过滤行或列,取值可以为:
◆0或index:删除包含缺失值的行,默认为0。
◆1或columns:删除包含缺失值的列。
(2)how:确定过滤的标准,取值可以为:
◆any:默认值。如果存在NaN值,则删除改行或该列。
◆all:如果所有值都是NaN值,则删除改行或该列。
(3)thresh:表示有效数据量的最小要求。若传入了2,则是要求该行或该列至少有两个非NaN值时将其保留。
(4)subset:表示在特定的子集中寻找NaN值。
(5)inplace:表示是否在原数据上操作。如果设为True,则表示修改原始数据的副本,返回新的数据。
假设,现在有一张关于书籍信息的表格,它里面有类别、书名和作者三列数据。其中,在索引为0的一行中作者为None,则表明该位置的数据是空值。如果删除这些空值和缺失值,那么删除前后的效果如图4-1所示。
图4-1 删除空值/缺失值前后的表格