广告位联系
返回顶部
分享到

Pandas库中isnull函数的实现

python 来源:互联网 作者:佚名 发布时间:2024-07-22 21:26:37 人浏览
摘要

一、简介 isnull()是Pandas库中DataFrame和Series对象的一个函数,用于检测数据中的缺失值。它返回一个布尔类型的DataFrame或Series,其中True表示该位置的值是缺失的(NaN或None),False表示该位置的值

一、简介

isnull()是Pandas库中DataFrame和Series对象的一个函数,用于检测数据中的缺失值。它返回一个布尔类型的DataFrame或Series,其中True表示该位置的值是缺失的(NaN或None),False表示该位置的值不是缺失的。

二、语法和参数

1

DataFrame.isnull()

isnull()函数没有参数。它直接应用于DataFrame或Series对象。

三、实例

3.1 基本使用

代码:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

import pandas as pd

import numpy as np

 

# 创建一个包含NaN和None的DataFrame

df = pd.DataFrame({

    'A': [1, np.nan, 3, None],

    'B': [4, 5, np.nan, 7],

    'C': [8, 9, 10, 11]

})

 

print("原始DataFrame:")

print(df)

 

print("\n使用isnull()后的结果:")

print(df.isnull())

输出:

原始DataFrame:
     A    B   C
0  1.0  4.0   8
1  NaN  5.0   9
2  3.0  NaN  10
3  NaN  7.0  11

使用isnull()后的结果:
       A      B      C
0  False  False  False
1   True  False  False
2  False   True  False
3   True  False  False

3.2 与sum()函数结合使用

代码:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

import pandas as pd

import numpy as np

 

df = pd.DataFrame({

    'A': [1, np.nan, 3, None],

    'B': [4, 5, np.nan, 7],

    'C': [8, 9, 10, 11]

})

 

print("每列缺失值的数量:")

print(df.isnull().sum())

 

print("\n每行缺失值的数量:")

print(df.isnull().sum(axis=1))

输出:

每列缺失值的数量:
A    2
B    1
C    0
dtype: int64

每行缺失值的数量:
0    0
1    1
2    1
3    1
dtype: int64

3.3 与布尔索引结合使用

代码:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

import pandas as pd

import numpy as np

 

df = pd.DataFrame({

    'A': [1, np.nan, 3, None],

    'B': [4, 5, np.nan, 7],

    'C': [8, 9, 10, 11]

})

 

print("原始DataFrame:")

print(df)

 

print("\n含有缺失值的行:")

print(df[df.isnull().any(axis=1)])

 

print("\n所有值都不缺失的行:")

print(df[df.notnull().all(axis=1)])

输出:

原始DataFrame:
     A    B   C
0  1.0  4.0   8
1  NaN  5.0   9
2  3.0  NaN  10
3  NaN  7.0  11

含有缺失值的行:
     A    B   C
1  NaN  5.0   9
2  3.0  NaN  10
3  NaN  7.0  11

所有值都不缺失的行:
     A    B  C
0  1.0  4.0  8

四、注意事项

  • isnull()函数可以检测NaN和None值,但不能检测空字符串或其他可能被视为"缺失"的值。
  • 对于非数值类型的列(如字符串或日期时间),只有None值会被视为缺失,而NaN不会。
  • isnull()的逻辑相反函数是notnull(),它返回True表示非缺失值,False表示缺失值。
  • 在处理大型数据集时,isnull()可能会消耗较多内存,因为它会创建一个与原DataFrame大小相同的新DataFrame。
  • isnull()和isna()是完全相同的函数,可以互换使用。
  • 在进行数据清洗和预处理时,isnull()是一个非常有用的工具,可以帮助识别和处理缺失数据。

版权声明 : 本文内容来源于互联网或用户自行发布贡献,该文观点仅代表原作者本人。本站仅提供信息存储空间服务和不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权, 违法违规的内容, 请发送邮件至2530232025#qq.cn(#换@)举报,一经查实,本站将立刻删除。
原文链接 :
相关文章
  • 使用Python自动化创建和扫描二维码

    使用Python自动化创建和扫描二维码
    二维码(Quick Response code)已成为在物理和数字领域之间架起桥梁的多功能工具。从分享联系信息和网站链接到促进支付和跟踪库存,二维码
  • Pandas库中isnull函数的实现
    一、简介 isnull()是Pandas库中DataFrame和Series对象的一个函数,用于检测数据中的缺失值。它返回一个布尔类型的DataFrame或Series,其中True表示该
  • Pandas库中ffill函数的具体使用
    一、简介 ffill(forward fill)是Pandas库中DataFrame和Series对象的一个函数,用于填充缺失值(NaN)。它通过使用前面的有效值来填充后续的缺失
  • Pandas库中dataframe.corr()函数的使用
    一、简介 dataframe.corr()是Pandas库中的一个函数,用于计算DataFrame中各列之间的相关系数。相关系数衡量的是两个变量之间线性关系的强度和方
  • Python Numpy运行报错:IndexError: too many indices for a
    Numpy运行报错分析:IndexError: too many indices for array 在使用Numpy进行数组操作时,经常会遇到各种错误。其中,IndexError: too many indices for array是
  • python os库使用教程

    python os库使用教程
    os库使用教程 1.创建文件夹 先在盘符里创建一个文件用来演示,我这里就创建一个os文件 1 2 3 4 5 6 7 8 import os #要创建的文件夹的路径 source
  • python连接池pooledDB源码阅读参数的使用
    pooledDB参数详解 from DBUtils.PooledDB import PooledDB 1 2 3 4 5 6 7 8 9 10 11 12 13 self.__pool = PooledDB(creator=pymysql, mincached=1, maxcached=4, # 连接池中最大空闲连
  • 使用Python在Word表格中插入或删除行或列的几种方

    使用Python在Word表格中插入或删除行或列的几种方
    所需Python库:Spire.Doc for Python。该Python Word库支持几乎所有的Word文档元素,可以在Word中实现创建、操作表格等。 可以通过pip进行安装: 1
  • cython加速python代码的方法实现
    python这个语言在使用的层面上看几乎没有缺点,简单易学,语法简单,唯一的弱点就是慢,当然了万能的python社区是给了解决方法的,那就
  • python PyQt5对象类型的判定及对象删除操作介绍

    python PyQt5对象类型的判定及对象删除操作介绍
    PyQt5类型判定 主要是用来判定一个对象的类型,或者说是否继承自某个类 相关API和应用场景如下 主要有两个方法 isWidgetType() 判断某个对象
  • 本站所有内容来源于互联网或用户自行发布,本站仅提供信息存储空间服务,不拥有版权,不承担法律责任。如有侵犯您的权益,请您联系站长处理!
  • Copyright © 2017-2022 F11.CN All Rights Reserved. F11站长开发者网 版权所有 | 苏ICP备2022031554号-1 | 51LA统计