wake-up-neo.net

Überprüfen, ob ein bestimmter Wert (in einer Zelle) NaN in Pandas ist

Nehmen wir an, ich habe folgende pandasDataFrame:

import pandas as pd
df = pd.DataFrame({"A":[1,pd.np.nan,2], "B":[5,6,0]})

Was würde aussehen:

>>> df
     A  B
0  1.0  5
1  NaN  6
2  2.0  0

Erste Wahl

Ich kenne eine Möglichkeit, um zu prüfen, ob ein bestimmter Wert NaN ist, und zwar wie folgt:

>>> df.isnull().ix[1,0]
True

Zweite Option (funktioniert nicht)

Ich dachte, die unten stehende Option mit ix würde auch funktionieren, aber es ist nicht:

>>> df.ix[1,0]==pd.np.nan
False

Ich habe auch iloc mit den gleichen Ergebnissen versucht:

>>> df.iloc[1,0]==pd.np.nan
False

Wenn ich jedoch mit ix oder iloc nach diesen Werten suche, bekomme ich:

>>> df.ix[1,0]
nan
>>> df.iloc[1,0]
nan

Warum funktioniert die zweite Option nicht? Ist es möglich, mit NaN oder ix nach iloc-Werten zu suchen?

10
Cedric Zoppolo

Versuche dies:

In [107]: pd.isnull(df.iloc[1,0])
Out[107]: True
19
MaxU

pd.isna(cell_value) kann verwendet werden, um zu überprüfen, ob ein gegebener Zellwert nan ist. Alternativ können Sie pd.notna(cell_value) verwenden, um das Gegenteil zu überprüfen.

Aus dem Quellcode von Pandas:

def isna(obj):
    """
    Detect missing values for an array-like object.

    This function takes a scalar or array-like object and indicates
    whether values are missing (``NaN`` in numeric arrays, ``None`` or ``NaN``
    in object arrays, ``NaT`` in datetimelike).

    Parameters
    ----------
    obj : scalar or array-like
        Object to check for null or missing values.

    Returns
    -------
    bool or array-like of bool
        For scalar input, returns a scalar boolean.
        For array input, returns an array of boolean indicating whether each
        corresponding element is missing.

    See Also
    --------
    notna : Boolean inverse of pandas.isna.
    Series.isna : Detect missing values in a Series.
    DataFrame.isna : Detect missing values in a DataFrame.
    Index.isna : Detect missing values in an Index.

    Examples
    --------
    Scalar arguments (including strings) result in a scalar boolean.

    >>> pd.isna('dog')
    False

    >>> pd.isna(np.nan)
    True

Die obige Antwort ist ausgezeichnet. Hier ist dasselbe mit einem Beispiel zum besseren Verständnis.

>>> import pandas as pd
>>>
>>> import numpy as np
>>>
>>> pd.Series([np.nan, 34, 56])
0     NaN
1    34.0
2    56.0
dtype: float64
>>>
>>> s = pd.Series([np.nan, 34, 56])
>>> pd.isnull(s[0])
True
>>>

Ich habe es auch einige Male versucht, die folgenden Versuche funktionierten nicht. Vielen Dank an @MaxU.

>>> s[0]
nan
>>>
>>> s[0] == np.nan
False
>>>
>>> s[0] is np.nan
False
>>>
>>> s[0] == 'nan'
False
>>>
>>> s[0] == pd.np.nan
False
>>>
1
hygull