Ich habe einen Datenrahmen in pandas mit gemischten int- und str-Datenspalten. Ich möchte zuerst die Spalten innerhalb des Datenrahmens verketten. Dazu muss ich eine int
- Spalte in konvertieren str
. Ich habe versucht, wie folgt zu tun:
mtrx['X.3'] = mtrx.to_string(columns = ['X.3'])
oder
mtrx['X.3'] = mtrx['X.3'].astype(str)
aber in beiden Fällen funktioniert es nicht und ich erhalte die Fehlermeldung "Str- und Int-Objekte können nicht verkettet werden". Die Verkettung von zwei Spalten str
funktioniert einwandfrei.
In [16]: df = DataFrame(np.arange(10).reshape(5,2),columns=list('AB'))
In [17]: df
Out[17]:
A B
0 0 1
1 2 3
2 4 5
3 6 7
4 8 9
In [18]: df.dtypes
Out[18]:
A int64
B int64
dtype: object
Konvertieren Sie eine Serie
In [19]: df['A'].apply(str)
Out[19]:
0 0
1 2
2 4
3 6
4 8
Name: A, dtype: object
In [20]: df['A'].apply(str)[0]
Out[20]: '0'
Vergessen Sie nicht, das Ergebnis zurück zu geben:
df['A'] = df['A'].apply(str)
Konvertieren Sie den gesamten Frame
In [21]: df.applymap(str)
Out[21]:
A B
0 0 1
1 2 3
2 4 5
3 6 7
4 8 9
In [22]: df.applymap(str).iloc[0,0]
Out[22]: '0'
df = df.applymap(str)
Ändern Sie den Datentyp der DataFrame-Spalte:
Bis int:
df.column_name = df.column_name.astype(np.int64)
Zu str:
df.column_name = df.column_name.astype(str)
Warnung : Beide Lösungen haben ( als Typ () angegeben und gelten () ) NULL-Werte weder in der Form nan noch in der Form None beibehalten.
import pandas as pd
import numpy as np
df = pd.DataFrame([None,'string',np.nan,42], index=[0,1,2,3], columns=['A'])
df1 = df['A'].astype(str)
df2 = df['A'].apply(str)
print df.isnull()
print df1.isnull()
print df2.isnull()
Ich glaube, dies wird durch die Implementierung von to_string () behoben
Verwenden Sie den folgenden Code:
df.column_name = df.column_name.astype('str')