Pandas Dataframe merge Ergebnisse in NaNs

stimmen
-1

Ich Zusammenführen von zwei Datenrahmen auf einer Säule, die in beide dem Datenrahmen ist float64. Doch die daraus resultierende fusionierte Datenrahmen hat NaNs für alle Spalten, die von einem der beiden Datenrahmen kommen.

Hier ist die Zusammenführung:

merged_df = pd.merge(tweets_df, news_merged_df, on='tweet_id')

Hier Informationen in Bezug auf die beiden Datenrahmen

news_merged_df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 1777939 entries, 0 to 1777938
Data columns (total 6 columns):
tweet_id    float64
news_id     object
label       bool
title       object
source      object
text        object
dtypes: bool(1), float64(1), object(4)


tweets_df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1844156 entries, 0 to 1844155
Data columns (total 13 columns):
level_0                  int64
index                    int64
tweet_id                 float64
tweet                    object
user_screen_name         object
user_id                  object
user_location            object
user_verified            bool
user_friends_count       int64
user_followers_count     int64
user_listed_count        int64
user_statuses_count      int64
user_favourites_count    int64
dtypes: bool(1), float64(1), int64(7), object(4)

Was vermisse ich?

Veröffentlicht am 03/12/2019 um 00:00
quelle vom benutzer
In anderen Sprachen...                            


1 antworten

Pandas Dataframe merge Ergebnisse in NaNs

stimmen
-1

Ich Zusammenführen von zwei Datenrahmen auf einer Säule, die in beide dem Datenrahmen ist float64. Doch die daraus resultierende fusionierte Datenrahmen hat NaNs für alle Spalten, die von einem der beiden Datenrahmen kommen.

Hier ist die Zusammenführung:

merged_df = pd.merge(tweets_df, news_merged_df, on='tweet_id')

Hier Informationen in Bezug auf die beiden Datenrahmen

news_merged_df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 1777939 entries, 0 to 1777938
Data columns (total 6 columns):
tweet_id    float64
news_id     object
label       bool
title       object
source      object
text        object
dtypes: bool(1), float64(1), object(4)


tweets_df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1844156 entries, 0 to 1844155
Data columns (total 13 columns):
level_0                  int64
index                    int64
tweet_id                 float64
tweet                    object
user_screen_name         object
user_id                  object
user_location            object
user_verified            bool
user_friends_count       int64
user_followers_count     int64
user_listed_count        int64
user_statuses_count      int64
user_favourites_count    int64
dtypes: bool(1), float64(1), int64(7), object(4)

Was vermisse ich?

Beantwortet am 03/12/2019 um 00:00
quelle vom benutzer

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more