Pandas dataframe samenvoegen resultaten Nans

stemmen
-1

Ik ben het samenvoegen van twee dataframes op een kolom die float64 in zowel de dataframes. Toch is de resulterende samengevoegde dataframe heeft NaN voor alle kolommen die afkomstig zijn van één van de twee dataframes.

Hier is de merge:

merged_df = pd.merge(tweets_df, news_merged_df, on='tweet_id')

Hier is informatie met betrekking tot de twee dataframes

news_merged_df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 1777939 entries, 0 to 1777938
Data columns (total 6 columns):
tweet_id    float64
news_id     object
label       bool
title       object
source      object
text        object
dtypes: bool(1), float64(1), object(4)


tweets_df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1844156 entries, 0 to 1844155
Data columns (total 13 columns):
level_0                  int64
index                    int64
tweet_id                 float64
tweet                    object
user_screen_name         object
user_id                  object
user_location            object
user_verified            bool
user_friends_count       int64
user_followers_count     int64
user_listed_count        int64
user_statuses_count      int64
user_favourites_count    int64
dtypes: bool(1), float64(1), int64(7), object(4)

Wat mis ik?

De vraag is gesteld op 03/12/2019 om 00:00
bron van user
In andere talen...                            


1 antwoorden

Pandas dataframe samenvoegen resultaten Nans

stemmen
-1

Ik ben het samenvoegen van twee dataframes op een kolom die float64 in zowel de dataframes. Toch is de resulterende samengevoegde dataframe heeft NaN voor alle kolommen die afkomstig zijn van één van de twee dataframes.

Hier is de merge:

merged_df = pd.merge(tweets_df, news_merged_df, on='tweet_id')

Hier is informatie met betrekking tot de twee dataframes

news_merged_df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 1777939 entries, 0 to 1777938
Data columns (total 6 columns):
tweet_id    float64
news_id     object
label       bool
title       object
source      object
text        object
dtypes: bool(1), float64(1), object(4)


tweets_df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1844156 entries, 0 to 1844155
Data columns (total 13 columns):
level_0                  int64
index                    int64
tweet_id                 float64
tweet                    object
user_screen_name         object
user_id                  object
user_location            object
user_verified            bool
user_friends_count       int64
user_followers_count     int64
user_listed_count        int64
user_statuses_count      int64
user_favourites_count    int64
dtypes: bool(1), float64(1), int64(7), object(4)

Wat mis ik?

antwoordde op 03/12/2019 om 00:00
bron van user

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more