проверить наличие значения на другом Датафрейме

Поместите это в свой gitconfig:

reduce-to-subfolder = !sh -c 'git filter-branch --tag-name-filter cat --prune-empty --subdirectory-filter cookbooks/unicorn HEAD && git reset --hard && git for-each-ref refs/original/ | cut -f 2 | xargs -n 1 git update-ref -d && git reflog expire --expire=now --all && git gc --aggressive --prune=now && git remote rm origin'
1
задан jezrael 31 March 2019 в 00:16
поделиться

1 ответ

Использовать:

#if necessary replace string NaN to missing values
F1 = F1.replace('NaN', np.nan)
F2 = F2.replace('NaN', np.nan)

Для каждого столбца удалить дубликаты по DataFrame.drop_duplicates , пропустить valeus по DataFrame.dropna и создать индекс по столбцу id DataFrame.set_index :

s1 = F2.drop_duplicates('id1').dropna(subset=['id1']).set_index('id1')['Description']
s2 = F2.drop_duplicates('id2').dropna(subset=['id2']).set_index('id2')['Description']

Затем используйте Series.map по столбцам из F1 с Series.combine_first : [1117 ]

F1['Description'] = F1['id1'].map(s1).combine_first(F1['id2'].map(s2))
print (F1)
    id1  id2 Description
0   x22  NaN  California
1   x13  223          LA
2   NaN  788          NY
3  x421  NaN      Munich
0
ответ дан jezrael 31 March 2019 в 00:16
поделиться
Другие вопросы по тегам:

Похожие вопросы: