DSM имеет принятый ответ, но в этом ответе немного ошибочно (я не уверен, что ответ когда-либо работал в готовом виде). Вот пример, который работает с текущей версией pandas (0.23.4 с 8/2018):
import pandas as pd
df = pd.DataFrame({'col1': [1, 2, 2, 3, 1],
'col2': ['negative', 'positive', 'neutral', 'neutral', 'positive']})
conversion_dict = {'negative': -1, 'neutral': 0, 'positive': 1}
df['converted_column'] = df['col2'].replace(conversion_dict)
print(df.head())
Вы увидите, что это выглядит так:
col1 col2 converted_column
0 1 negative -1
1 2 positive 1
2 2 neutral 0
3 3 neutral 0
4 1 positive 1
Документы для pandas.DataFrame.replace здесь .
Если под расширениями файла вы подразумеваете количество периодов в имени файла, вы можете просто посчитать '.' символ в каждом имени файла. Например:
var myFilenames = new[] { "pic.jpng", "manuel.pdf", "manuel.pdf.exe" };
var twoOrMoreExtensions = myFilenames.Where(f => f.Count(x => x == '.') >= 2);
foreach (var filename in twoOrMoreExtensions)
{
Console.WriteLine(filename);
}
запишет:
manuel.pdf.exe
blockquote>Как уже указывалось в комментариях, если вы включите
pic_21.03.2007_.jpng
, это будет иметь «3 расширения» на основе этого правила.