Я пишу программу для чтения RSS на python в качестве обучающего упражнения, и мне бы очень хотелось иметь возможность помечать отдельные записи ключевыми словами для поиска. К сожалению, большинство реальных каналов не содержат метаданных ключевых слов. В настоящее время в моей тестовой базе данных имеется около 60 000 записей из примерно 600 каналов, поэтому ручная пометка не будет эффективной. Пока мне удалось найти только два решения:
1: использовать Natural Language Toolkit для извлечения ключевых слов:
2: Используйте Google Adwords API , чтобы получать предложения ключевых слов из URL статьи:
Кто-нибудь может предложить какие-нибудь предложения? Являются ли мои опасения по поводу блокировки моей учетной записи AdWords необоснованными?