В настоящее время мы написали алгоритм на Ruby на основе кода читабельности arc90 для извлечения статьи с веб-страницы.
Теперь, когда у меня есть статья, я хочу извлечь из нее ключевые слова и конкретную информацию (имена, автора и т. д.)
Я слышал, что Алхимия была прекрасным рубиновым сокровищем для этого, хотя она потребляет много ресурсов. Есть ли лучшие камни, которые я могу использовать для этого?