Я начинаю читать о Trie. Я также получил рекомендации от друзей здесь: Tutorials on Trie
Мне непонятно следующее:
Кажется, что для дальнейшего использования Trie предполагается, что все входные строки, которые будут пространством поиска и используются для построения Trie, разделены отдельными границами слов.
Например. все примеры руководств, которые я видел, используют входные данные, такие как:
S={ball, bid, byte, car, cat, mac, map etc...}
Затем мы строим trie из S
и выполняем поиск (очень быстро)
Мой вопрос: как мы пришли к S
для начала?
Я имею в виду, прежде чем начать читать о попытках, я представил, что S
будет сколь угодно длинным текстом, например. Отрывок из Шекспира
.
Затем, используя Trie, мы могли находить вещи очень быстро.
Но, похоже, это не так.
Предполагается ли здесь, что входной отрывок (например, Shakespeare
) предварительно обрабатывается, сначала извлекая все слова, чтобы получить S
?
Итак, если кто-то хочет искать шаблоны (так же, как вы это делаете, когда вы используете Google и видите все страницы, содержащие пробелы в вашем поисковом запросе), Trie не подходит?
Когда мы сможем узнать, является ли Trie структурой данных, которую мы действительно можем использовать?