Хм... Я думал, что Google использовал их обширный корпус данных (Интернет), чтобы сделать некоторую серьезную обработку естественного языка (Обработка естественного языка).
, Например, у них есть так много данных из всего Интернета, что они могут считать количество раз, три последовательности слов происходят (известный как триграмма ). Таким образом, если они видят предложение как: "розовый frugr концерт", они видели его, имеет немного хитов, затем найдите наиболее вероятный "розовый * концерт" в их корпусе.
Они, по-видимому, просто делают изменение того, что Davide Gualano говорил, тем не менее, так определенно читает ту ссылку. Google действительно, конечно, использует все веб-страницы, которые он знает как корпус, так, чтобы сделал его алгоритм особенно эффективным.
Have a look at the IE8.js library by Dean Edwards. It does pretty much what you're asking for.
See the IE7 Test Page for the things it fixes.