Как Google использует HTML-тэги для улучшения поисковой системы?

Только разрешить... или подвести итог...

  • nchar и nvarchar может сохранить символы Unicode .
  • char и varchar не может сохранить символы Unicode .
  • char и nchar фиксированная длина , которая будет резервное пространство памяти для количества символов, которые Вы определяете, не израсходовали ли Вы все то пространство.
  • varchar и nvarchar переменная длина , которая только израсходует пробелы для символов, которые Вы храните. Это не зарезервирует устройство хранения данных как char или nchar .

nchar и nvarchar поднимет вдвое больше пространства памяти, таким образом, может быть мудро использовать их, только если Вам нужно поддержка Unicode.

11
задан Matt Fenwick 9 February 2012 в 02:18
поделиться

14 ответов

Я думаю, это называется «Семантическая разметка»

[...] семантическая разметка - это разметка, которая достаточно описательна, чтобы позволить нам и машинам, которые мы программируем, распознавать ее и принимать решения по ней. Другими словами, разметка означает нечто, когда мы можем идентифицировать ее и делать с ней полезные вещи. Таким образом, семантическая разметка становится больше, чем просто описательной. Это становится блестящим механизмом, который позволяет людям и машинам «понимать» одну и ту же информацию. http://www.digital-web.com/articles/writing_semantic_markup/

Более практическая статья здесь http://robertnyman.com/2007/10/29/explaining-semantic-mark-up/

17
ответ дан 3 December 2019 в 01:13
поделиться

SEO стало почти религией для некоторых людей, которые зацикливаются на мелочах. Честно говоря, я не уверен, что все эти усилия оправданы.

Мой совет? Не обращайте внимания на то, что говорят так называемые эксперты, и просто следуйте рекомендациям Google .

Возможно, вы ищете академический ответ, но, честно говоря, это не академический вопрос, выходящий за рамки самих основ того, как работает веб-индексирование. Реальность современного алгоритма индексации и ранжирования страниц намного сложнее.

Вы можете взглянуть на одну из более ранних работ по поисковым системам . Обратите внимание на имена авторов. Вы также можете прочитать Заявку на патент Google 20050071741 .

Помимо этих общих принципов, Google » Алгоритм поиска постоянно дорабатывается на основе фактических и желаемых результатов. Точная работа - это тщательно охраняемый секрет, чтобы людям было сложнее играть с системой. Большая часть «советов» или описаний того, как работает поисковый алгоритм Google, является чистым предположением.

Итак, не считая заголовка и правильного и правильного HTML, я не думаю, что вы найдете то, что ищете.

12
ответ дан 3 December 2019 в 01:13
поделиться

Как сказал Клетус, следуйте рекомендациям Google.

Я провел несколько тестов и пришел к выводу, что теги title, alt и h являются наиболее важными. Также стоит упомянуть Google AdSense. У меня было ощущение, что если вы их реализуете, рейтинг вашего сайта повысится.

1
ответ дан 3 December 2019 в 01:13
поделиться

Я предлагаю попробовать Google Scholar в качестве одного из способов поиска научных статей

семантический поиск

0
ответ дан 3 December 2019 в 01:13
поделиться

Я считаю, что вас интересует называется структурным отпечатком пальца, и он часто используется для определения сходства двух структур. В случае с Google применение веса к различным тегам и применение к секретному алгоритму, который (возможно) использует частоты различных элементов в отпечатке пальца. Это глубоко укоренилось в теории информации - если вы ищете академические статьи по теории информации, я бы начал с «Математической теории коммуникации» Клода Шеннона

1
ответ дан 3 December 2019 в 01:13
поделиться

Я нашел эту статью:

A New Исследование использования HTML-структур для улучшения поиска

, однако это старая статья 1999 г.

, все еще ищущие более свежие статьи.

2
ответ дан 3 December 2019 в 01:13
поделиться

Я бы также посоветовал взглянуть на Микроформаты и RDF. Оба используются для улучшения поиска. В основном это агностики поисковых систем, но есть и некоторые специфические вещи. Чтобы ознакомиться с рекомендациями Google по содержанию HTML, прочтите эту ссылку .

1
ответ дан 3 December 2019 в 01:13
поделиться

Google сознательно не делает этого. выдает слишком много информации о своем алгоритме поиска, поэтому маловероятно, что вы найдете однозначный ответ или научную статью, подтверждающую это. Если вам интересно с точки зрения SEO, просто напишите свои страницы так, чтобы они были полезны для людей, и роботам они тоже понравились. ... h2 "Контактная информация" ...... h3 "Телефонные номера" ...... h3 "Адреса электронной почты" ... h2 "Как нас найти" ...... h3 "На машине" ...... h3 "Поездом"

Сложность вашего вопроса заключается в том, что если вы поместите что-то в свой тег h1 в надежде, что это повысит вашу позицию в Google, но это не совпадет с другим контентом на ваша страница может выглядеть так, как будто вы рассылаете спам. Точно так же, если ваша страница состоит из слишком большого количества заголовков и недостаточно фактического контента, вы можете выглядеть так, как будто вы рассылаете спам. Это не так просто, как добавить теги h1 и h2, и вы подниметесь! Вот почему вам нужно писать веб-сайты для людей, а не для роботов.

4
ответ дан 3 December 2019 в 01:13
поделиться

Мне показалось интересным, что - с не предоставлены ни мета-ключевые слова, ни описание - в такой ситуации:

<p>Some introduction</p>
<h1>headline 1</h1>
<p>text for section one</p>

Всегда «текст для первого раздела» отображается на странице результатов поиска.

0
ответ дан 3 December 2019 в 01:13
поделиться

Чтобы все было до боли простым. Сделайте вашу информационную архитектуру логичной. Если наиболее важные элементы для понимания пользователем выделены заголовками и логически сгруппированы, то документ будет легче интерпретировать с помощью алгоритмов обработки информации. Как по волшебству, пользователям также будет легче интерпретировать. Помните, что алгоритмы поисковых систем были написаны людьми, пытающимися интерпретировать язык.

Основной процесс: Напишите хорошо структурированный HTM L - используя теги заголовков для обозначения наиболее важных элементов на странице. Используйте логические теги, основанные на структуре вашей информации. Списки для списков, заголовки для основных тем.

Предоставьте соответствующие альтернативные теги и имена для любых визуальных элементов, а затем используйте простой CSS для размещения этих элементов.

Если сайт хорошо работает для пользователей и содержит соответствующую информацию, вы не рискуете попадание в черный список спамера, и алгоритмы поисковых систем будут отдавать предпочтение вашей странице.

Мне очень понравилась книга Transcending CSS для ясного объяснения правильно структурированного HTML.

1
ответ дан 3 December 2019 в 01:13
поделиться

Вы также можете попробовать выполнить поиск в 'Компьютер Раздел "Наука" в arXiv: http://arxiv.org для "поисковой машины" и различных терминов, предложенных другими.

Он содержит множество научных статей, все в свободном доступе ... надеюсь, некоторые из них будут иметь отношение к вашему исследованию. (Конечно, требуется проверка содержания любого документа.)

2
ответ дан 3 December 2019 в 01:13
поделиться

Отъезд http://jcmc.indiana.edu/vol12/issue3/pan.html http://www.springerlink.com/content/l22811484243r261/

Некоторое время потратил на scholar.google .com может помочь вам найти то, что вы ищете

2
ответ дан 3 December 2019 в 01:13
поделиться

Вкратце; очень осторожно. Короче:

Цитата из анатомии крупномасштабной гипертекстовой поисковой машины erb:

[...] Это дает нам некоторые ограниченные поиск по фразе, пока есть не так много якорей для конкретного слово. Мы ожидаем обновления способа, которым привязки сохраняются, чтобы учесть большее разрешение в положении и docIDhash поля. Мы используем размер шрифта относительно остальной части документа потому что при поиске вы не хочу ранжировать идентично в остальном документы по-разному только потому, что один документов в большем шрифт. [...]

Продолжается:

[...] Еще одно большое различие между Интернет и традиционные хорошо контролируемые коллекции - это то, что там практически нет контроля над тем, что люди могут разместить в сети . Пара эта гибкость публиковать что угодно с огромным влиянием поиска двигатели для маршрутизации трафика и компаний которые намеренно манипулируют поиском двигатели для получения прибыли стали серьезным проблема. Эта проблема, не имеющая были рассмотрены в традиционных закрытых информационно-поисковые системы. Кроме того, интересно отметить, что попытки метаданных в значительной степени провалились с поисковыми системами, потому что любой текст на странице, который не представлен пользователю, злоупотребляют манипулировать поисковыми системами. [...]

Проблемы в системе веб-поиска решают эти проблемы более современным способом:

[...] Веб-страницы в HTML попадают в середину этого континуума структуры в документах, будучи не близкими ни к свободному тексту, ни к хорошо структурированным данным. Вместо этого разметка HTML предоставляет ограниченную структурную информацию, обычно используемую для управления компоновкой, но предоставляющую подсказки о семантической информации. Информация о макете в HTML может показаться ограниченной полезностью, особенно по сравнению с информацией, содержащейся в таких языках, как XML, которые можно использовать для тегирования контента, но на самом деле это особенно ценный источник метаданных в ненадежных корпусах, таких как Интернет. . Ценность информации о макете проистекает из того факта, что она видна пользователю [...]:

И добавляет:

[...] HTML-теги могут быть проанализированы на предмет того, какая семантическая информация может быть выведена. Помимо тегов заголовков, упомянутых выше, есть теги, которые управляют начертанием шрифта (полужирный, курсив), размером и цветом. Их можно проанализировать, чтобы определить, какие слова в документе автор считает особенно важными. Одно из преимуществ HTML или любого языка разметки, который очень близко соответствует тому, как отображается контент, заключается в том, что существует меньше возможностей для злоупотреблений: трудно использовать разметку HTML таким образом, чтобы поисковые системы думали, что помеченный текст важен , пока пользователям это оказывается неважным. Например, фиксированное значение тега означает, что любой текст в контексте HI будет заметно отображаться на отображаемой веб-странице, поэтому поисковые системы могут высоко оценивать этот текст. Однако, надежность разметки HTML снижается за счет каскадных таблиц стилей, которые отделяют имена тегов от их представления. Были проведены исследования по извлечению информации из структуры HTML. Например, [Chakrabarti etal, 2001; Chakrabarti, 2001] создал DOM-дерево HTML-страницы и использовал эту информацию, чтобы повысить точность выделения тем, метод анализа на основе ссылок.

Существует ряд проблем, с которыми современная поисковая система должна бороться. примеры схем веб-спама и SEO.

Но даже в идеальном мире, например, после исключения «плохих яблок» из индекса, Интернет по-прежнему является полным беспорядком, потому что ни у кого нет одинаковых структур. Есть карты, игры, видео, фотографии (flickr) и много-много пользовательского контента. Другими словами, Интернет по-прежнему очень непредсказуем.

Ресурсы

1
ответ дан 3 December 2019 в 01:13
поделиться

Теперь также можно использовать новый тег под названием CANONICAL, из Google щелкните ЗДЕСЬ

0
ответ дан 3 December 2019 в 01:13
поделиться
Другие вопросы по тегам:

Похожие вопросы: