Как работает функция рекомендаций Amazon?

141
задан Aditya 20 May 2013 в 11:44
поделиться

6 ответов

Это одновременно искусство и наука. Типичные области исследования вращаются вокруг анализа корзины покупателя (также называемого анализом сродства), который является подмножеством области интеллектуального анализа данных. Типичные компоненты в такой системе включают идентификацию основных элементов-драйверов и идентификацию элементов сходства (допродажа аксессуаров, перекрестная продажа).

Не забывайте об источниках данных, которые они должны добывать ...

  1. Купленные тележки для покупок = реальные деньги, потраченные реальными людьми на реальные предметы = мощные данные и многое другое.
  2. Предметы добавлены в тележки, но оставлены.
  3. Эксперименты по ценообразованию в Интернете (A / B-тестирование и т. Д.), Когда они предлагают одни и те же продукты по разным ценам и видят результаты.
  4. Эксперименты с упаковкой (A / B-тестирование и т. Д.)), где они предлагают разные продукты в разных «комплектах» или делают скидки на разные пары товаров.
  5. Списки желаний - то, что в них есть специально для вас - и в совокупности их можно обрабатывать аналогично другому потоку данных анализа корзины
  6. Реферальные сайты ( идентификация того, откуда вы пришли, может намекнуть на другие интересные элементы)
  7. Время ожидания (сколько времени осталось до того, как вы нажмете назад и выберете другой элемент)
  8. Оценки, сделанные вами или участниками ваших социальных сетей / покупательских кругов - если вы оценивайте вещи, которые вам нравятся, вы получаете больше того, что вам нравится, и если вы подтвердите, нажав кнопку «Я уже владею этим», они создадут очень полный ваш профиль
  9. Демографическая информация (ваш адрес доставки и т. д.) - они знают, что такое популярны в вашем районе среди ваших детей, вас самих, вашего супруга и т. д.
  10. user segmentation = покупали ли вы 3 книги в разные месяцы для малыша? вероятно, у вас будет ребенок или больше .. и т. д.
  11. Данные прямого маркетинга по переходам по ссылкам - вы получали от них электронное письмо и переходили по ссылке? Они знают, какое это было электронное письмо, на что вы перешли и купили ли вы его в результате.
  12. Пути кликов в сеансе - что вы просматривали, независимо от того, попал ли он в корзину.
  13. Количество просмотров товара перед окончательной покупкой
  14. Если вы имеете дело с обычным магазином, они могут история физических покупок, от которой можно отказаться (например, игрушки или что-то в Интернете, а также физический магазин)
  15. и т. д. и т. д. и т. д.

К счастью, люди в совокупности ведут себя одинаково, поэтому чем больше они знают о покупающей группе в целом, тем лучше они знают, что будет, а что не будет продавать, и с каждой транзакцией и каждым добавлением / просмотром рейтинга / списка желаний они знают, как более индивидуально настраивать рекомендации. Имейте в виду, что это, вероятно, лишь небольшая выборка из полного набора влияний того, что заканчивается рекомендациями и т. Д.

Теперь у меня нет внутренних знаний о том, как Amazon ведет бизнес (никогда там не работал) и обо всем, что я делаю говорит о классических подходах к проблеме онлайн-коммерции - раньше я был менеджером по маркетингу, который работал над интеллектуальным анализом данных и аналитикой продукта Microsoft под названием Commerce Server. Мы отправили в Commerce Server инструменты, которые позволяли людям создавать сайты с аналогичными возможностями ... но чем больше объем продаж, тем лучше данные, тем лучше модель - а Amazon - БОЛЬШОЙ. Я могу только представить, как весело играть с моделями с таким большим объемом данных на коммерческом сайте. Теперь многие из этих алгоритмов (например, предсказатель, который изначально использовался в коммерческом сервере) стали жить непосредственно в Microsoft SQL .

Четыре важных решения, которые вам следует предпринять:

  1. Amazon (или любой другой розничный торговец) изучает совокупные данные о множестве транзакций и множестве людей ... это позволяет им даже довольно хорошо рекомендовать для анонимные пользователи на своем сайте.
  2. Amazon (или любой продвинутый розничный торговец) отслеживает поведение и покупки всех, кто вошел в систему, и использует это для дальнейшего уточнения на основе массовых агрегированных данных.
  3. Часто есть способ перехитрить накопленные данные и взять «редакторский» контроль над предложениями для менеджеров по продуктам определенных направлений (например, кто-то, владеющий вертикалью «цифровых фотоаппаратов», вертикалью «любовных романов» и т. П.) где они действительно являются экспертами
  4. Часто существуют рекламные предложения (например, sony, panasonic, nikon, canon, sprint или verizon платит дополнительные деньги розничному продавцу, или дает лучшую скидку при больших количествах или других вещах в этих линиях), которые будут заставляют одни «предложения» подниматься на вершину чаще, чем другие - всегда есть разумная бизнес-логика и бизнес-причина, нацеленная на то, чтобы делать больше при каждой транзакции или снижать оптовые затраты и т. д.

С точки зрения фактической реализации? Практически все крупные онлайн-системы сводятся к некоторому набору конвейеров (или реализации шаблона фильтра или рабочего процесса и т. Д., Вы называете это как хотите), которые позволяют оценивать контекст с помощью серии модулей, которые применяют ту или иную форму бизнес-логика.

Как правило, с каждой отдельной задачей на странице связан отдельный конвейер - у вас может быть один, который предлагает рекомендуемые «пакеты / дополнительные продажи» (т. Е. Покупать это вместе с предметом, который вы смотрите), и другой, который выполняет «альтернативы» (то есть купите это вместо того, что вы смотрите) и другой, который выбирает предметы, наиболее тесно связанные с вашим списком желаний (по категории продукта или аналогичному).

Результаты этих конвейеров могут быть размещены в различных частях страницы (над полосой прокрутки, под полосой прокрутки, слева, справа, с разными шрифтами, изображениями разного размера и т. Д.) И протестированы на соответствие посмотрите, какие из них работают лучше всего. Поскольку вы используете удобные, легко подключаемые модули, которые определяют бизнес-логику для этих конвейеров, вы получаете моральный эквивалент блоков лего, которые упрощают выбор бизнес-логики, которую вы хотите применить при создании другого конвейера. что позволяет быстрее внедрять инновации, больше экспериментировать и, в конечном итоге, получать более высокую прибыль.

Это вообще помогло? Надеюсь, что это даст вам некоторое представление о том, как это работает в целом практически для любого сайта электронной коммерции, а не только для Amazon. Amazon (из разговоров с друзьями, которые там работали) в значительной степени ориентирован на данные и постоянно измеряет эффективность своего пользовательского опыта, а также цены, продвижение, упаковку и т. Д. - это очень продвинутый розничный продавец в Интернете, который, вероятно, находится на переднем крае многие алгоритмы, которые они используют для оптимизации прибыли - и они, вероятно, являются собственностью секретов (вы знаете, как формула секретных специй KFC) и охраняются как таковые.

103
ответ дан 23 November 2019 в 23:06
поделиться

Его простое исправление. Добавьте это правило CSS в таблицу стилей ( Протестировано в Firebug для работы, и из моего прошлого опыта работы с этой проблемой, это исправление ):

ol.message_list { position: relative }

Это ошибка CSS, а не ошибка jQuery per se.

-121--1405504-

Исправление ошибок пробела

Добавьте его в .gitconfig

[core]
  whitespace=nowarn

git rebase. (При необходимости можно добавить некоторые из fix, -indent-with-non-tab, trailing-space , чтобы иметь git fix все пробелы при каждой фиксации. Является ли это хорошей идеей, зависит от правил проекта и команды.)

Исправление ошибок eol

[core]
  autocrlf = true

в файле .gitconfig . Это приведет к тому, что каждый текстовый файл будет иметь окончания строк окон. svn по умолчанию игнорирует окончания строк, и если текстовые редакторы в окнах являются правильными, можно оставить этот путь. В противном случае добавьте этот файл в конфигурационный элемент svn (при необходимости измените native на CRLF ), чтобы обеспечить последовательные окончания строк CRLF.

Набору autocrlf = input и изменить native на LF для последовательных окончаний линий linux на всем протяжении.

-121--4746178-

Это не имеет прямого отношения к системе рекомендаций Amazon, но может быть полезно изучить методы, используемые людьми, которые соревновались в Netflix Prize , конкурсе на разработку лучшей системы рекомендаций с использованием пользовательских данных Netflix. В сообществе существует много хорошей информации о методах интеллектуального анализа данных в целом.

Команда, которая выиграла, использовала сочетание рекомендаций, выработанных множеством различных моделей/методов. Я знаю, что некоторые из основных используемых методов были анализ основных компонентов, методы ближайших соседей и нейронные сети. Вот некоторые документы команды-победителя:

R. Белл, Я. Корен, К. Волинский, « Решение BellKor 2008 к премии Netflix », (2008).

A. Тёшер, М. Ярер, « Решение BigChaos к премии Netflix 2008 », (2008).

A. Töscher, M. Jahrer, R. Legenstein, « Усовершенствованные алгоритмы на основе соседства для крупномасштабных рекомендательных систем », Семинар SIGKDD по крупномасштабным рекомендательным системам и конкурс призов Netflix (KDD)

Y. Koren, « BellKor Solution to the Netflix Grand Prize », (2009).

A. Тёшер, М. Ярер, Р. Белл, « Решение BigChaos к Большой премии Netflix », (2009).

M. Пиотт, М. Шабберт, « Решение прагматической теории к Большой премии Netflix », (2009).

Документы за 2008 год взяты из премии «Прогресс» за первый год. Я рекомендую сначала читать более ранние, потому что более поздние основаны на предыдущей работе.

28
ответ дан 23 November 2019 в 23:06
поделиться

Я не знаю конкретного алгоритма Amazon, но один из компонентов такого алгоритма, вероятно, будет включать отслеживание групп товаров, часто заказываемых вместе, а затем использование этих данных для рекомендации других товаров в группе, когда клиент покупает некоторые подмножество группы.

Другой возможностью было бы отслеживать частоту заказа товара B в течение N дней после заказа товара A, что может указывать на корреляцию.

3
ответ дан 23 November 2019 в 23:06
поделиться

На прошлой неделе в нашем университете кто-то делал презентацию о чем-то похожем, и сослался на систему рекомендаций Amazon. Я считаю, что он использует форму кластеризации K-средних , чтобы объединить людей в их различные покупательские привычки. Надеюсь, это поможет :)

Посмотрите и это: http://www.almaden.ibm.com/cs/people/dmodha/ml02.ps и в формате HTML .

0
ответ дан 23 November 2019 в 23:06
поделиться

Насколько я знаю, используется Case- Основанный на Reasoning двигатель.

Вы можете увидеть в этих источниках: здесь , здесь и здесь .

В Google есть много источников для поиска amazon и аргументации по делу.

2
ответ дан 23 November 2019 в 23:06
поделиться

Сегодня я наткнулся на этот документ:

Возможно, он предоставляет дополнительную информацию.

21
ответ дан 23 November 2019 в 23:06
поделиться
Другие вопросы по тегам:

Похожие вопросы: