Это одновременно искусство и наука. Типичные области исследования вращаются вокруг анализа корзины покупателя (также называемого анализом сродства), который является подмножеством области интеллектуального анализа данных. Типичные компоненты в такой системе включают идентификацию основных элементов-драйверов и идентификацию элементов сходства (допродажа аксессуаров, перекрестная продажа).
Не забывайте об источниках данных, которые они должны добывать ...
К счастью, люди в совокупности ведут себя одинаково, поэтому чем больше они знают о покупающей группе в целом, тем лучше они знают, что будет, а что не будет продавать, и с каждой транзакцией и каждым добавлением / просмотром рейтинга / списка желаний они знают, как более индивидуально настраивать рекомендации. Имейте в виду, что это, вероятно, лишь небольшая выборка из полного набора влияний того, что заканчивается рекомендациями и т. Д.
Теперь у меня нет внутренних знаний о том, как Amazon ведет бизнес (никогда там не работал) и обо всем, что я делаю говорит о классических подходах к проблеме онлайн-коммерции - раньше я был менеджером по маркетингу, который работал над интеллектуальным анализом данных и аналитикой продукта Microsoft под названием Commerce Server. Мы отправили в Commerce Server инструменты, которые позволяли людям создавать сайты с аналогичными возможностями ... но чем больше объем продаж, тем лучше данные, тем лучше модель - а Amazon - БОЛЬШОЙ. Я могу только представить, как весело играть с моделями с таким большим объемом данных на коммерческом сайте. Теперь многие из этих алгоритмов (например, предсказатель, который изначально использовался в коммерческом сервере) стали жить непосредственно в Microsoft SQL .
Четыре важных решения, которые вам следует предпринять:
С точки зрения фактической реализации? Практически все крупные онлайн-системы сводятся к некоторому набору конвейеров (или реализации шаблона фильтра или рабочего процесса и т. Д., Вы называете это как хотите), которые позволяют оценивать контекст с помощью серии модулей, которые применяют ту или иную форму бизнес-логика.
Как правило, с каждой отдельной задачей на странице связан отдельный конвейер - у вас может быть один, который предлагает рекомендуемые «пакеты / дополнительные продажи» (т. Е. Покупать это вместе с предметом, который вы смотрите), и другой, который выполняет «альтернативы» (то есть купите это вместо того, что вы смотрите) и другой, который выбирает предметы, наиболее тесно связанные с вашим списком желаний (по категории продукта или аналогичному).
Результаты этих конвейеров могут быть размещены в различных частях страницы (над полосой прокрутки, под полосой прокрутки, слева, справа, с разными шрифтами, изображениями разного размера и т. Д.) И протестированы на соответствие посмотрите, какие из них работают лучше всего. Поскольку вы используете удобные, легко подключаемые модули, которые определяют бизнес-логику для этих конвейеров, вы получаете моральный эквивалент блоков лего, которые упрощают выбор бизнес-логики, которую вы хотите применить при создании другого конвейера. что позволяет быстрее внедрять инновации, больше экспериментировать и, в конечном итоге, получать более высокую прибыль.
Это вообще помогло? Надеюсь, что это даст вам некоторое представление о том, как это работает в целом практически для любого сайта электронной коммерции, а не только для Amazon. Amazon (из разговоров с друзьями, которые там работали) в значительной степени ориентирован на данные и постоянно измеряет эффективность своего пользовательского опыта, а также цены, продвижение, упаковку и т. Д. - это очень продвинутый розничный продавец в Интернете, который, вероятно, находится на переднем крае многие алгоритмы, которые они используют для оптимизации прибыли - и они, вероятно, являются собственностью секретов (вы знаете, как формула секретных специй KFC) и охраняются как таковые.
Его простое исправление. Добавьте это правило CSS в таблицу стилей ( Протестировано в Firebug для работы, и из моего прошлого опыта работы с этой проблемой, это исправление ):
ol.message_list { position: relative }
Это ошибка CSS, а не ошибка jQuery per se.
-121--1405504-Исправление ошибок пробела
Добавьте его в .gitconfig
[core]
whitespace=nowarn
git rebase. (При необходимости можно добавить некоторые из fix, -indent-with-non-tab, trailing-space
, чтобы иметь git fix все пробелы при каждой фиксации. Является ли это хорошей идеей, зависит от правил проекта и команды.)
Исправление ошибок eol
[core]
autocrlf = true
в файле .gitconfig
. Это приведет к тому, что каждый текстовый файл будет иметь окончания строк окон. svn
по умолчанию игнорирует окончания строк, и если текстовые редакторы в окнах являются правильными, можно оставить этот путь. В противном случае добавьте этот файл в конфигурационный элемент svn (при необходимости измените native
на CRLF
), чтобы обеспечить последовательные окончания строк CRLF.
Набору autocrlf = input
и изменить native
на LF
для последовательных окончаний линий linux на всем протяжении.
Это не имеет прямого отношения к системе рекомендаций Amazon, но может быть полезно изучить методы, используемые людьми, которые соревновались в Netflix Prize , конкурсе на разработку лучшей системы рекомендаций с использованием пользовательских данных Netflix. В сообществе существует много хорошей информации о методах интеллектуального анализа данных в целом.
Команда, которая выиграла, использовала сочетание рекомендаций, выработанных множеством различных моделей/методов. Я знаю, что некоторые из основных используемых методов были анализ основных компонентов, методы ближайших соседей и нейронные сети. Вот некоторые документы команды-победителя:
R. Белл, Я. Корен, К. Волинский, « Решение BellKor 2008 к премии Netflix », (2008).
A. Тёшер, М. Ярер, « Решение BigChaos к премии Netflix 2008 », (2008).
A. Töscher, M. Jahrer, R. Legenstein, « Усовершенствованные алгоритмы на основе соседства для крупномасштабных рекомендательных систем », Семинар SIGKDD по крупномасштабным рекомендательным системам и конкурс призов Netflix (KDD)
Y. Koren, « BellKor Solution to the Netflix Grand Prize », (2009).
A. Тёшер, М. Ярер, Р. Белл, « Решение BigChaos к Большой премии Netflix », (2009).
M. Пиотт, М. Шабберт, « Решение прагматической теории к Большой премии Netflix », (2009).
Документы за 2008 год взяты из премии «Прогресс» за первый год. Я рекомендую сначала читать более ранние, потому что более поздние основаны на предыдущей работе.
Я не знаю конкретного алгоритма Amazon, но один из компонентов такого алгоритма, вероятно, будет включать отслеживание групп товаров, часто заказываемых вместе, а затем использование этих данных для рекомендации других товаров в группе, когда клиент покупает некоторые подмножество группы.
Другой возможностью было бы отслеживать частоту заказа товара B в течение N дней после заказа товара A, что может указывать на корреляцию.
На прошлой неделе в нашем университете кто-то делал презентацию о чем-то похожем, и сослался на систему рекомендаций Amazon. Я считаю, что он использует форму кластеризации K-средних , чтобы объединить людей в их различные покупательские привычки. Надеюсь, это поможет :)
Посмотрите и это: http://www.almaden.ibm.com/cs/people/dmodha/ml02.ps и в формате HTML .
Насколько я знаю, используется Case- Основанный на Reasoning двигатель.
Вы можете увидеть в этих источниках: здесь , здесь и здесь .
В Google есть много источников для поиска amazon и аргументации по делу.
Сегодня я наткнулся на этот документ:
Возможно, он предоставляет дополнительную информацию.