Алгоритм для классификации списка продуктов? [закрытый]

Некоторые вещи, которые нужно попробовать ...

Перейдите в / app_data / TEMP / ClientDependency и удалите все файлы

Перейдите в /config/ClientDependency.config и увеличьте номер версии

Перезапустите пул приложений.

Полностью согласен с Eyescream выше - перейдите в режим отладки.

Пик в файле / app_data / logs, чтобы увидеть, нет ли в нем сообщений об ошибках.

На основании вашего другого сообщения об ошибке «Не удалось найти дерево медиа, activeTree не установлено», все это звучит (для меня), относящееся к типам медиа или элементам загрузки. Попробуйте заново сохранить каждое из них, сначала перейдя в «Настройки» -> «Мультимедиа» и просто щелкните и сохраните каждое («Файл», «Папка», «Изображение»)

enter image description here

[1116 ] Тогда я бы сделал то же самое для FileUploader и ImageCropper в Developer -> DataTypes.

enter image description here

И это будет звучать как длинный выстрел, но особенно с двумя типами данных - Убедитесь, что они названы как и ожидалось , Возникла старая проблема с элементом управления FileUpload, когда иногда в имени файла появлялось случайное "\ t". Перед повторным сохранением этих типов просто нажмите на имя файла и убедитесь, что после имени нет никаких дополнительных символов. Я не видел эту проблему в течение многих лет, но так как я не уверен, какую версию вы обновили?

enter image description here

Наконец попробуйте пойти для пользователей и проверки того, что ваша учетная запись пользователя (или любая учетная запись, в которую вы входите, имеет узел Media Root. Это также может быть применено через уровень группы пользователей

enter image description here ]

Надеюсь, это поможет тебе в этом.

7
задан Georg Fritzsche 22 May 2010 в 20:35
поделиться

5 ответов

Вам нужны по крайней мере два компонента:

Во-первых, Вам нужно что-то, что действительно "показывает" извлечение, т.е. это берет Ваши объекты и извлекает релевантную информацию. Например, "новый и детский хоккей" не так релевантно как "500Go жесткий диск" и "Seagate". (Очень) простой подход состоял бы из простого извлечения эвристики производители, технологические имена как "USB2.0" и шаблоны как "ГБ", "об/мин" от каждого объекта.

Вы затем заканчиваете с рядом функций каждого объекта. Некоторым людям машинного обучения нравится помещать это в "характеристический вектор", т.е. он имеет одну запись для каждой функции, будучи установленным на 0 или 1, в зависимости от того, существует ли функция или нет. Это - Ваше представление данных. На этом векторизовал Вас, может затем сделать сравнение расстояния.

Обратите внимание, что Вы могли бы закончить с вектором тысяч записей. Даже затем затем необходимо кластеризировать результаты.

Возможно полезные статьи Wikipedia:

5
ответ дан 7 December 2019 в 05:30
поделиться

Нет простого решения для такой проблемы. Особенно, если ваш список действительно большой (миллионы предметов). Возможно, эти две статьи могут указать вам правильное направление:

http://www.cs.utexas.edu/users/ml/papers/normalization-icdm-05.pdf http: //www.ismll .uni-Хильдесхайм. de / pub / pdfs / Rendle_SchmidtThieme2006-Object_Identification_with_Constraints.pdf

1
ответ дан 7 December 2019 в 05:30
поделиться

Для фактической классификации продукта Вы могли использовать своего рода "расширенную нейронную сеть" с доской. (Это - просто метафора для получения Вас думающий в правильном направлении, не строгом использовании условий.)

Вообразите ряд объектов, которые соединены через слушателей или события (точно так же, как нейроны и synapsis). Каждый объект имеет ряд шаблонов и тестирует вход против этих шаблонов.

Пример:

  • Один объект тестирует на ("Seagate" | "connor" | "maxtor" | "квант" |...)
  • Другой объект тестирует на [: цифра:] * (" ")? ("ГБ" | "МБ")
  • Другой объект тестирует на [: цифра:] * (" ")? "об/мин"

Все эти объекты соединяются с другим объектом, который, если определенные комбинации их стреляют, категоризирует вход как жесткий диск. Сами отдельные объекты ввели бы определенные характеристики в доску (общая область записи для высказывания вещей о входе), таких как производитель, способность или скорость.

Таким образом, нейроны не стреляют на основе threshhold, но на распознавании шаблона. Многие из этих нейронов могут работать очень параллельные над доской и даже исправить классификации другими нейронами (возможно, представляющий несомненные факты?)

Я использовал что-то вроде этого в прототипе для продукта, используемого для классификации продуктов согласно UNSPSC, и смог получить 97%-ю корректную классификацию на автозапчастях.

1
ответ дан 7 December 2019 в 05:30
поделиться

Одна из проблем, с которыми Вы встретитесь, должна решить Ближайших Соседей в нелинейных или незаказанных атрибутах. Я основываюсь на записи Manuel здесь.

Одна проблема, которую Вы будете иметь, состоит в том, чтобы выбрать близость (1) Seagate 500Go, (2) Жесткого диска 120Go Seagate для ноутбука и (3) Серебра Внешнего жесткого диска Стола Seagate 500 ГБ FreeAgent Розничная продажа USB2.0 на 7200 об/мин:

1 ближе к 2 или к 3? Различия выравнивают по ширине различные категории?

Человек сказал бы, что 3 между 1 и 2, поскольку внешний HD может использоваться на обоих видах машин. Что означает, что, если кто-то ищет HD для его рабочего стола, и расширяет объем выбора для включения альтернатив, внешний HDs покажут также, но не ноутбук HDs. Вероятно, SSD, карты памяти USB, CD/DVD-приводы даже обнаружится перед дисками ноутбука, увеличивая объем.

Возможное решение:

Подарите пользователям пар атрибутов и позвольте им близость веса. Дайте им масштаб, чтобы сказать Вам, как близко друг к другу определенные атрибуты. Расширение объема выбора будет затем использовать этот масштаб в качестве функции расстояния на этом атрибуте.

1
ответ дан 7 December 2019 в 05:30
поделиться

MALLET имеет реализации CRF и MaxEnt, которые, вероятно, могут хорошо справиться с этой задачей. Как кто-то сказал ранее, вам нужно сначала извлечь функции, а затем ввести их в свой классификатор.

0
ответ дан 7 December 2019 в 05:30
поделиться
Другие вопросы по тегам:

Похожие вопросы: