Классификатор изображений большого размера

У меня есть большой набор изображений растений, на которых написано ботаническое название. Какой алгоритм лучше всего использовать для обучения этому набору данных, чтобы классифицировать фотографию без метки? Фотографии обрабатываются таким образом, что 100% пикселей содержат растение (например, листья или кора крупным планом), поэтому нет других объектов / пустого пространства / фона, которые алгоритм должен был бы отфильтровать.

I уже пробовали сгенерировать функции SIFT для всех фотографий и передать эти пары (функция, метка) в LibLinear SVM, но точность была жалкой 6%.

Я также попытался передать те же данные в несколько Weka классификаторов. Точность была немного лучше (25% с логистикой, 18% с IBk), но Weka не рассчитана на масштабируемость (загружает все в память). Поскольку набор данных функций SIFT состоит из нескольких миллионов строк, я смог протестировать Weka только со случайным 3% -ным срезом, поэтому он, вероятно, не репрезентативен.

РЕДАКТИРОВАТЬ: Некоторые образцы изображений:

Pachira aquaticaFagus grandifolia

9
задан Cerin 18 April 2011 в 17:13
поделиться