0
ответов

«Небольшая» несогласованность значений SSIM, полученных для стандартных примеров изображений, между реализациями skimage и tenorflow

Для стандартного изображения - каталог с примерами Skimage, я использовал встроенный метод SSIM в TF (версия 1.13.1) и обнаружил небольшие расхождения. Вот код: ########################################## ...
вопрос задан: 2 March 2019 22:33
0
ответов

Ориентиры лица и стабилизация с помощью оптического потока

Я пишу программу, когда окно показывает лицо и некоторые особые точки (68). Я использую Haar casscade и FaceLandmarkLBF. У меня проблема с моей программой. Когда лицо находится в устойчивом положении, точки лица дрожат (дрожат) ....
вопрос задан: 1 March 2019 08:30
0
ответов

Как судить, если 2D-массив частично состоит из повторяющихся / повторяющихся паттернов внутри?

У меня есть набор данных, и мне нужно классифицировать двумерные массивы по решению: если в массиве существует повторяющийся образец. Диапазон значений двумерного массива - двоичный, равный 0 или 1. Описание класса: ...
вопрос задан: 24 February 2019 05:19
0
ответов

Вращение 2D позы вокруг своей оси

Я использую AlphaPose с системой оценки позы pytorch из источника. Что мне интересно, так это то, существуют ли распространенные методы поворота позы вокруг своей оси (даже если нет третьего измерения) ...
вопрос задан: 24 February 2019 01:56
0
ответов

Как автоматически обнаружить вандализм на дорожных знаках?

Я успешно распознал знак остановки, а затем обрезал ограничивающую рамку обнаруженного знака остановки. Поэтому моя следующая задача - обнаружить вандализм на стоп-сигнале. Для моей задачи, физический ущерб на ...
вопрос задан: 20 January 2019 10:31
0
ответов

Как конвертировать .bag, записанный realsense, в .txt или png, чтобы запустить собственную последовательность в ORB SLAM2

Я пытаюсь запустить свою собственную последовательность в orbslam2. Я записал видео с помощью realsense, и он автоматически был сохранен как файл .bag. Я записал видео только с помощью Realsense-Viewer. Когда я ...
вопрос задан: 20 January 2019 09:20
0
ответов

Как можно использовать дескриптор HOG для описания ключевых моментов?

Гистограмма ориентированных градиентов - это дескриптор, который дает массив чисел в качестве дескриптора изображения. Он отображает все изображение в массив чисел. Как его можно использовать как дескриптор для ключа ...
вопрос задан: 20 January 2019 06:41
0
ответов

Код ImageAI не запускается после регистрации Использование Tensorflow Backend

Я использую ImageAI для обнаружения транспортных средств в vid.mp4 Image AI Вот мой код: из imageai.Detection import VideoObjectDetection import os execute_path = os.getcwd () детектор = VideoObjectDetection (...
вопрос задан: 19 January 2019 21:56
0
ответов

Невозможно установить dlib на python2

Я сталкиваюсь с ошибкой при установке библиотеки dlib. Я уже установил cmake. Я пытался установить его на python3, но проблема та же. Сборка для: NMake Makefiles - компилятор C ...
вопрос задан: 19 January 2019 09:28
0
ответов

Предварительная обработка изображений для оптического распознавания текста с помощью Tesseract

В настоящее время я использую Imagemagick и Tesseract для распознавания PDF. Входной файл представляет собой таблицу, в которой заголовки содержат черный на белом тексте, а строки представлены белым на черном тексте: Моя проблема ...
вопрос задан: 18 January 2019 22:08
0
ответов

У меня проблема с запуском алгоритма RGB-D ORBSLAM2

Я довольно плохо знаком с алгоритмом orbslam. Я использую Intel Realsense D435 для извлечения и отображения функций. После выполнения шагов из алгоритма orbslam2, я пытаюсь запустить несколько примеров и ...
вопрос задан: 17 January 2019 13:02
0
ответов

Matlab Vehicle / Car Tracking / Kalman Filter / Шумоподавление

У меня есть следующий вызов. Я построил на основе камеры измерение расстояния транспортного средства по количеству кадров. Как вы можете видеть на рисунке (y = расстояние, x = кадры), шум вызывает измерение ...
вопрос задан: 17 January 2019 10:28
0
ответов

Обрезка выровненного изображения лица в OpenCV

Как происходит обрезка изображения после выравнивания лица. Причина, по которой я задаю этот вопрос, заключается в том, что ориентиры используются для выравнивания изображения, а после выравнивания старые ориентиры ...
вопрос задан: 17 January 2019 09:52
0
ответов

Как откалибровать камеру realsense D435 для использования ORBSLAM2

Мне нужна помощь для калибровки камеры для ORB-SLAM2. У меня есть камера Intel RealSense D435. Я откалибровал его с помощью динамического калибратора Intel. Но когда я запускаю алгоритмы ORBSLAM2, я не могу отобразить ...
вопрос задан: 17 January 2019 08:44
0
ответов

Как я могу использовать взвешенный log_loss как функцию SCORING для linear_model.SGDClassifier?

Я использую linear_model.SGDClassifier (loss = 'log', class_weight = 'сбалансированный') для классификации 10 классов (классы очень несбалансированные) Похоже, что class_weight используется только на тренировках ...
вопрос задан: 16 January 2019 20:26
0
ответов

ValueError: Невозможно изменить тензор с 150528 элементами для придания ему формы [224,150528]

Я новичок в tenorflow, и я все еще учусь, поэтому я прошу прощения, если я упустил что-то очевидное. В общем, моя проблема в том, что я пытаюсь настроить простой классификатор изображений с тензорным потоком в Python, ...
вопрос задан: 16 January 2019 19:03
0
ответов

OpenCV C ++ / Obj-C: Обнаружение листа бумаги / Обнаружение квадратов

Я успешно реализовал пример обнаружения квадратов OpenCV в своем тестовом приложении, но теперь нужно отфильтровать вывод, потому что он довольно грязный или мой код неправильный? Меня интересуют четыре ...
вопрос задан: 11 October 2018 00:40
0
ответов

OpenCV template matching and transparency

What's the way OpenCV handles transparency in image during template matching? The problem is that the template image needs to have transparent parts, because in the original image there could be ...
вопрос задан: 7 October 2018 19:23
0
ответов

Dense sift против sift?

В чем разница между реализацией плотного sift и sift? В чем преимущества / недостатки одного перед другим? Я говорю, в частности, о реализациях VLFeat.
вопрос задан: 24 September 2018 10:36
0
ответов

Функции машинного обучения OpenCV требуют CvFileStorage *вместо cv ::FileStorage*

Я использую функции CvANN _MLP из библиотек машинного обучения в OpenCV, и я хочу записать свою обученную сеть в файл.Я смог сделать это с помощью cv ::FileStorage для ключевых точек...
вопрос задан: 22 September 2018 11:57
0
ответов

Вычисление матрицы, которая преобразует четырехугольник в другой четырехугольник в 2D

На рисунке ниже цель состоит в том, чтобы вычислить матрицу гомографии H, которая преобразует точки a1 a2 a3 a4 в их аналоги b1 b2 b3 b4. То есть :[b1 b2 b3 b4] = H *[a1 a2 a3 a4] Каким образом...
вопрос задан: 26 August 2018 18:07
0
ответов

Градиенты не меняются с шагом - Tensorflow

Я столкнулся с этой проблемой уже пару дней, и я думаю, что делаю правильный подход, но я хочу убедиться. Я тренирую 4 conv-слоя и два полностью связанных слоя поверх них. ...
вопрос задан: 13 July 2018 20:11
0
ответов

Сравнение изображений - Matlab

Я использую инструмент моделирования для моделирования электромагнитного явления на MATLAB. Следовательно, я должен сравнить выходные изображения инструмента (геометрия и амплитуда рисунка) с рефренсом ...
вопрос задан: 13 July 2018 14:32
0
ответов

Значение loss1 / top-1 GoogleNet в Caffe?

Я новичок в карьере Caffe и пытаюсь подготовить класс изображения своего собственного набора данных. Я получаю выходные потери1 / top-1 (например, точность top-1?) Примерно до 0,88. Я думал, это должно быть ...
вопрос задан: 13 July 2018 09:49
0
ответов

как переучивать модель после развертывания с дисбалансом класса?

Я столкнулся с одной проблемой на стороне развертывания, это будет здорово, если вы поможете мне разобраться. Теперь я создал классификацию изображений для двух классов (скажем, класс 1 имеет 109 изображений, а класс 0 - 1000 изображений), поэтому ...
вопрос задан: 13 July 2018 06:25
0
ответов

Как обучить искусственную нейронную сеть играть в Diablo 2 с помощью визуального ввода?

В настоящее время я пытаюсь получить ИНС для играть в видеоигру, и я надеялся получить некоторую помощь от замечательного сообщества здесь. Я остановился на Diablo 2. Таким образом, игра ведется в реальном времени и из ...
вопрос задан: 10 July 2018 15:49
0
ответов

FindFundamentalMatrix не находит основная матрица

Я пытаюсь восстановить движение камеры с помощью фундаментальная матрица и алгоритм, приведенный в Википедии. Для это мне нужно найти фундаментальную матрицу. Я использую OpenCV :: ...
вопрос задан: 21 March 2018 17:36
0
ответов

Opencv 2.4.2 Объяснение кода -Распознавание лиц

Я сослался на документацию, предоставленную OpenCV, для создания программы распознавания лиц, она распознает несколько лиц и работает нормально. В документации они сделали многоточие, чтобы выделить...
вопрос задан: 15 March 2018 16:02
0
ответов

Простое распознавание цифр OCR в OpenCV-Python

Я пытаюсь реализовать «OCR распознавания цифр» в OpenCV-Python (cv2). Это просто для учебных целей. Я хотел бы изучить функции KNearest и SVM в OpenCV. У меня есть 100 образцов (то есть ...
вопрос задан: 23 January 2018 22:16
0
ответов

Нормализация экземпляров против нормализации партии

Я понимаю, что пакетная нормализация помогает ускорить обучение, поворачивая активацию к распределению по Гауссу, и таким образом решая проблему исчезающих градиентов. Применяется пакетный норматив ...
вопрос задан: 5 January 2018 19:35