150 likes | 334 Views
Русинов Павел, 371 гр. Научный руководитель: к.ф.-м.н, доц. Вахитов А. Т. Снижение разрешения гистограммы ориентированных градиентов (HOG) для детекции объектов малого размера. Гистограмма ориентированных градиентов (HOG).
E N D
Русинов Павел, 371 гр. Научный руководитель: к.ф.-м.н, доц. Вахитов А. Т. Снижение разрешения гистограммы ориентированных градиентов (HOG) для детекции объектов малого размера
Гистограмма ориентированных градиентов (HOG) Является необходимым преобразованием изображения в многомерный вектор для успешного использования классификатора
SVM-классификатор • При обучении строится гиперплоскость, разделяющая объекты на классы • Гиперплоскость задается уравнением <w, x> = b • w — линейная комбинация опорных векторов, являющихся подмножеством обучающей выборки
Метод скользящего окна по нескольким масштабам
Метод скользящего окна по нескольким масштабам • При обработке изображения вычисляется до нескольких тысяч HOG • Является ресурсоёмкой задачей • Актуален поиск метода снижения вычислительной нагрузки
Подход к оптимизации • Получение из исходного классификатора новых классификаторов для окон меньших размеров • Их использование при детекции объектов малого размера на входном изображении
Постановка задачи • Изучить структуру HOG и алгоритм его получения, изучить алгоритм работы SVM-классификатора • Изучить существующие подходы к оптимизации метода скользящего окна • Разработать и реализовать алгоритм масштабирования HOG • Реализовать алгоритм масштабирования SVM-классификатора (с использованием предыдущего алгоритма)
Постановка задачи • Реализовать метод скользящего окна с использованием масштабированных классификаторов • Сравнить его с первоначальным методом
Существующие решения Каскадный HOG: • Используются блоки произвольных размеров • Вместо одного классификатора — каскад слабых классификаторов • Ускорение первоначального метода в 30 раз, потеря точности распознавания
Алгоритм масштабирования HOG • HOG преобразуется в набор изображений (размер набора = количеству значений в блоке, размер изображения = размеру HOG в блоках) • Каждое изображение интерполируется до нужного размера • Изображения преобразуются в HOG
Масштабирование SVM-классификаторов • Используется предыдущий алгоритм для масштабирования опорных векторов • В итоге получается классификатор для окон другого размера
Тестирование Алгоритм масштабирования SVM-классификатора был протестирован на базе изображений рукописных цифр MNIST. Точность распознавания изображений исходного размера (28x28) составила 99.5%
Тестирование На базе изображений пешеходов INRIA Person был протестирован метод скользящего окна, использующий уменьшенные классификаторы. Падение точности составило 4.6%, ускорение работы 40% Также был протестирован метод скользящего окна, использующий и уменьшенные, и увеличенные классификаторы. Падение точности составило 16.3%
Результаты Изучены алгоритмы вычисления HOG и работы SVM-классификатора Реализован алгоритм масштабирования HOG Реализован и протестирован алгоритм масштабирования SVM-классификатора Реализован и протестирован метод скользящего окна, использующий масштабированные классификаторы