В ПНИПУ до 95% повысили точность опознавания действий человека с видеокамер
Математическую модель описания действий человека, представленных видеоинформацией с камер наблюдения, которая позволяет повысить точность их распознавания с помощью нейронных сетей до 95%, разработали ученые Пермского национального исследовательского политехнического университета (ПНИПУ), 20 декабря сообщает пресс-служба вуза. В настоящее время камеры видеонаблюдения часто устанавливаются в местах большого скопления людей, торговых центрах, концертных залах и образовательных учреждениях, на стратегически важном промышленном производстве и в других местах. Такие системы видеонаблюдения распознают, фиксируют и классифицируют движения человека, попавшего в ее видеообъектив. В зависимости от характера действий объекта и установленных ограничений они формируют ответную реакцию. Например, если эти действия представляют опасность, то могут быть инициированы меры предотвращения чрезвычайных происшествий. При этом адекватность и своевременность реакции системы на такой сигнал в большой степени зависят от точности и скорости распознавания ситуаций. Алгоритм распознавания действий человека, представленных камерой видеонаблюдения, включает в себя выделение его как отдельный объект, определение положений тела человека и последовательности совершаемых им движений для каждого фиксируемого момента. Причем системе необходимо хранить все эти данные для последующей обработки и классификации действий. Выполнять такую работу помогают математические модели, которые бывают разных типов. Модели описания по набору кадров, в которых действие в каждом кадре определяется отдельно, часто некорректно анализируют информацию, когда в поле зрения камеры находятся другие люди и предметы. Таким недостатком не обладают векторные модели, которые определяют движения по изменению последовательности координат ключевых точек скелета человека. Для повышения точности эти точки группируют, что позволяет алгоритму эффективно находить и обрабатывать информацию о положении различных частей тела. Для точного распознавания объекта в пространстве данные подвергают процедуре нормализации, когда пиксельные ключевые точки получают реальные значения координат. Однако существующие способы не учитывают большую вариативность поворотов и положений человека в пространстве. При этом одинаковые движения, но выполненные в ином положении относительно камеры, вероятнее всего, будут распознаны как разные. Это затрудняет работу системы, приводя к увеличению объема памяти устройства и усложнению алгоритмов расчета, что требует больше времени и финансовых ресурсов. Для ускорения обработки поступающего с камер видеоматериала и повышения точности определения движений объекта ученые Пермского Политеха, проанализировав существующие модели распознавания скелетов людей и используемые алгоритмы обработки, предложили внедрить в систему видеонаблюдения оригинальные модель и технологию нормализации видеоизображений. Аспирант кафедры «Информационные технологии и автоматизированные системы» ПНИПУ Александр Князев рассказал о сути разработки: «Мы создали упрощенную модель, в которой отсутствует лишняя для наших исследований информация, например, о положении пальцев рук. Зачастую их местонахождение зашумлено, но при этом на обработку также уходит время, усложняется процесс распознавания действий. Ключевыми точками в нашей модели стали глаза, плечи, бедра, локти, кисти, колени и ступни. Также мы предложили алгоритм преобразования информации о движении скелета человека, который распознает действия, сравнивая для большей точности данные с разных камер или под разными углами». Рассказ Князева дополнил заведующий кафедрой «Информационные технологии и автоматизированные системы» ПНИПУ, доктор экономических наук Рустам Файзрахманов: «Эксперименты показали, что наша модель и технология нормализации видеоизображений позволили достичь точности распознавания в 95%. А применение первичных данных обеспечивало лишь 35% точности». Результаты исследования предложенной модели были представлены в статье «Векторная модель и алгоритм нормализации для компьютерного анализа действий человека по кадрам с камер видеонаблюдения», опубликованной в журнале «Вестник ПНИПУ. Электротехника, информационные технологии, системы управления» № 3 за 2024 год. Модель ученых Пермского Политеха, улучшая точность распознавания действий человека, фиксируемых камерами видеонаблюдения, повысит эффективность мониторинга ситуации на контролируемых объектах и тем самым безопасность на производственных предприятиях, охраняемых территориях и в общественных местах, отмечается в сообщении. Интерес к внедрению новой технологии уже проявили несколько промышленных компаний. glavno.smi.today