Просмотры: 232
09.09.2025
Как сообщает сайт ПНИПУ, ученые пермского Политеха разработали новый метод передачи видео, который позволяет системам машинного зрения стабильно работать даже при прерывающемся и медленном интернет-соединении. Методика показала эффективность на 28-32% выше по сравнению с существующими решениями.
Статья об этом опубликована в журнале «Вестник ПНИПУ. Электротехника, информационные технологии, системы управления». Исследование проведено в рамках программы стратегического академического лидерства «Приоритет-2030»
В основном систем машинного зрения используются в «умных» камерах наблюдения, на улицах, в больницах, метро, на заводах, а также могут быть встроены в квадрокоптерах и промышленных роботах. Работа комплекса машинного зрения заключается в следующем: камера записывает видео и сжимает его, чтобы уменьшить размер для передачи данных. Затем эта информация отправляется по сети небольшими частями (пакетами) на сервер или устройство просмотра, где происходит распаковка и превращение обратно в видео. Если интернет плохой, пакеты теряются или задерживаются, а видео зависает, пропускает кадры или превращается в размытое изображение. Особенно часто это происходит в удаленных и труднодоступных регионах со слабым покрытием сотовой связи и при использовании беспроводных сетей, где сигнал нестабилен из-за помех, расстояния или перегрузок сети. Также — если объект с машинным зрением находится в движении, например, при передаче видео с квадрокоптеров или камер на транспорте.
Такие помехи могут обернуться серьезной проблемой. Например, уличные системы, которые анализируют видео с камер и помогают раскрывать преступления, отслеживать ДТП, при сбое могут не узнать лица преступников в толпе или номер угнанной машины. А в палатах интенсивной терапии при возникновении таких помех на видеозаписи можно упустить момент, когда пациент упал с кровати или перестал дышать, что чревато несвоевременным оказанием помощи.
Для борьбы с перебоями при передаче видео существуют специальные алгоритмы сжатия. Они уменьшают объем данных, сохраняя только изменения между кадрами. Например, если в объектив попадает автомобиль, который едет на неподвижном фоне, система запоминает бэкграунд один раз, а затем фиксирует лишь смещение объекта. Такие методы сокращают размер передаваемых данных, однако требуют больших вычислительных ресурсов. Поэтому они непригодны для маломощных систем, которые обычно встроены в камеры наблюдения, автономных роботов или датчики.
Ученые Пермского Политеха создали новый программный алгоритм на основе нейронной сети, который обеспечивает видеопередачу без перебоев. Его можно встроить в прошивку камер видеонаблюдения, систему управления или программное обеспечение для роботов.
«Наш алгоритм работает в три шага. Сначала программа с помощью искусственного интеллекта определяет, какой объект на видео самый важный (область интереса — ROI) и определяет его границы. Затем упаковывает эти данные с помощью современного формата сжатия — JPEG 2000. Он похож на обычный JPEG, в котором мы сохраняем картинки из интернета, но превосходит его по качеству. В процессе съемки наша система оценивает текущую скорость интернета и рассчитывает, сколько данных можно успеть передать за время показа одного кадра. Если скорость низкая, данные кадра отправляются не целиком, а только частично. Поскольку нейросеть уже определила, какой участок нужно передать, в первую очередь уходят данные о нужных объектах, даже при плохом соединении», — комментирует Андрей Кокоулин, доцент кафедры «Автоматика и телемеханика» ПНИПУ.
Для проверки эффективности ученые искусственно создали ситуацию, когда из-за плохой связи передается только 10-20% видео. В ходе испытаний новая методика показала превосходство над аналогами: ключевые объекты, такие как лица или номера машин, передавались на 54-81% четче, чем в обычных системах, при этом потребляя на 40-45% меньше интернет-трафика. Общая эффективность метода на 28-32% выше традиционных решений.
В основном систем машинного зрения используются в «умных» камерах наблюдения, на улицах, в больницах, метро, на заводах, а также могут быть встроены в квадрокоптерах и промышленных роботах. Работа комплекса машинного зрения заключается в следующем: камера записывает видео и сжимает его, чтобы уменьшить размер для передачи данных. Затем эта информация отправляется по сети небольшими частями (пакетами) на сервер или устройство просмотра, где происходит распаковка и превращение обратно в видео. Если интернет плохой, пакеты теряются или задерживаются, а видео зависает, пропускает кадры или превращается в размытое изображение. Особенно часто это происходит в удаленных и труднодоступных регионах со слабым покрытием сотовой связи и при использовании беспроводных сетей, где сигнал нестабилен из-за помех, расстояния или перегрузок сети. Также — если объект с машинным зрением находится в движении, например, при передаче видео с квадрокоптеров или камер на транспорте.
Такие помехи могут обернуться серьезной проблемой. Например, уличные системы, которые анализируют видео с камер и помогают раскрывать преступления, отслеживать ДТП, при сбое могут не узнать лица преступников в толпе или номер угнанной машины. А в палатах интенсивной терапии при возникновении таких помех на видеозаписи можно упустить момент, когда пациент упал с кровати или перестал дышать, что чревато несвоевременным оказанием помощи.
Для борьбы с перебоями при передаче видео существуют специальные алгоритмы сжатия. Они уменьшают объем данных, сохраняя только изменения между кадрами. Например, если в объектив попадает автомобиль, который едет на неподвижном фоне, система запоминает бэкграунд один раз, а затем фиксирует лишь смещение объекта. Такие методы сокращают размер передаваемых данных, однако требуют больших вычислительных ресурсов. Поэтому они непригодны для маломощных систем, которые обычно встроены в камеры наблюдения, автономных роботов или датчики.
Ученые Пермского Политеха создали новый программный алгоритм на основе нейронной сети, который обеспечивает видеопередачу без перебоев. Его можно встроить в прошивку камер видеонаблюдения, систему управления или программное обеспечение для роботов.
«Наш алгоритм работает в три шага. Сначала программа с помощью искусственного интеллекта определяет, какой объект на видео самый важный (область интереса — ROI) и определяет его границы. Затем упаковывает эти данные с помощью современного формата сжатия — JPEG 2000. Он похож на обычный JPEG, в котором мы сохраняем картинки из интернета, но превосходит его по качеству. В процессе съемки наша система оценивает текущую скорость интернета и рассчитывает, сколько данных можно успеть передать за время показа одного кадра. Если скорость низкая, данные кадра отправляются не целиком, а только частично. Поскольку нейросеть уже определила, какой участок нужно передать, в первую очередь уходят данные о нужных объектах, даже при плохом соединении», — комментирует Андрей Кокоулин, доцент кафедры «Автоматика и телемеханика» ПНИПУ.
Для проверки эффективности ученые искусственно создали ситуацию, когда из-за плохой связи передается только 10-20% видео. В ходе испытаний новая методика показала превосходство над аналогами: ключевые объекты, такие как лица или номера машин, передавались на 54-81% четче, чем в обычных системах, при этом потребляя на 40-45% меньше интернет-трафика. Общая эффективность метода на 28-32% выше традиционных решений.
Комментарии читателей
eng


