08 марта 2017

Google представил Video Intelligence API


Google представил Video Intelligence API для распознавания образов внутри видео контента. 

Предположим, что вы решили узнать, возвращается ли на своё излюбленное место в тайге ваш подопечный уссурийский тигр. Вы установили вокруг предполагаемого места обитания уссурийского тигра десятки видеокамер, которые снимали круглосуточно целый месяц и сейчас имеете на руках тысячи часов видео с видами тайги во всех ракурсах.  Теперь вам надо просмотреть эти видео, чтобы понять, есть ли на них тигр. Вы, конечно, можете сделать это вручную, потратив месяц другой на просмотр отснятых видео, но загрузив ваши видео в облако Google, с помощью Video Intelligence API, вы легко сможете найти заданный образ среди тысяч видео записей за секунды.



Как это работает?

Google с помощью Video Intelligence API оценивает каждый отдельный кадр загруженных видео и аннотирует его с помощью названий ключевых образов, которые удалось найти в кадре. Далее, на основании этих ключевых слов ему не составляет труда создать поисковый индекс для всего видео, с указанием на какой конкретно секунде встречается каждый из образов. Затем, поиск заданных вами ключевых слов осуществляется по построенному поисковому индексу и видео, содержащие нужные образы выдаются в качестве результата, причём с возможностью мгновенного перехода к тому месту, где этот образ есть на видео.


В лаборатории Google вы можете прямо сейчас попробовать распознать какое-либо тестовое видео и увидеть насколько релевантны результаты распознавания тому, что вы видите собственными глазами на этих видео.