Сегодня в каждом новом смартфоне есть камера, которая может снимать и сохранять видео ролики, но что если бы она могла предсказывать, что произойдет в следующий момент?
Это реальнее, чем вы могли бы подумать. Исследователи из MIT CSAIL создали глубокий алгоритм обучения искусственного интеллекта, который теперь может прогнозировать, что произойдет на видео в будущем.
После того, как через систему пропустили множество (около 2 млн) видео она может формировать кадры прогнозируемых событий. ИИ использует результаты работы сразу двух нейронных сетей. Первая определяет, какие объекты статичны, а какие движутся, а вторая тем временем проверяет насколько реальными получаются смоделированные кадры.
Конечно, эта технология не совершенна: пока что ИИ может прогнозировать и моделировать кадры того, что произойдет только в следующие 1,5 секунды, а результаты не всегда соответствуют действительности. Также есть некоторые проблемы с движущимися объектами, размер которых система, как правило преувеличивает. Тем не менее ИИ довольно хорошо прогнозирует относительно сложные сцены, к примеру, движения волн на пляже или людей, гуляющих по траве.
Если специалисты из CSAIL смогут повысить точность прогнозов, то в будущем есть немало перспектив применения этой технологии: начиная от использования в беспилотных автомобилях, где можно было бы предсказывать движения окружающих людей и автомобилей, до создания анимации из неподвижных изображений или сжатия видео.