Перелом произошёл в тот момент, когда системы начали работать не с видеопотоком как с файлом, а как с набором данных.
Хороший пример —
AI-Seek в регистраторах NVR iFlow.
Здесь поиск перестаёт быть привязанным к таймлайну. Оператор формулирует запрос обычным языком, а система находит нужные эпизоды в архиве.
Например:
- мужчина в красной куртке
- жёлтый автомобиль утром
- человек рядом с зоной погрузки
Технически это решается через мультимодальную модель. Она анализирует изображение и одновременно интерпретирует текст. Во время записи формируются метаданные, по которым и происходит поиск.
На практике это выглядит просто. Вместо ручного просмотра — результат за секунды.