Платформа Openrouter, агрегирующая доступ к различным языковым моделям через единый API, объявила о добавлении поддержки видеовхода в своё API. Эта новость появилась примерно через месяц после фактического внедрения.
Как начать работу с видео в Openrouter API
Для разработчиков, заинтересованных в интеграции видеоанализа, Openrouter предлагает подробную документацию:
- Документация по работе с видео на вход в API: здесь вы найдёте все необходимые инструкции для использования новой функции.
- Список моделей с поддержкой видео: этот раздел показывает, какие модели уже поддерживают работу с видео. Стоит отметить, что некоторые провайдеры, такие как Qwen, пока не добавили поддержку video-to-text, но есть надежда, что они вскоре исправятся.
Обновление видеоанализатора
На фоне этих новостей был обновлён видеоанализатор автора. Теперь процесс стал значительно проще, поскольку больше не требуется проходить "все круги ада с авторизацией в Google Cloud Console". Достаточно добавить API-ключ от Openrouter в конфигурацию проекта, выбрать нужную модель для анализа, и можно приступать к работе.
Среди поддерживаемых моделей для работы с видео есть приятный бонус: доступны бесплатные Amazon Nova 2 Lite и Nvidia Nemotron Nano.
Ограничения и поиск решений
Однако есть и минусы. В текущей реализации анализатор автора работает с Openrouter только путём конвертации видео в формат Base64. Это накладывает ограничение на размер анализируемого файла или его части – он не должен превышать 15 МБ. Для сравнения, работа с Gemini через Google API позволяет обрабатывать файлы размером до 2 ГБ.
В связи с этим автор обращается к сообществу с просьбой подсказать проверенные и желательно бесплатные сервисы для временной загрузки видео, чтобы получить публичный URL для передачи в API. Это помогло бы обойти текущие ограничения по размеру файла.