Компания Google разработала Veo 3 — искусственный интеллект для генерации видео, который также может создавать и интегрировать аудио.
Этот ИИ-инструмент конкурирует с генератором видео Sora от OpenAI, однако его способность также включать аудио в создаваемое видео является ключевым отличием. Компания сообщила, что Veo 3 может интегрировать аудио, которое включает диалоги между персонажами, а также звуки животных, передает CNBC.
"Veo 3 отлично работает от текстовых и изобразительных запросов до реалистичной физики и точной синхронизации губ", — заявил вице-президент по продуктам Google DeepMind Эли Коллинз.
Инструмент для создания видео и аудио стал доступным во вторник для американских подписчиков нового тарифного плана Ultra от Google стоимостью $249,99 в месяц, ориентированного на заядлых энтузиастов ИИ. Veo 3 также будет доступен для пользователей корпоративной платформы Google Vertex AI.
Google также анонсировал Imagen 4, свой новейший инструмент для генерации изображений, который, по словам компании, создает изображения более высокого качества через запросы пользователей. Кроме того, Google представил Flow — новый инструмент для создания фильмов, который позволяет пользователям создавать кинематографические видео, описывая локации, кадры и стилевые предпочтения. Пользователи могут получить доступ к инструменту через Gemini, Whisk, Vertex AI и Workspace.
Последние запуски происходят на фоне роста популярности изображений и видео как сфер применения генеративного ИИ. Генеральный директор OpenAI Сэм Альтман в марте заявил, что генератор изображений ChatGPT 4o был настолько популярным, что вызвал "плавление" вычислительных чипов компании. Компания сообщила, что ей пришлось временно ограничить использование этой функции.
Google имеет неоднозначную историю относительно своих генераторов изображений на основе ИИ. В прошлом году компании пришлось перезапустить свой инструмент Imagen 3 после того, как он выдал исторически неточные результаты на запросы пользователей, вызвав широкую критику. Сооснователь Сергей Брин позже заявил, что эта неудача произошла из-за отсутствия "тщательного тестирования".
Компания из Маунтин-Вью, Калифорния, также обновила свой генератор видео Veo 2, добавив возможность для пользователей добавлять или удалять объекты из видео с помощью текстовых запросов. Кроме того, Google открыл свою модель генерации музыки Lyria 2 для творцов через платформу YouTube Shorts и для бизнеса, использующего Vertex AI.