Компанія Google розробила Veo 3 — штучний інтелект для генерації відео, який також може створювати та інтегрувати аудіо.

Цей ШІ-інструмент конкурує з генератором відео Sora від OpenAI, проте його здатність також включати аудіо у створюване відео є ключовою відмінністю. Компанія повідомила, що Veo 3 може інтегрувати аудіо, яке включає діалоги між персонажами, а також звуки тварин, передає CNBC.

"Veo 3 відмінно працює від текстових та зображувальних запитів до реалістичної фізики та точної синхронізації губ", — заявив віцепрезидент з продуктів Google DeepMind Елі Коллінз.

Інструмент для створення відео та аудіо став доступним у вівторок для американських передплатників нового тарифного плану Ultra від Google вартістю $249,99 на місяць, орієнтованого на затятих ентузіастів ШІ. Veo 3 також буде доступний для користувачів корпоративної платформи Google Vertex AI.

Google також анонсував Imagen 4, свій найновіший інструмент для генерації зображень, який, за словами компанії, створює зображення вищої якості через запити користувачів. Крім того, Google представив Flow — новий інструмент для створення фільмів, який дозволяє користувачам створювати кінематографічні відео, описуючи локації, кадри та стильові уподобання. Користувачі можуть отримати доступ до інструменту через Gemini, Whisk, Vertex AI та Workspace.

Останні запуски відбуваються на тлі зростання популярності зображень та відео як сфер застосування генеративного ШІ. Генеральний директор OpenAI Сем Альтман у березні заявив, що генератор зображень ChatGPT 4o був настільки популярним, що спричинив "плавлення" обчислювальних чипів компанії. Компанія повідомила, що їй довелося тимчасово обмежити використання цієї функції.

Google має неоднозначну історію щодо своїх генераторів зображень на основі ШІ. Минулого року компанії довелося перезапустити свій інструмент Imagen 3 після того, як він видав історично неточні результати на запити користувачів, викликавши широку критику. Співзасновник Сергій Брін пізніше заявив, що ця невдача сталася через відсутність "ретельного тестування".

Компанія з Маунтін-В'ю, Каліфорнія, також оновила свій генератор відео Veo 2, додавши можливість для користувачів додавати або видаляти об'єкти з відео за допомогою текстових запитів. Крім того, Google відкрив свою модель генерації музики Lyria 2 для творців через платформу YouTube Shorts та для бізнесу, що використовує Vertex AI.