Бесплатно Экспресс-аудит сайта:

27.09.2023

OpenAI анонсировала новые возможности ChatGPT: "видеть", "слышать" и "говорить"

OpenAI объявила о новых функциях своего чатбота ChatGPT , который теперь может "видеть, слышать и говорить", а точнее, понимать произнесенные слова, отвечать синтетическим голосом и обрабатывать изображения. Это крупнейшее обновление с момента введения GPT-4.

Пользователи могут переключиться на голосовые разговоры в мобильном приложении ChatGPT и выбирать из пяти различных синтетических голосов для ответа бота. Также им будет доступна возможность делиться изображениями с ChatGPT и выделять области для анализа, например, задавая вопрос: "Какие это облака?".

Новые функции будут доступны платным пользователям в течение следующих двух недель. Голосовые функции будут доступны только в приложениях для iOS и Android, в то время как обработка изображений будет доступна на всех платформах.

Это обновление приходит на фоне усиливающейся конкуренции в сфере искусственного интеллекта между лидерами рынка, такими как OpenAI, Microsoft, Google и Anthropic. Технологические гиганты стремятся запускать не только новые чатботы, но и новые функции.

Ранее в этом году Microsoft увеличила инвестиции в OpenAI на дополнительные $10 миллиардов, что стало крупнейшим инвестиционным соглашением в области ИИ за год. В апреле стартап завершил продажу акций на $300 миллионов с оценкой компании между $27 миллиардами и $29 миллиардами.

Однако эксперты выразили опасения относительно синтетических голосов, созданных на основе ИИ, которые могут использоваться для создания убедительных "глубоких подделок" (deepfakes). OpenAI признала эти опасения, заявив, что синтетические голоса были созданы с актерами, с которыми компания напрямую сотрудничала, а не собраны у случайных людей.

В релизе также было мало информации о том, как OpenAI будет использовать голосовые вводы пользователей и как компания будет обеспечивать безопасность этих данных. Однако OpenAI подтвердила, что не сохраняет аудиозаписи и не использует их для улучшения моделей, но транскрипции рассматриваются как ввод и могут быть использованы для улучшения моделей большого языка.