ChatGPT запускает новый голосовой режим, интегрированный в чат

  • Новый голосовой режим ChatGPT интегрируется непосредственно в окно чата, без переключения на отдельный экран.
  • Пользователи могут одновременно говорить, читать стенограмму в реальном времени и просматривать изображения, карты или другие визуальные элементы.
  • Функция доступна в веб-версии, на Android и iOS, с возможностью вернуться к предыдущему «Отдельному режиму» в настройках.
  • Расширенный голосовой режим повышает естественность, сокращает задержку и предлагает более персонализированные голоса, поддерживаемые такими моделями, как GPT-5.1.

Голосовой режим ChatGPT в чате

Способ говорить с ChatGPT Он только что значительно изменился. OpenAI решила упростить доступ к одной из своих самых популярных функций – голосовой режимкоторый теперь интегрирован непосредственно в тот же экран чата, как и всегда, без необходимости переходить к другому представлению или открывать параллельные интерфейсы.

Благодаря этому обновлению помощник OpenAI объединяет текстовое и голосовое общение в единый интерфейс. Пользователи могут поговорите с ИИ, глядя на экран транскрипция в реальном времениПомимо карт, изображений и других визуальных элементов, которые система отображает в зависимости от контекста запроса, все происходит в одном потоке, более плавно и естественно.

Что меняется с новым интегрированным голосовым режимом

Новый голосовой режим интегрирован в ChatGPT

До сих пор, чтобы использовать голосовую связь с ChatGPT на мобильном устройстве или в Интернете, вам приходилось переходить на автономный интерфейсНажатие на соответствующий значок открывало экран, на котором красовался классический синий шар, полностью отображающий звук. Это было захватывающе, но приходилось переключаться между средами каждый раз, когда нужно было просмотреть предыдущие сообщения или проверить что-то визуальное.

Эта функция устарела. В новой версии, когда вы касаетесь значок волны Расположенный рядом с панелью ввода текста, ChatGPT активирует голосовой режим внутри чата. Пользователь может продолжать просматривать всю историю сообщений, одновременно начиная голосовой разговор с помощником, не покидая главное окно.

Во время разговора система отображает транскрипция речи пользователя в реальном времени и ответы ИИИдея заключается в том, что этот опыт должен быть больше похож на личную беседу, но с дополнительным преимуществом в виде письменного отчета и возможности без усилий вернуться к любой точке.

Помимо текста, интерфейс может включать в себя визуальный контент в реальном времениВ зависимости от заданного вопроса, это могут быть изображения, сгенерированные ИИ, скриншоты, фрагменты веб-страниц или карты. Таким образом, вам не нужно выходить из режима голосового управления, чтобы видеть необходимую визуальную информацию, продолжая общаться с помощником.

Еще одна практическая деталь заключается в том, что он может переключаться между письмом и говорением в любое времяДаже если активирован голосовой режим, если пользователь вводит вопрос, ответ все равно может быть дан в голосовом формате, что сохраняет непрерывность разговора.

Расширенный голосовой режим: более естественный, быстрый и персонализированный

Расширенные голоса ChatGPT

Интеграция интерфейсов не происходит изолированно. OpenAI воспользовался возможностью представить Улучшения расширенного голосового режимаСамый продвинутый вариант для разговоров в реальном времени. Этот режим обеспечивает более естественное звучание голоса, интонации, максимально приближенные к реальным, и определённую способность передавать эмоциональные нюансы.

По данным компании, модели ИИ были адаптированы для уменьшить задержку и сделать разговор более плавнымПомощник может реагировать всего за несколько сотен миллисекунд, приближаясь по скорости к разговору между двумя людьми. Цель — уменьшить ощущение взаимодействия с машиной и уменьшить напряжение в повседневной жизни.

OpenAI также включил поддержку в этом контексте для более новых моделей, таких как GPT-5.1Это позволяет лучше контролировать тон голоса, адаптировать стиль ответов и вести более сложные диалоги, не прерывая ход беседы. Для тех, кто использует ChatGPT в качестве помощника для работы, учёбы или личного пользования, это улучшение может иметь решающее значение.

На практике это означает Доступные голоса менее роботизированы и приятнее слушать в течение длительного времени. Хотя такой подход к «очеловечиванию» ИИ подвергся критике в некоторых специализированных кругах, OpenAI утверждает, что он помогает людям чувствовать себя более комфортно и делает взаимодействие менее безличным.

Важно обратить внимание на Существует два уровня голосового опытаС одной стороны, есть бесплатный стандартный режим, который уже поддерживает голосовые чаты и доступен всем. С другой стороны, есть расширенный режим с расширенными аудиовозможностями и дополнительными голосами, доступный владельцам платных тарифов, таких как ChatGPT Plus, Pro или Teams. В обоих случаях интеграция с чатом одинакова.

Как активировать или деактивировать новый голосовой режим в ChatGPT

Доступ к новой функции довольно прост. В приложении ChatGPT, как в Android, iOS и веб-версияПросто убедитесь, что приложение обновлено. После этого в правой части панели сообщений появится значок волны или речевого пузыря.

Нажатие этой кнопки немедленно активирует голосовой разговор внутри самого чатаПользователь может начать говорить и видеть, как ИИ отображает свои ответы в режиме реального времени, в текстовом формате и, при необходимости, с изображениями, картами или другими визуальными ресурсами. Никаких дополнительных действий для подтверждения или перехода в другое меню не требуется.

Если в какой-то момент вы захотите переписать, вы можете нажмите ту же кнопку еще раз Или просто начните печатать. Когда включен голосовой режим, даже если вы отправляете текстовые сообщения, помощник всё равно может отвечать устно, сохраняя при желании режим «hands-free».

Для тех, кого это изменение не совсем устраивает, OpenAI предлагает возможность вернуться к прежнему. В настройках приложения, в разделе, посвящённом Голосовой режим, вы можете активировать настройку, называемую «Отдельный режим»При этом инструмент возвращается к своему предыдущему поведению, при котором пользователь каждый раз, когда он хочет поговорить с ChatGPT, перенаправляется в аудиоинтерфейс.

Этот «отдельный режим» может активировать и деактивировать столько раз, сколько необходимоБез ограничений. Каждый может выбрать, предпочитает ли он более захватывающий опыт, ориентированный на аудио, или новый унифицированный интерфейс, сочетающий текст, голос и визуальные эффекты.

Глобальная доступность и использование в Испании и Европе

OpenAI указал, что Интеграция голосового режима в чат внедряется по всему миру. Это относится как к веб-версии, так и к мобильным приложениям. На практике в Испании и других странах Европы пользователям достаточно обновить приложение из официального магазина приложений своего мобильного устройства или обновить веб-сайт, чтобы увидеть новые функции.

Компания отмечает, что Базовый доступ к голосовому помощнику остается бесплатнымОднако для учётных записей без подписки могут действовать ограничения по минутам использования или ежедневной интенсивности, которые регулируются динамически в зависимости от нагрузки на сервис. Владельцы платных тарифов получают большую гибкость и премиум-функции голосовой связи, интегрированные непосредственно в главное окно чата.

В европейском контексте это обновление происходит в то время, когда конкуренция между голосовыми помощниками на основе искусственного интеллекта Гонка становится всё более ожесточённой благодаря таким предложениям, как Gemini Live от Google, и инструментам, интегрированным в мобильные и настольные экосистемы. Полная интеграция голосового и текстового чата ChatGPT обеспечивает сервису сильные позиции в этой конкурентной борьбе.

Для среднего пользователя в Испании это означает, что он может сверяйтесь с маршрутами на карте, спрашивайте рекомендации, пересматривайте задания или разрешайте сложные сомнения, разговаривая естественно., одновременно просматривая информацию, организованную на экране, без переходов между режимами или резких смен интерфейса.

В профессиональной и образовательной сферах эта новая форма взаимодействия может способствовать генерация голосового резюмеПроведение совещаний с использованием ИИ, исправление надиктованных текстов или поддержка в изучении языка — все это позволяет использовать как слуховые, так и визуальные аспекты в одном рабочем процессе.

Благодаря этому шагу ChatGPT движется к более унифицированному диалоговому опыту, в котором Голос, текст и визуальный контент сосуществуют на одном экранеВозможность возврата к старому «отдельному режиму» оставляет место для более традиционных пользователей, но основное внимание OpenAI, очевидно, уделяется модели непрерывного взаимодействия, более близкой к тому, как мы общаемся и обращаемся к информации в нашей повседневной жизни, будь то Испания, остальная часть Европы или любая другая точка на карте.

Использование ChatGPT в качестве основного помощника на Android 3
Теме статьи:
Полное руководство по использованию ChatGPT в качестве голосового помощника на Android