Перейти к основному контенту
Технологии и медиа ,  
0 

OpenAI представила новую версию нейросети GPT-4o

Новая версия ИИ GPT-4o реагирует на голос в среднем за 320 миллисекунд, что сравнимо с реакцией в разговоре. Она «лучше воспринимает изображение и аудио по сравнению с существующими моделями», отмечают разработчики
Основатель OpenAI Сэм Альтман
Основатель OpenAI Сэм Альтман (Фото: Justin Sullivan / Getty Images)

OpenAI представила новую версию генеративного искусственного интеллекта GPT-4o, которая ляжет в основу чат-бота ChatGPT. Буква О означает сокращение от слова omni (всесторонний).

GPT-4o работает с аудио, изображениями и текстом. По словам разработчиков, она реагирует на голос в среднем за 320 миллисекунд, что сравнимо с реакцией в разговоре.

Новая версия соответствует производительности GPT-4 Turbo, но «лучше воспринимает изображение и аудио по сравнению с существующими моделями», отмечает OpenAI.

«До GPT-4o вы могли использовать голосовой режим для общения с ChatGPT со средней задержкой 2,8 секунды (GPT-3.5) и 5,4 секунды (GPT-4). Голосовой режим в этих версиях состоит из трех отдельных моделей: одна простая модель транскрибирует аудио в текст, GPT-3.5 или GPT-4 выводит текст, а третья простая модель преобразовывает этот текст обратно в аудио», — пояснили в компании.

В результате GPT-4 теряет множество информации и не может воспроизводить смех, пение или выражать эмоции. «В случае с GPT-4o мы обучили единую новую модель сквозному анализу текста, изображения и аудио; это означает, что все входные и выходные данные обрабатываются одной и той же нейронной сетью», — рассказали разработчики. Модель доступна более чем на 50 языках, в том числе на русском.

Bloomberg узнал о сделке Apple и OpenAI для внедрения ChatGPT в iPhone
Технологии и медиа
Фото:Andrew Kelly / Reuters

GPT-4o предоставляется пользователям с 13 мая. Однако доступ к голосовым функциям в ближайшие недели появится только у «небольшой группы доверенных партнеров», а в июне — у платных подписчиков.

В конце ноября 2022 года компания OpenAI, одним из основателей которой был Илон Маск, представила универсальный чат-бот ChatGPT.

Этот чат-бот способен вести диалог, искать ошибки в коде, сочинять стихи, писать сценарии и даже спорить. Нейросеть, на основе которой работает ChatGPT, может помимо прочего выдавать базовый программный код, генерировать финансовый анализ, резюме технических статей или научных концепций, прогнозы, персональные советы и дает этичные ответы на любые вопросы. Кроме того, она запоминает детали диалога с пользователем и избегает спорных тем. Наконец, ответы чат-бота можно корректировать с помощью наводящих вопросов.

ChatGPT создавали на суперкомпьютере Azure AI на основе языковой модели GPT-3,5 от OpenAI. Чат-бот обучали с помощью массива текстов из интернета и системы с подкреплением на основе обратной связи с человеком Reinforcement Learning from Human Feedback. Затем нейросеть переобучали несколько раз, используя ее собственные ответы, чтобы сделать последние более точными и корректными. Разработчики заявили, что стремились сделать ИИ простым в использовании, корректным и «человечным».

ChatGPT работает как чат в диалоговом окне. Нейросетью можно пользоваться бесплатно, для этого нужно только зарегистрироваться на сайте OpenAI. Однако пройти верификацию по российскому номеру телефона не получится. Кроме того, сайт заблокировал доступ к чат-боту с российских IP-адресов. Разработчики предлагают также платную подписку ChatGPT Plus, которая гарантирует бесперебойную работу чат-бота даже в часы загруженности. Она стоит $20 в месяц.

В марте 2023 года OpenAI представила новую модель GPT-4. ChatGPT также обновили, добавив фильтры новой модели, которая характеризуется как более точная и этичная. Кроме того, чат-бот начал отвечать на запросы в виде не только текста, но и картинок.

Тематический проект о российской винодельческой культуре, вине и спиртных напитках

РБК Вино РБК Вино

Главные в вине: в Москве прошел Российский винодельческий форум

РБК Вино РБК Вино

Артур Саркисян — о том, как прошел Третий винодельческий форум

РБК Вино РБК Вино

Слово о вине: что пили и каким вином вдохновлялись писатели в России

РБК Вино РБК Вино

Как устроены винные ярмарки в России

РБК Вино РБК Вино

Путеводитель по рейтингам: лучшие вина России

РБК Вино РБК Вино

Сухая, слепая, вертикальная: какими бывают дегустации

Авторы
Теги
Прямой эфир
Ошибка воспроизведения видео. Пожалуйста, обновите ваш браузер.
Лента новостей
Курс евро на 16 ноября
EUR ЦБ: 105,71 (+1,21)
Инвестиции, 15 ноя, 18:23
Курс доллара на 16 ноября
USD ЦБ: 100 (+0,98)
Инвестиции, 15 ноя, 18:23
Все свое: как промышленные предприятия импортозамещают технологииТренды, 18:05
Зеленский пообещал «сделать все» для завершения конфликта в 2025 годуПолитика, 18:05
Песков назвал длительность разговора Путина и ШольцаПолитика, 17:58
«Авангард» продлил домашнюю серию побед против клуба КХЛСпорт, 17:37
Зеленский объяснил отказ раскрывать, сколько украинцев нужно мобилизоватьПолитика, 17:28
Le Figaro узнала, что захвативший заложников во Франции вооружен ножомОбщество, 17:26
«Всё зависит от силы духа»: карьера и личный путь Светланы СветличнойОбщество, 17:20 
Онлайн-курс Digital MBA от РБК Pro
Объединили экспертизу профессоров MBA из Гарварда, MIT, INSEAD и опыт передовых ИТ-компаний
Оставить заявку
В ВСУ назвали русский язык одной из причин поражения украинских солдатПолитика, 16:59
В Саратовской области появится реестр наркомановОбщество, 16:48
Маск пообещал уничтожить призвавших расследовать его контакты с РоссиейПолитика, 16:42
На шахте в Кузбассе нашли тело погибшегоОбщество, 16:40
Фигуристка Петросян выиграла короткую программу на этапе Гран-при РоссииСпорт, 16:28
Мужчина захватил заложников в ресторане в пригороде Парижа⁠Политика, 16:22
Протестующие в Абхазии отвергли предложение президента о выборахПолитика, 16:15