OpenAI представила разработчикам настройку голосового режима

02 Oct 2024, 11:15 by Владимир Слипер · ForkLog · Подписаться

OpenAI анонсировала несколько новых инструментов, включая публичную бета-версию Realtime API для создания приложений с возможностью голосовых ответов с низкой задержкой. Об этом пишет TechCrunch.

Благодаря новой функции разработчики могут создавать в своих приложениях голосовое общение в реальном времени с поддержкой шести голосов.

Руководитель отдела разработки Ромен Юет в качестве примера показал приложение для планирования поездок, которое позволяет устно общаться с ИИ-помощником.

Среди других анонсов OpenAI — настройка «зрения» искусственного интеллекта, которая поможет разработчикам улучшить визуальное понимание нейросети.

Также представлена функция использования более крупных моделей вроде o1-preview и GPT-4o для обучения меньших.

Директор по продуктам OpenAI Кевин Вайль отметил, что недавние уходы технического директора Миры Мурати и главного научного директора Боба МакГрю не повлияют на работу компании.

Тем временем один из соучредителей OpenAI Дюрк Кингма присоединился к конкурирующему ИИ-стартапу Anthropic.

Он ушел из компании Сэма Альтмана в 2018 году, решив стать бизнес-ангелом и консультантом для ИИ-стартапов.

Anthropic основан в 2021 году бывшим вице-президентом OpenAI Дарио Амодеем и его сестрой Даниэлой Амодей.

В августе фирма переманила соучредителя компании-разработчика ChatGPT Джона Шульмана. В мае она наняла бывшего руководителя по безопасности OpenAI Яна Лейке.

Напомним, стартап Альтмана ведет переговоры о привлечении $6,5 млрд при оценке в $150 млрд.

В сентябре он анонсировал запуск расширенного голосового режима ChatGPT.

Telegram (основной канал) Discord Instagram

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

Итоги недели Итоги недели + главные новости по будням