Перейти к основному контенту
Бизнес ,  
0 

Компания Бекмамбетова начала «клонировать» голоса знаменитостей

Проект Vera Voice занимается развитием нейросети, которая будет способна воспроизводить голоса знаменитостей на русском языке. Ранее Сбербанк заявлял об опасности мошенничества с помощью таких технологий
Тимур Бекмамбетов
Тимур Бекмамбетов (Фото: Евгений Биятов / РИА Новости)

Screenlife Technologies, компания продюсера Тимура Бекмамбетова, и «Стафори» (разработчик HR-сервиса на основе искусственного интеллекта «Робот Вера», в которую инвестирует ФРИИ), создают совместное предприятие для развития проекта Vera Voice. Об этом говорится в поступившем в РБК сообщении компаний.

Проект Vera Voice позволит воспроизводить голоса знаменитостей на русском языке. Он основан на технологии нейросети, которая обучается копировать речь на примере оригинала. Стоимость разработки основатели не назвали.

В России уже реализовывались подобные проекты. В частности, инвестором в подобные технологии является Сбербанк: учрежденная банком в 2013 году компания АБК в январе представила короткий ролик с синтезированным голосом актера Иннокентия Смоктуновского. На нем голос актера произносит: «Прослушав всего около 18 часов записи великого артиста, нейронная сеть теперь способна говорить его голосом».

После этого Сбербанк представил технологию на Российском инвестиционном форуме в Сочи. Зампред правления банка Станислав Кузнецов отметил, что подобные проекты могут использоваться и с незаконными целями. В качестве примера он включил запись, на которой некий вымышленный губернатор голосом Смоктуновского просит 5 млрд руб. на постройку моста.

Открытый алгоритм для синтеза человеческой речи с помощью нейросети под названием WaveNet еще в 2016 году представила принадлежащая Google компания DeepMind. На Западе подобные технологии «клонирования» голоса уже активно применяются: в июле 2019 года инженеры Facebook представили синтезатор речи, который, в частности, сгенерировал голос основателя Microsoft Билла Гейтса. В сентябре Amazon объявил, что голосовая колонка компании — Alexa — сможет разговаривать голосами знаменитостей. Первым стал актер Самуэль Ли Джексон. По оценке консалтинговой компании Markets&Markets, к 2023 году рынок клонирования голоса достигнет $1,73 млрд.

«Как и многие стартапы на русском языке — это клон уже существующей идеи. Есть разделы проблем машинного обучения, связанные с языком, для которых можно делать продукт на локальном рынке по образу и подобию англоязычных. Главное собрать достаточно большую выборку данных на нужном языке. В РФ этим занимаются такие гиганты как Яндекс и Сбербанк. Но для узких задач есть место и мелким игрокам», — заявил РБК российский специалист по data science Павел Плесков.

Индустрия развлечений может быть главным применением для такой технологии, добавил он. «Мошенничество — это самая главная угроза. «Синтезировать голос можно уже по семплу длиной в три секунды. А при текущей популярности робоколов (robocall — автоматический звонок. — РБК) «поделиться» со злоумышленниками таким семплом можно, просто сказав: «Алло! По какому вопросу звоните? С кем я разговариваю?» Дальше мошенники смогут, например, пройти авторизацию в банке по голосу», — пояснил он.

Генерацию голоса из текста старой задачей назвал и специалист компании ESR Labs AG из Германии Дмитрий Шефтелович. «Что касается «клонирования» голоса, то, как и во всех задачах машинного обучения, количество данных играет определяющую роль: для профессионального генерирования речи не так давно требовалось несколько часов записей определенной формы. На данный момент существуют реализации, которым хватает только нескольких секунд необязательно профессионально записанной речи, чтобы «научиться» голосу», — считает специалист.

«Синтез голосов знаменитостей — часть всеобщего интереса к «эмоциональному искусственному интеллекту», когда компании-разработчики пытаются добиться от роботов более естественного звучания, чтобы они не вызывали отторжения у клиентов и пользователей», — заявил РБК гендиректор группы компаний «Центр речевых технологий» Дмитрий Дырмовский. Он отметил, что у данной технологии может быть достаточно широкое применение — от озвучивания книг до маркетинговых компаний с голосами знаменитостей. В то же время синтез голоса может использоваться в ложной рекламе или для фальсификации новостей, отметил Дырмовский.

Готовые квартиры в новых кварталах

В разных районах Москвы и области

Квартиры в столице с выгодой до ₽4,5 млн

Выгодные предложения для семей с детьми

Видовые квартиры в высотных башнях

Варианты с мебелью и встроенной техникой

Авторы
Теги
Прямой эфир
Ошибка воспроизведения видео. Пожалуйста, обновите ваш браузер.


 

Лента новостей
Курс евро на 23 ноября
EUR ЦБ: 107,43 (+1,35)
Инвестиции, 22 ноя, 17:36
Курс доллара на 23 ноября
USD ЦБ: 102,58 (+1,9)
Инвестиции, 22 ноя, 17:36
Ученица Тутберидзе выиграла короткую программу на пятом этапе Гран-приСпорт, 15:04
Как удержать таланты с помощью технологийРБК и Битрикс24, 15:03
Минобороны показало кадры уничтожения украинского МиГ-29 «Искандером»Политика, 15:03
В Дагестане 10 человек пострадали в ДТП с микроавтобусомОбщество, 14:51
Генсек НАТО встретился с Трампом в резиденции республиканца во ФлоридеПолитика, 14:43
Девушку-бойца унесли на носилках после тяжелого нокаута на турнире UFCСпорт, 14:39
Маск побил собственный рекорд и вновь стал богатейшим человеком в историиБизнес, 14:37
Онлайн-курс Digital MBA от РБК Pro
Объединили экспертизу профессоров MBA из Гарварда, MIT, INSEAD и опыт передовых ИТ-компаний
Оставить заявку
Украинский депутат обвинил Зеленского во лжи после удара «Орешником»Политика, 14:27
Шлосберг назвал причину задержанияПолитика, 14:10
«Зенит» вырвал победу у аутсайдера РПЛ на 96-й минутеСпорт, 14:03
Маск поинтересовался ценой американского телеканала MSNBCПолитика, 13:59
Генерал Ходжес заявил, что конфликт на Украине мог закончиться в 2023-мПолитика, 13:56
Почему роскошь любит тишинуРБК и Сбер Первый, 13:50
Что происходит с медициной в России и как она выглядит на фоне зарубежнойLife, 13:48