Главная
Наука
Открытие для немых: голос можно «приобрести»

Открытие для немых: голос можно «приобрести»

11 января 2020

Современная наука делает акцент на использовании технологических достижений в сфере медицины, и результат этих экспериментов – огромный прогресс и значительное расширение горизонтов в 21-м веке. Рассказываем про стартап VocaliD, который позволяет индивидуально «озвучить» людей, лишенных голоса!

В начале столетия был изобретен искусственный голос. Многие помнят, как гениальный английский ученый современности Стивен Хокинг общался с аудиторией через ноутбук. Напечатанный текст воспроизводился через искусственный компьютерный голос.

Конечно, это устройство во многом облегчало коммуникацию, но его недостаток был очевиден: голос был компьютерным, неестественным. В добавок ко всему, речь англичанина воспроизводилась «совсем по-американски», что сразу заметила его супруга Джейн. Этим же голосом разговаривало еще два с половиной миллиона людей разных полов и возрастов. Иными словами, ни о какой идентификаций человека по голосу и не могла идти речь.

Донорство голоса? Да!

Хорошая новость в 2014 году появилась для людей, которые по той или иной причине не могут говорить. Ученый-лингвист Рупал Патель основала компанию VocaliD, которая помогает немым обрести свой уникальный голос, подогнанный под внешность и другие качества. Название проекта так и переводится – вокальная индивидуальность.

Для Рупал Патель слова Генри Лонгфелло «Голос человека есть орган его души» послужили главной идеей на пути к осуществлению своей задумки. Если голоса на данный момент нет, то его можно спроектировать!

Как это возможно?

Система, по которой голос приводится в действие, для всех едина. Из гортани каждого человека производятся вибрации, которые отвечают за громкость, скорость и окраску голоса. Эти вибрации представляют собой источник звучания голоса. Далее голос проходит через фильтр, отвечающий за буквы, произношение, артикуляцию речи, разделение гласных и согласных.

У людей, лишенных возможности говорить, источник сохранен в рабочем состоянии: это говорит о том, что проблема связана только с фильтром, который вполне можно смоделировать. Тем самым, Рупал Патель доказывает, что источник, от которого зависит индивидуальность голоса, никуда не девается, а значит, смоделированный голос можно подстроить под него.

Как это работает?

Если сказать коротко, то берется голос говорящего человека и совмещается с источником неговорящего. Только подборка происходит индивидуально: для каждого клиента отбирается голос, наиболее подходящий для него. Он просто «покупает» его для себя.

Откуда клиенты берут голоса?

Люди, которые имеют желание стать суррогатными донорами голосов, записывают несколько тысяч слов и фраз, что занимает у них от трех до четырех часов. В итоге создается возможность сочетать все звуки, существующие в языке, набирается речевая информация. После проделанной работы, запись размельчается профессионалами на мелкие куски (слоги, сочетания звуков) и вносится в базу данных. Эти данные называются «банком голоса». После этого голос готов к продаже.

Как используется «искусственный голос»?

Приобретенный голос можно установить на любое речевое приложение. Человек печатает слова, а приложение воспроизводит звук, интенсивность которого легко регулируется. На данный момент цель Рупал является собрать как можно больше доноров, чтобы у клиентов был богатый выбор. Свой голос донор записывает, не выходя из дому. Для этого нужно просто прочитать написанные на экране слова и предложения.