Инициатива Mozilla помогает игрокам в сфере голосовых технологий через многоязычный набор данных

Это может звучать как глоток, но это действительно много значит. Mozilla говорит о «крупнейшем на сегодняшний день общедоступном транскрибированном наборе голосовых данных». Перевод: более 14 000 человек. На 18 языках. Почти 1400 часов (точнее 1368) записанного голоса. Добро пожаловать на инициативу под названием Common Voice.

Об этом говорится в объявлении Mozilla в блоге в четверг от Джорджа Ротера.

«Сегодня мы рады поделиться нашим первым многоязычным набором данных с 18 представленными языками, включая английский, французский, немецкий и китайский (традиционный), а также, например, валлийский и кабильский. В целом новый набор данных включает в себя около 1400 часов. голосовых клипов от более чем 42 000 человек «.

Участники проекта имеют профессиональные специальности, которые варьируются от докторантов по распознаванию речи до ученых, обучающихся машинному обучению, до профессора компьютерной лингвистики. Таким образом, эти усилия представляют глобальное сообщество участников, вносящих свой вклад в голос, наряду с тем, что Mozilla считает «страстными добровольцами».

Читайте:

Блюдо ставит Google Assistant в свои голосовые пул... Задайте свой пульт, и ваш телевизор покажет ответ. Если ваш телевизор подключен к приемнику Dish Hopper, Google Assistant теперь может использовать его, чтобы показывать ваши фотографии, прогноз погоды и многое другое с помощью голосовой команды. Начиная со среды, Dish выпускает обновление программного обеспечения, которое добавит Google Assistant...

Цель Common Voice. научить машины тому, как говорят реальные люди. Короче говоря, он превратился в огромную коллекцию голосовых клипов на десятках языков. Что будет дальше: полный набор данных будет доступен для скачивания на сайте Common Voice.

Похоже, что участники команды Mozilla также разработали неизбежные болевые точки. В блоге упоминаются эти моменты. «Люди, которые вносят свой вклад, не только видят прогресс по каждому языку в записи и проверке, но также имеют улучшенные запросы, которые варьируются от клипа к клипу; новые функции для просмотра, перезаписи и пропуска клипов являются неотъемлемой частью опыта; возможность быстро переходить от разговора к слушанию, а также к функции отказа от выступления на сессии ».

Звучит как веселье или академическая песочница, но на самом деле среди тех, кто внес свой вклад в создание корпуса, есть более прочные устремления.

В 2019 году Мариелла Мун в Engadget обратил внимание на диапазон языков, которые теперь включают нидерландский, хаха-чин, эсперанто, фарси, баскский, испанский, французский, немецкий, китайский (традиционный), валлийский и кабильский.

TechRadarОливия Тамбини, сказала: «Предоставляя огромную библиотеку человеческих голосов на разных языках бесплатно, Mozilla может открыть двери для компаний, у которых нет ресурсов Apple, Amazon и Google, для разработки своих собственные голосовые помощники. «

Читайте:

Блюдо ставит Google Assistant в свои голосовые пул... Задайте свой пульт, и ваш телевизор покажет ответ. Если ваш телевизор подключен к приемнику Dish Hopper, Google Assistant теперь может использовать его, чтобы показывать ваши фотографии, прогноз погоды и многое другое с помощью голосовой команды. Начиная со среды, Dish выпускает обновление программного обеспечения, которое добавит Google Assistant...

Еще одно преимущество связано с самой Mozilla. Мариелла Мун в Engadget «Организация сама планирует использовать клипы, которые она собирает, чтобы улучшить свои механизмы преобразования речи в текст, преобразования текста в речь и DeepSpeech».

Ротер ясно и просто сказал: «Наша цель. самим выпускать продукты с поддержкой голосовой связи, а также поддерживать исследователей и более мелких игроков».

Обратите внимание, что права на хвастовство принадлежат ему как крупнейшему, а не единственному набору данных в своем роде. Mozilla хотела, чтобы посетители сайта знали, что он является крупнейшим, а не единственным, а также сказала, что со временем посетители сайта могут «рассматривать эту страницу как справочный центр для других наборов голосовых данных с открытым исходным кодом».

Если вы посетите сайт Common Voice, вы получите сообщение об их острых амбициях. «Мы строим», сказал Мозилла. И что они строят? «Многоязычный набор данных с открытым исходным кодом для голоса, который каждый может использовать для обучения голосовых приложений».

Участники могут предоставить метаданные, такие как возраст, пол и акцент. Голосовые клипы, в свою очередь, помечены информацией, полезной в обучающих речевых движках.

Читайте:

Блюдо ставит Google Assistant в свои голосовые пул... Задайте свой пульт, и ваш телевизор покажет ответ. Если ваш телевизор подключен к приемнику Dish Hopper, Google Assistant теперь может использовать его, чтобы показывать ваши фотографии, прогноз погоды и многое другое с помощью голосовой команды. Начиная со среды, Dish выпускает обновление программного обеспечения, которое добавит Google Assistant...
, , , , ,