90

Распознавание MP3

Функция получает ссылку на MP3 файл и с помощью методов асинхронного распознавания Яндекса возвращает текстовый файл с результатом.

Параметры, которые можно передать в функцию yandex_transcribe_audio:

audioURL - URL аудиофайла, который нужно распознать.
languageCode - код языка, по умолчанию ru-RU. Пример: languageCode: "en-US".
audio_model - модель распознавания, по умолчанию general. Доступные варианты: ["general"].
profanityFilter - фильтр ненормативной лексики, по умолчанию False.
literature_text - включает режим нормализации, по умолчанию False.
audioEncoding - формат аудиофайла, по умолчанию MP3. Доступные варианты: ["LINEAR16_PCM", "OGG_OPUS", "MP3"].
sampleRateHertz - частота дискретизации аудио. Этот параметр обязателен, если значение audioEncoding равно LINEAR16_PCM. Пример: sampleRateHertz: 16000.
audioChannelCount - количество аудиоканалов, по умолчанию равно 1.

Примеры использования:

Если ты получишь ссылку на файл .mp3, то сразу вызови функцию распознавания с параметрами:
{
'languageCode' : '',
'model' : 'general',
'profanityFilter' : False,
'literature_text' : False,
'audioEncoding' : 'MP3',
'audioChannelCount' : 1,
'rawResults' : False,
}
bucket_name = 'protalkstt'

© ProTalk 2023-2025 ИП Горелов Максим Николаевич ИНН 500104951533 ОГРН 309500106900065 

Новая, 8, 9 Реутов, Московская область 143964 Россия