Функция № 324

Распознавание MP3 v2

Доступно на тарифе:

Базовый 2025
Бизнес 2025
Профи 2025

Описание

Функция позволяет отправить аудиофайл в формате MP3 на распознавание и получить текстовую транскрипцию.

Параметры

Параметры, которые можно передать в функцию yandex_transcribe_audio_v2:

audioURL - URL аудиофайла. Указывает полный адрес аудиофайла, который будет распознаваться.
languageCode - код языка. Указывает язык, на котором произнесен текст, по умолчанию 'ru-RU'.
audio_model - модель распознавания. Указывает модель, используемую для распознавания, по умолчанию 'general'.
profanityFilter - фильтр ненормативной лексики. Указывает, нужно ли фильтровать ненормативную лексику, по умолчанию False.
literature_text - режим нормализации. Указывает, нужно ли включить режим нормализации, по умолчанию False.
audioEncoding - формат аудиофайла. Указывает формат аудиофайла, по умолчанию 'MP3'.
sampleRateHertz - частота дискретизации. Указывает частоту дискретизации аудио, обязательный параметр, если формат 'LINEAR16_PCM'.
audioChannelCount - количество аудиоканалов. Указывает количество аудиоканалов, по умолчанию 1.

Примеры использования

"Пожалуйста, распознай текст из аудиофайла по ссылке https://example.com/audio.mp3."
"Распознай аудио на русском языке с фильтром ненормативной лексики."

Кейсы

© ProTalk 2023-2025 ИП Горелов Максим Николаевич ИНН 500104951533 ОГРН 309500106900065 

Новая, 8, 9 Реутов, Московская область 143964 Россия