Функция № 499

Отправить аудиофайл на распознавание речи (до 5 минут)

Доступно на тарифе:

Стартовый
Бизнес 2025
Профи 2025

Научитесь правильно использовать функцию:

Описание

Функция позволяет отправить аудиофайл на распознавание речи через сервис Yandex SpeechKit. Возвращает текстовую транскрипцию аудиозаписи с возможностью дополнительного анализа результатов с помощью ИИ.

Параметры функции

Параметры, которые можно передать в функцию yandex_transcribe_audio_fast:
audioURL - URL аудиофайла. Указывает полный адрес аудиофайла, который будет распознаваться. (обязательный параметр)
languageCode - код языка. Указывает язык, на котором произнесен текст, по умолчанию 'ru-RU'. (обязательный параметр)
audio_model - модель распознавания. Указывает модель, используемую для распознавания, по умолчанию 'general'. (обязательный параметр)
profanityFilter - фильтр ненормативной лексики. Указывает, нужно ли фильтровать ненормативную лексику, по умолчанию False. (обязательный параметр)
literature_text - режим нормализации. Указывает, нужно ли включить режим нормализации, по умолчанию False. (обязательный параметр)
audioEncoding - формат аудиофайла. Указывает формат аудиофайла, по умолчанию 'MP3'. (обязательный параметр)
sampleRateHertz - частота дискретизации. Указывает частоту дискретизации аудио, обязательный параметр, если формат 'LINEAR16_PCM'.
audioChannelCount - количество аудиоканалов. Указывает количество аудиоканалов, по умолчанию 1. (обязательный параметр)
ai_analyse - пост-анализ ИИ. Указывает, нужно ли делать дополнительный анализ результатов распознавания с помощью ИИ, по умолчанию 1. (обязательный параметр)

Примеры использования

"Пожалуйста, распознай текст из аудиофайла по ссылке https://example.com/audio.mp3 на русском языке."
"Преобразуй аудиозапись в текст с фильтром ненормативной лексики и нормализацией текста."
"Распознай аудиофайл в формате MP3 с одним каналом и сделай дополнительный анализ результатов."

Кейсы