Перейти к основному содержимому

Распознавание через API

CogniCo предоставляет API для распознавания речи, диаризации спикеров и анализа эмоций. Доступны три режима работы:

Базовый URL: https://cognico.ru

OpenAPI спецификация

Полная спецификация API доступна в формате OpenAPI 3.0: cc-recognition.yaml

Вы можете использовать её для автоматической генерации клиента на любом языке с помощью OpenAPI Generator или аналогичных инструментов.

Получение API-ключа

  1. Откройте cognico.ru/app и войдите в аккаунт
  2. Перейдите в Профиль → API-ключи
  3. Нажмите Создать ключ, укажите название и (опционально) срок действия
  4. Скопируйте ключ — он отображается только один раз

Авторизация

Все методы требуют передачи API-ключа в заголовке:

Authorization: Bearer YOUR_API_KEY

Формат ответа

Синхронный и асинхронный методы возвращают одинаковую структуру RecognitionResultData:

RecognitionResultData

ПолеТипОписание
textstringПолный распознанный текст
transcriptionTranscriptionDataДетальная транскрипция с сегментами

TranscriptionData

ПолеТипОписание
segmentsSpeechSegment[]Массив распознанных сегментов
speakersSpeakerData[]Информация о спикерах

SpeechSegment

ПолеТипОписание
startfloatВремя начала (сек)
endfloat?Время конца (сек)
textstringРаспознанный текст сегмента
speech_probfloat?Вероятность наличия речи (0–1)
vad_probfloat?Вероятность VAD (0–1)
volume_70float?Громкость, 70-й перцентиль
wordsSpeechWord[]?Детализация по словам
channelstring?Идентификатор канала
speakerstring?Идентификатор спикера
emotionobject?Эмоции: {positive, angry, sad, neutral} (значения 0–1)

SpeechWord

ПолеТипОписание
wordstringСлово
startfloatВремя начала (сек)
endfloatВремя конца (сек)
speech_probfloatВероятность речи
volume_avgfloatСредняя громкость

SpeakerData

ПолеТипОписание
idstringИдентификатор спикера
namestring?Имя спикера
refstring?Ссылка на профиль спикера

EmotionType

Возможные значения: positive, angry, sad, neutral.