Configuration for a Ten VAD model. More...

#include <c-api.h>

Detailed Description

Definition at line 1895 of file c-api.h.

Member Data Documentation

float SherpaOnnxTenVadModelConfig::max_speech_duration

Maximum speech duration in seconds.

When a segment exceeds this value, the detector temporarily uses a higher threshold to encourage a split.

Definition at line 1912 of file c-api.h.

float SherpaOnnxTenVadModelConfig::min_silence_duration

Minimum silence duration in seconds used to close a speech segment.

Definition at line 1901 of file c-api.h.

float SherpaOnnxTenVadModelConfig::min_speech_duration

Minimum speech duration in seconds to keep a detected segment.

Definition at line 1903 of file c-api.h.

const char* SherpaOnnxTenVadModelConfig::model

Path to ten-vad.onnx.

Definition at line 1897 of file c-api.h.

float SherpaOnnxTenVadModelConfig::threshold

Speech probability threshold. Frames above this value are speech.

Definition at line 1899 of file c-api.h.

int32_t SherpaOnnxTenVadModelConfig::window_size

Input window size in samples. A common value is 256.

Definition at line 1905 of file c-api.h.

The documentation for this struct was generated from the following file: