Configuration for a Silero VAD model. More...

#include <c-api.h>

Detailed Description

Definition at line 1874 of file c-api.h.

Member Data Documentation

float SherpaOnnxSileroVadModelConfig::max_speech_duration

Maximum speech duration in seconds.

When a segment exceeds this value, the detector temporarily uses a higher threshold to encourage a split.

Definition at line 1891 of file c-api.h.

float SherpaOnnxSileroVadModelConfig::min_silence_duration

Minimum silence duration in seconds used to close a speech segment.

Definition at line 1880 of file c-api.h.

float SherpaOnnxSileroVadModelConfig::min_speech_duration

Minimum speech duration in seconds to keep a detected segment.

Definition at line 1882 of file c-api.h.

const char* SherpaOnnxSileroVadModelConfig::model

Path to silero_vad.onnx.

Definition at line 1876 of file c-api.h.

float SherpaOnnxSileroVadModelConfig::threshold

Speech probability threshold. Frames above this value are speech.

Definition at line 1878 of file c-api.h.

int32_t SherpaOnnxSileroVadModelConfig::window_size

Input window size in samples. A common value is 512.

Definition at line 1884 of file c-api.h.

The documentation for this struct was generated from the following file: