c-api/html/c-api_8h_source.html

// sherpa-onnx/c-api/c-api.h

//

// Copyright (c)  2023  Xiaomi Corporation

#ifndef SHERPA_ONNX_C_API_C_API_H_

#define SHERPA_ONNX_C_API_C_API_H_


#include <stdint.h>


#ifdef __cplusplus

extern "C" {

#endif


// See https://github.com/pytorch/pytorch/blob/main/c10/macros/Export.h

// We will set SHERPA_ONNX_BUILD_SHARED_LIBS and SHERPA_ONNX_BUILD_MAIN_LIB in

// CMakeLists.txt


#if defined(__GNUC__)

#pragma GCC diagnostic push

#pragma GCC diagnostic ignored "-Wattributes"

#endif


#if defined(_WIN32)

#if defined(SHERPA_ONNX_BUILD_SHARED_LIBS)

#define SHERPA_ONNX_EXPORT __declspec(dllexport)

#define SHERPA_ONNX_IMPORT __declspec(dllimport)

#else

#define SHERPA_ONNX_EXPORT

#define SHERPA_ONNX_IMPORT

#endif

#else  // WIN32

#define SHERPA_ONNX_EXPORT __attribute__((visibility("default")))


#define SHERPA_ONNX_IMPORT SHERPA_ONNX_EXPORT

#endif  // WIN32


#if defined(SHERPA_ONNX_BUILD_MAIN_LIB)

#define SHERPA_ONNX_API SHERPA_ONNX_EXPORT

#else

#define SHERPA_ONNX_API SHERPA_ONNX_IMPORT

#endif


#ifndef SHERPA_ONNX_DEPRECATED

#if defined(_MSC_VER)

#define SHERPA_ONNX_DEPRECATED(msg) __declspec(deprecated(msg))

#elif defined(__GNUC__) || defined(__clang__)

#define SHERPA_ONNX_DEPRECATED(msg) __attribute__((deprecated(msg)))

#else

#define SHERPA_ONNX_DEPRECATED(msg)

#endif

#endif


SHERPA_ONNX_API const char *SherpaOnnxGetVersionStr();


SHERPA_ONNX_API const char *SherpaOnnxGetGitSha1();


SHERPA_ONNX_API const char *SherpaOnnxGetGitDate();


SHERPA_ONNX_API int32_t SherpaOnnxFileExists(const char *filename);


typedef struct SherpaOnnxOnlineTransducerModelConfig {

  const char *encoder;

  const char *decoder;

  const char *joiner;

} SherpaOnnxOnlineTransducerModelConfig;


typedef struct SherpaOnnxOnlineParaformerModelConfig {

  const char *encoder;

  const char *decoder;

} SherpaOnnxOnlineParaformerModelConfig;


typedef struct SherpaOnnxOnlineZipformer2CtcModelConfig {

  const char *model;

} SherpaOnnxOnlineZipformer2CtcModelConfig;


typedef struct SherpaOnnxOnlineNemoCtcModelConfig {

  const char *model;

} SherpaOnnxOnlineNemoCtcModelConfig;


typedef struct SherpaOnnxOnlineToneCtcModelConfig {

  const char *model;

} SherpaOnnxOnlineToneCtcModelConfig;


typedef struct SherpaOnnxOnlineModelConfig {

  SherpaOnnxOnlineTransducerModelConfig transducer;

  SherpaOnnxOnlineParaformerModelConfig paraformer;

  SherpaOnnxOnlineZipformer2CtcModelConfig zipformer2_ctc;

  const char *tokens;

  int32_t num_threads;

  const char *provider;

  int32_t debug;

  const char *model_type;

  const char *modeling_unit;

  const char *bpe_vocab;

  const char *tokens_buf;

  int32_t tokens_buf_size;

  SherpaOnnxOnlineNemoCtcModelConfig nemo_ctc;

  SherpaOnnxOnlineToneCtcModelConfig t_one_ctc;

} SherpaOnnxOnlineModelConfig;


typedef struct SherpaOnnxFeatureConfig {

  int32_t sample_rate;


  int32_t feature_dim;

} SherpaOnnxFeatureConfig;


typedef struct SherpaOnnxOnlineCtcFstDecoderConfig {

  const char *graph;

  int32_t max_active;

} SherpaOnnxOnlineCtcFstDecoderConfig;


typedef struct SherpaOnnxHomophoneReplacerConfig {

  const char *dict_dir;

  const char *lexicon;

  const char *rule_fsts;

} SherpaOnnxHomophoneReplacerConfig;


typedef struct SherpaOnnxOnlineRecognizerConfig {

  SherpaOnnxFeatureConfig feat_config;

  SherpaOnnxOnlineModelConfig model_config;


  const char *decoding_method;


  int32_t max_active_paths;


  int32_t enable_endpoint;


  float rule1_min_trailing_silence;


  float rule2_min_trailing_silence;


  float rule3_min_utterance_length;


  const char *hotwords_file;


  float hotwords_score;


  SherpaOnnxOnlineCtcFstDecoderConfig ctc_fst_decoder_config;

  const char *rule_fsts;

  const char *rule_fars;

  float blank_penalty;


  const char *hotwords_buf;

  int32_t hotwords_buf_size;

  SherpaOnnxHomophoneReplacerConfig hr;

} SherpaOnnxOnlineRecognizerConfig;


typedef struct SherpaOnnxOnlineRecognizerResult {

  const char *text;


  const char *tokens;


  const char *const *tokens_arr;


  float *timestamps;


  int32_t count;


  const char *json;

} SherpaOnnxOnlineRecognizerResult;


typedef struct SherpaOnnxOnlineRecognizer SherpaOnnxOnlineRecognizer;

typedef struct SherpaOnnxOnlineStream SherpaOnnxOnlineStream;


SHERPA_ONNX_API const SherpaOnnxOnlineRecognizer *

SherpaOnnxCreateOnlineRecognizer(

    const SherpaOnnxOnlineRecognizerConfig *config);


SHERPA_ONNX_API void SherpaOnnxDestroyOnlineRecognizer(

    const SherpaOnnxOnlineRecognizer *recognizer);


SHERPA_ONNX_API const SherpaOnnxOnlineStream *SherpaOnnxCreateOnlineStream(

    const SherpaOnnxOnlineRecognizer *recognizer);


SHERPA_ONNX_API const SherpaOnnxOnlineStream *

SherpaOnnxCreateOnlineStreamWithHotwords(

    const SherpaOnnxOnlineRecognizer *recognizer, const char *hotwords);


SHERPA_ONNX_API void SherpaOnnxDestroyOnlineStream(

    const SherpaOnnxOnlineStream *stream);


SHERPA_ONNX_API void SherpaOnnxOnlineStreamAcceptWaveform(

    const SherpaOnnxOnlineStream *stream, int32_t sample_rate,

    const float *samples, int32_t n);


SHERPA_ONNX_API int32_t

SherpaOnnxIsOnlineStreamReady(const SherpaOnnxOnlineRecognizer *recognizer,

                              const SherpaOnnxOnlineStream *stream);


SHERPA_ONNX_API void SherpaOnnxDecodeOnlineStream(

    const SherpaOnnxOnlineRecognizer *recognizer,

    const SherpaOnnxOnlineStream *stream);


SHERPA_ONNX_API void SherpaOnnxDecodeMultipleOnlineStreams(

    const SherpaOnnxOnlineRecognizer *recognizer,

    const SherpaOnnxOnlineStream **streams, int32_t n);


SHERPA_ONNX_API const SherpaOnnxOnlineRecognizerResult *

SherpaOnnxGetOnlineStreamResult(const SherpaOnnxOnlineRecognizer *recognizer,

                                const SherpaOnnxOnlineStream *stream);


SHERPA_ONNX_API void SherpaOnnxDestroyOnlineRecognizerResult(

    const SherpaOnnxOnlineRecognizerResult *r);


SHERPA_ONNX_API const char *SherpaOnnxGetOnlineStreamResultAsJson(

    const SherpaOnnxOnlineRecognizer *recognizer,

    const SherpaOnnxOnlineStream *stream);


SHERPA_ONNX_API void SherpaOnnxDestroyOnlineStreamResultJson(const char *s);


SHERPA_ONNX_API void SherpaOnnxOnlineStreamReset(

    const SherpaOnnxOnlineRecognizer *recognizer,

    const SherpaOnnxOnlineStream *stream);


SHERPA_ONNX_API void SherpaOnnxOnlineStreamInputFinished(

    const SherpaOnnxOnlineStream *stream);


SHERPA_ONNX_API void SherpaOnnxOnlineStreamSetOption(

    const SherpaOnnxOnlineStream *stream, const char *key, const char *value);


SHERPA_ONNX_API const char *SherpaOnnxOnlineStreamGetOption(

    const SherpaOnnxOnlineStream *stream, const char *key);


SHERPA_ONNX_API int32_t SherpaOnnxOnlineStreamHasOption(

    const SherpaOnnxOnlineStream *stream, const char *key);


SHERPA_ONNX_API int32_t

SherpaOnnxOnlineStreamIsEndpoint(const SherpaOnnxOnlineRecognizer *recognizer,

                                 const SherpaOnnxOnlineStream *stream);


typedef struct SherpaOnnxDisplay SherpaOnnxDisplay;


SHERPA_ONNX_API const SherpaOnnxDisplay *SherpaOnnxCreateDisplay(

    int32_t max_word_per_line);


SHERPA_ONNX_API void SherpaOnnxDestroyDisplay(const SherpaOnnxDisplay *display);


SHERPA_ONNX_API void SherpaOnnxPrint(const SherpaOnnxDisplay *display,

                                     int32_t idx, const char *s);

// ============================================================

// For offline ASR (i.e., non-streaming ASR)

// ============================================================


typedef struct SherpaOnnxOfflineTransducerModelConfig {

  const char *encoder;

  const char *decoder;

  const char *joiner;

} SherpaOnnxOfflineTransducerModelConfig;


typedef struct SherpaOnnxOfflineParaformerModelConfig {

  const char *model;

} SherpaOnnxOfflineParaformerModelConfig;


typedef struct SherpaOnnxOfflineNemoEncDecCtcModelConfig {

  const char *model;

} SherpaOnnxOfflineNemoEncDecCtcModelConfig;


typedef struct SherpaOnnxOfflineWhisperModelConfig {

  const char *encoder;

  const char *decoder;

  const char *language;

  const char *task;

  int32_t tail_paddings;


  int32_t enable_token_timestamps;


  int32_t enable_segment_timestamps;

} SherpaOnnxOfflineWhisperModelConfig;


typedef struct SherpaOnnxOfflineCanaryModelConfig {

  const char *encoder;

  const char *decoder;

  const char *src_lang;

  const char *tgt_lang;

  int32_t use_pnc;

} SherpaOnnxOfflineCanaryModelConfig;


typedef struct SherpaOnnxOfflineCohereTranscribeModelConfig {

  const char *encoder;

  const char *decoder;

  const char *language;

  int32_t use_punct;

  int32_t use_itn;

} SherpaOnnxOfflineCohereTranscribeModelConfig;


typedef struct SherpaOnnxOfflineFireRedAsrModelConfig {

  const char *encoder;

  const char *decoder;

} SherpaOnnxOfflineFireRedAsrModelConfig;


typedef struct SherpaOnnxOfflineFireRedAsrCtcModelConfig {

  const char *model;

} SherpaOnnxOfflineFireRedAsrCtcModelConfig;


typedef struct SherpaOnnxOfflineMoonshineModelConfig {

  const char *preprocessor;

  const char *encoder;

  const char *uncached_decoder;

  const char *cached_decoder;

  const char *merged_decoder;

} SherpaOnnxOfflineMoonshineModelConfig;


typedef struct SherpaOnnxOfflineTdnnModelConfig {

  const char *model;

} SherpaOnnxOfflineTdnnModelConfig;


typedef struct SherpaOnnxOfflineLMConfig {

  const char *model;

  float scale;

} SherpaOnnxOfflineLMConfig;


typedef struct SherpaOnnxOfflineSenseVoiceModelConfig {

  const char *model;

  const char *language;

  int32_t use_itn;

} SherpaOnnxOfflineSenseVoiceModelConfig;


typedef struct SherpaOnnxOfflineDolphinModelConfig {

  const char *model;

} SherpaOnnxOfflineDolphinModelConfig;


typedef struct SherpaOnnxOfflineZipformerCtcModelConfig {

  const char *model;

} SherpaOnnxOfflineZipformerCtcModelConfig;


typedef struct SherpaOnnxOfflineWenetCtcModelConfig {

  const char *model;

} SherpaOnnxOfflineWenetCtcModelConfig;


typedef struct SherpaOnnxOfflineOmnilingualAsrCtcModelConfig {

  const char *model;

} SherpaOnnxOfflineOmnilingualAsrCtcModelConfig;


typedef struct SherpaOnnxOfflineFunASRNanoModelConfig {

  const char *encoder_adaptor;

  const char *llm;

  const char *embedding;

  const char *tokenizer;

  const char *system_prompt;

  const char *user_prompt;

  int32_t max_new_tokens;

  float temperature;

  float top_p;

  int32_t seed;

  const char *language;

  int32_t itn;

  const char *hotwords;

} SherpaOnnxOfflineFunASRNanoModelConfig;


typedef struct SherpaOnnxOfflineQwen3ASRModelConfig {

  const char *conv_frontend;

  const char *encoder;

  const char *decoder;

  const char *tokenizer;

  int32_t max_total_len;

  int32_t max_new_tokens;

  float temperature;

  float top_p;

  int32_t seed;

  const char *hotwords;

} SherpaOnnxOfflineQwen3ASRModelConfig;


typedef struct SherpaOnnxOfflineMedAsrCtcModelConfig {

  const char *model;

} SherpaOnnxOfflineMedAsrCtcModelConfig;


typedef struct SherpaOnnxOfflineModelConfig {

  SherpaOnnxOfflineTransducerModelConfig transducer;

  SherpaOnnxOfflineParaformerModelConfig paraformer;

  SherpaOnnxOfflineNemoEncDecCtcModelConfig nemo_ctc;

  SherpaOnnxOfflineWhisperModelConfig whisper;

  SherpaOnnxOfflineTdnnModelConfig tdnn;


  const char *tokens;

  int32_t num_threads;

  int32_t debug;

  const char *provider;

  const char *model_type;

  const char *modeling_unit;

  const char *bpe_vocab;

  const char *telespeech_ctc;

  SherpaOnnxOfflineSenseVoiceModelConfig sense_voice;

  SherpaOnnxOfflineMoonshineModelConfig moonshine;

  SherpaOnnxOfflineFireRedAsrModelConfig fire_red_asr;

  SherpaOnnxOfflineDolphinModelConfig dolphin;

  SherpaOnnxOfflineZipformerCtcModelConfig zipformer_ctc;

  SherpaOnnxOfflineCanaryModelConfig canary;

  SherpaOnnxOfflineWenetCtcModelConfig wenet_ctc;

  SherpaOnnxOfflineOmnilingualAsrCtcModelConfig omnilingual;

  SherpaOnnxOfflineMedAsrCtcModelConfig medasr;

  SherpaOnnxOfflineFunASRNanoModelConfig funasr_nano;

  SherpaOnnxOfflineFireRedAsrCtcModelConfig fire_red_asr_ctc;

  SherpaOnnxOfflineQwen3ASRModelConfig qwen3_asr;

  SherpaOnnxOfflineCohereTranscribeModelConfig cohere_transcribe;

} SherpaOnnxOfflineModelConfig;


typedef struct SherpaOnnxOfflineRecognizerConfig {

  SherpaOnnxFeatureConfig feat_config;

  SherpaOnnxOfflineModelConfig model_config;

  SherpaOnnxOfflineLMConfig lm_config;


  const char *decoding_method;

  int32_t max_active_paths;


  const char *hotwords_file;


  float hotwords_score;

  const char *rule_fsts;

  const char *rule_fars;

  float blank_penalty;


  SherpaOnnxHomophoneReplacerConfig hr;

} SherpaOnnxOfflineRecognizerConfig;


typedef struct SherpaOnnxOfflineRecognizer SherpaOnnxOfflineRecognizer;


typedef struct SherpaOnnxOfflineStream SherpaOnnxOfflineStream;


SHERPA_ONNX_API const SherpaOnnxOfflineRecognizer *

SherpaOnnxCreateOfflineRecognizer(

    const SherpaOnnxOfflineRecognizerConfig *config);


SHERPA_ONNX_API void SherpaOnnxOfflineRecognizerSetConfig(

    const SherpaOnnxOfflineRecognizer *recognizer,

    const SherpaOnnxOfflineRecognizerConfig *config);


SHERPA_ONNX_API void SherpaOnnxDestroyOfflineRecognizer(

    const SherpaOnnxOfflineRecognizer *recognizer);


SHERPA_ONNX_API const SherpaOnnxOfflineStream *SherpaOnnxCreateOfflineStream(

    const SherpaOnnxOfflineRecognizer *recognizer);


SHERPA_ONNX_API const SherpaOnnxOfflineStream *

SherpaOnnxCreateOfflineStreamWithHotwords(

    const SherpaOnnxOfflineRecognizer *recognizer, const char *hotwords);


SHERPA_ONNX_API void SherpaOnnxDestroyOfflineStream(

    const SherpaOnnxOfflineStream *stream);


SHERPA_ONNX_API void SherpaOnnxAcceptWaveformOffline(

    const SherpaOnnxOfflineStream *stream, int32_t sample_rate,

    const float *samples, int32_t n);


SHERPA_ONNX_API void SherpaOnnxOfflineStreamSetOption(

    const SherpaOnnxOfflineStream *stream, const char *key, const char *value);


SHERPA_ONNX_API const char *SherpaOnnxOfflineStreamGetOption(

    const SherpaOnnxOfflineStream *stream, const char *key);


SHERPA_ONNX_API int32_t SherpaOnnxOfflineStreamHasOption(

    const SherpaOnnxOfflineStream *stream, const char *key);


SHERPA_ONNX_API void SherpaOnnxDecodeOfflineStream(

    const SherpaOnnxOfflineRecognizer *recognizer,

    const SherpaOnnxOfflineStream *stream);


SHERPA_ONNX_API void SherpaOnnxDecodeMultipleOfflineStreams(

    const SherpaOnnxOfflineRecognizer *recognizer,

    const SherpaOnnxOfflineStream **streams, int32_t n);


typedef struct SherpaOnnxOfflineRecognizerResult {

  const char *text;


  float *timestamps;


  int32_t count;


  const char *tokens;


  const char *const *tokens_arr;


  const char *json;


  const char *lang;


  const char *emotion;


  const char *event;


  float *durations;


  float *ys_log_probs;


  const float *segment_timestamps;


  const float *segment_durations;


  const char *segment_texts;


  const char *const *segment_texts_arr;


  int32_t segment_count;

} SherpaOnnxOfflineRecognizerResult;


SHERPA_ONNX_API const SherpaOnnxOfflineRecognizerResult *

SherpaOnnxGetOfflineStreamResult(const SherpaOnnxOfflineStream *stream);


SHERPA_ONNX_API void SherpaOnnxDestroyOfflineRecognizerResult(

    const SherpaOnnxOfflineRecognizerResult *r);


SHERPA_ONNX_API const char *SherpaOnnxGetOfflineStreamResultAsJson(

    const SherpaOnnxOfflineStream *stream);


SHERPA_ONNX_API void SherpaOnnxDestroyOfflineStreamResultJson(const char *s);


// ============================================================

// For keyword spotting

// ============================================================


typedef struct SherpaOnnxKeywordResult {

  const char *keyword;


  const char *tokens;


  const char *const *tokens_arr;


  int32_t count;


  float *timestamps;


  float start_time;


  const char *json;

} SherpaOnnxKeywordResult;


typedef struct SherpaOnnxKeywordSpotterConfig {

  SherpaOnnxFeatureConfig feat_config;

  SherpaOnnxOnlineModelConfig model_config;

  int32_t max_active_paths;

  int32_t num_trailing_blanks;

  float keywords_score;

  float keywords_threshold;

  const char *keywords_file;

  const char *keywords_buf;

  int32_t keywords_buf_size;

} SherpaOnnxKeywordSpotterConfig;


typedef struct SherpaOnnxKeywordSpotter SherpaOnnxKeywordSpotter;


SHERPA_ONNX_API const SherpaOnnxKeywordSpotter *SherpaOnnxCreateKeywordSpotter(

    const SherpaOnnxKeywordSpotterConfig *config);


SHERPA_ONNX_API void SherpaOnnxDestroyKeywordSpotter(

    const SherpaOnnxKeywordSpotter *spotter);


SHERPA_ONNX_API const SherpaOnnxOnlineStream *SherpaOnnxCreateKeywordStream(

    const SherpaOnnxKeywordSpotter *spotter);


SHERPA_ONNX_API const SherpaOnnxOnlineStream *

SherpaOnnxCreateKeywordStreamWithKeywords(

    const SherpaOnnxKeywordSpotter *spotter, const char *keywords);


SHERPA_ONNX_API int32_t

SherpaOnnxIsKeywordStreamReady(const SherpaOnnxKeywordSpotter *spotter,

                               const SherpaOnnxOnlineStream *stream);


SHERPA_ONNX_API void SherpaOnnxDecodeKeywordStream(

    const SherpaOnnxKeywordSpotter *spotter,

    const SherpaOnnxOnlineStream *stream);


SHERPA_ONNX_API void SherpaOnnxResetKeywordStream(

    const SherpaOnnxKeywordSpotter *spotter,

    const SherpaOnnxOnlineStream *stream);


SHERPA_ONNX_API void SherpaOnnxDecodeMultipleKeywordStreams(

    const SherpaOnnxKeywordSpotter *spotter,

    const SherpaOnnxOnlineStream **streams, int32_t n);


SHERPA_ONNX_API const SherpaOnnxKeywordResult *SherpaOnnxGetKeywordResult(

    const SherpaOnnxKeywordSpotter *spotter,

    const SherpaOnnxOnlineStream *stream);


SHERPA_ONNX_API void SherpaOnnxDestroyKeywordResult(

    const SherpaOnnxKeywordResult *r);


SHERPA_ONNX_API const char *SherpaOnnxGetKeywordResultAsJson(

    const SherpaOnnxKeywordSpotter *spotter,

    const SherpaOnnxOnlineStream *stream);


SHERPA_ONNX_API void SherpaOnnxFreeKeywordResultJson(const char *s);


// ============================================================

// For VAD

// ============================================================


typedef struct SherpaOnnxSileroVadModelConfig {

  const char *model;

  float threshold;

  float min_silence_duration;

  float min_speech_duration;

  int32_t window_size;

  float max_speech_duration;

} SherpaOnnxSileroVadModelConfig;


typedef struct SherpaOnnxTenVadModelConfig {

  const char *model;

  float threshold;

  float min_silence_duration;

  float min_speech_duration;

  int32_t window_size;

  float max_speech_duration;

} SherpaOnnxTenVadModelConfig;


typedef struct SherpaOnnxVadModelConfig {

  SherpaOnnxSileroVadModelConfig silero_vad;

  int32_t sample_rate;

  int32_t num_threads;

  const char *provider;

  int32_t debug;

  SherpaOnnxTenVadModelConfig ten_vad;

} SherpaOnnxVadModelConfig;


typedef struct SherpaOnnxCircularBuffer SherpaOnnxCircularBuffer;


SHERPA_ONNX_API const SherpaOnnxCircularBuffer *SherpaOnnxCreateCircularBuffer(

    int32_t capacity);


SHERPA_ONNX_API void SherpaOnnxDestroyCircularBuffer(

    const SherpaOnnxCircularBuffer *buffer);


SHERPA_ONNX_API void SherpaOnnxCircularBufferPush(

    const SherpaOnnxCircularBuffer *buffer, const float *p, int32_t n);


SHERPA_ONNX_API const float *SherpaOnnxCircularBufferGet(

    const SherpaOnnxCircularBuffer *buffer, int32_t start_index, int32_t n);


SHERPA_ONNX_API void SherpaOnnxCircularBufferFree(const float *p);


SHERPA_ONNX_API void SherpaOnnxCircularBufferPop(

    const SherpaOnnxCircularBuffer *buffer, int32_t n);


SHERPA_ONNX_API int32_t

SherpaOnnxCircularBufferSize(const SherpaOnnxCircularBuffer *buffer);


SHERPA_ONNX_API int32_t

SherpaOnnxCircularBufferHead(const SherpaOnnxCircularBuffer *buffer);


SHERPA_ONNX_API void SherpaOnnxCircularBufferReset(

    const SherpaOnnxCircularBuffer *buffer);


typedef struct SherpaOnnxSpeechSegment {

  int32_t start;

  float *samples;

  int32_t n;

} SherpaOnnxSpeechSegment;


typedef struct SherpaOnnxVoiceActivityDetector SherpaOnnxVoiceActivityDetector;


SHERPA_ONNX_API const SherpaOnnxVoiceActivityDetector *

SherpaOnnxCreateVoiceActivityDetector(const SherpaOnnxVadModelConfig *config,

                                      float buffer_size_in_seconds);


SHERPA_ONNX_API void SherpaOnnxDestroyVoiceActivityDetector(

    const SherpaOnnxVoiceActivityDetector *p);


SHERPA_ONNX_API void SherpaOnnxVoiceActivityDetectorAcceptWaveform(

    const SherpaOnnxVoiceActivityDetector *p, const float *samples, int32_t n);


SHERPA_ONNX_API int32_t

SherpaOnnxVoiceActivityDetectorEmpty(const SherpaOnnxVoiceActivityDetector *p);


SHERPA_ONNX_API int32_t SherpaOnnxVoiceActivityDetectorDetected(

    const SherpaOnnxVoiceActivityDetector *p);


SHERPA_ONNX_API void SherpaOnnxVoiceActivityDetectorPop(

    const SherpaOnnxVoiceActivityDetector *p);


SHERPA_ONNX_API void SherpaOnnxVoiceActivityDetectorClear(

    const SherpaOnnxVoiceActivityDetector *p);


SHERPA_ONNX_API const SherpaOnnxSpeechSegment *

SherpaOnnxVoiceActivityDetectorFront(const SherpaOnnxVoiceActivityDetector *p);


SHERPA_ONNX_API void SherpaOnnxDestroySpeechSegment(

    const SherpaOnnxSpeechSegment *p);


SHERPA_ONNX_API void SherpaOnnxVoiceActivityDetectorReset(

    const SherpaOnnxVoiceActivityDetector *p);


SHERPA_ONNX_API void SherpaOnnxVoiceActivityDetectorFlush(

    const SherpaOnnxVoiceActivityDetector *p);


// ============================================================

// For offline Text-to-Speech (i.e., non-streaming TTS)

// ============================================================


typedef struct SherpaOnnxOfflineTtsVitsModelConfig {

  const char *model;

  const char *lexicon;

  const char *tokens;

  const char *data_dir;

  float noise_scale;

  float noise_scale_w;

  float length_scale;

  const char *dict_dir;

} SherpaOnnxOfflineTtsVitsModelConfig;


typedef struct SherpaOnnxOfflineTtsMatchaModelConfig {

  const char *acoustic_model;

  const char *vocoder;

  const char *lexicon;

  const char *tokens;

  const char *data_dir;

  float noise_scale;

  float length_scale;

  const char *dict_dir;

} SherpaOnnxOfflineTtsMatchaModelConfig;


typedef struct SherpaOnnxOfflineTtsKokoroModelConfig {

  const char *model;

  const char *voices;

  const char *tokens;

  const char *data_dir;

  float length_scale;

  const char *dict_dir;

  const char *lexicon;

  const char *lang;

} SherpaOnnxOfflineTtsKokoroModelConfig;


typedef struct SherpaOnnxOfflineTtsKittenModelConfig {

  const char *model;

  const char *voices;

  const char *tokens;

  const char *data_dir;

  float length_scale;

} SherpaOnnxOfflineTtsKittenModelConfig;


typedef struct SherpaOnnxOfflineTtsZipvoiceModelConfig {

  const char *tokens;

  const char *encoder;

  const char *decoder;

  const char *vocoder;

  const char *data_dir;

  const char *lexicon;

  float feat_scale;

  float t_shift;

  float target_rms;

  float guidance_scale;

} SherpaOnnxOfflineTtsZipvoiceModelConfig;


typedef struct SherpaOnnxOfflineTtsPocketModelConfig {

  const char *lm_flow;

  const char *lm_main;

  const char *encoder;

  const char *decoder;

  const char *text_conditioner;

  const char *vocab_json;

  const char *token_scores_json;

  int32_t voice_embedding_cache_capacity;

} SherpaOnnxOfflineTtsPocketModelConfig;


typedef struct SherpaOnnxOfflineTtsSupertonicModelConfig {

  const char *duration_predictor;

  const char *text_encoder;

  const char *vector_estimator;

  const char *vocoder;

  const char *tts_json;

  const char *unicode_indexer;

  const char *voice_style;

} SherpaOnnxOfflineTtsSupertonicModelConfig;


typedef struct SherpaOnnxOfflineTtsModelConfig {

  SherpaOnnxOfflineTtsVitsModelConfig vits;

  int32_t num_threads;

  int32_t debug;

  const char *provider;

  SherpaOnnxOfflineTtsMatchaModelConfig matcha;

  SherpaOnnxOfflineTtsKokoroModelConfig kokoro;

  SherpaOnnxOfflineTtsKittenModelConfig kitten;

  SherpaOnnxOfflineTtsZipvoiceModelConfig zipvoice;

  SherpaOnnxOfflineTtsPocketModelConfig pocket;

  SherpaOnnxOfflineTtsSupertonicModelConfig supertonic;

} SherpaOnnxOfflineTtsModelConfig;


typedef struct SherpaOnnxOfflineTtsConfig {

  SherpaOnnxOfflineTtsModelConfig model;

  const char *rule_fsts;

  int32_t max_num_sentences;

  const char *rule_fars;

  float silence_scale;

} SherpaOnnxOfflineTtsConfig;


typedef struct SherpaOnnxGeneratedAudio {

  const float *samples;

  int32_t n;

  int32_t sample_rate;

} SherpaOnnxGeneratedAudio;


typedef int32_t (*SherpaOnnxGeneratedAudioCallback)(const float *samples,

                                                    int32_t n);


typedef int32_t (*SherpaOnnxGeneratedAudioCallbackWithArg)(const float *samples,

                                                           int32_t n,

                                                           void *arg);


typedef int32_t (*SherpaOnnxGeneratedAudioProgressCallback)(

    const float *samples, int32_t n, float p);


typedef int32_t (*SherpaOnnxGeneratedAudioProgressCallbackWithArg)(

    const float *samples, int32_t n, float p, void *arg);


typedef struct SherpaOnnxOfflineTts SherpaOnnxOfflineTts;


SHERPA_ONNX_API const SherpaOnnxOfflineTts *SherpaOnnxCreateOfflineTts(

    const SherpaOnnxOfflineTtsConfig *config);


SHERPA_ONNX_API void SherpaOnnxDestroyOfflineTts(

    const SherpaOnnxOfflineTts *tts);


SHERPA_ONNX_API int32_t

SherpaOnnxOfflineTtsSampleRate(const SherpaOnnxOfflineTts *tts);


SHERPA_ONNX_API int32_t

SherpaOnnxOfflineTtsNumSpeakers(const SherpaOnnxOfflineTts *tts);


SHERPA_ONNX_API SHERPA_ONNX_DEPRECATED(

    "Use SherpaOnnxOfflineTtsGenerateWithConfig() instead") const

    SherpaOnnxGeneratedAudio *SherpaOnnxOfflineTtsGenerate(

        const SherpaOnnxOfflineTts *tts, const char *text, int32_t sid,

        float speed);


SHERPA_ONNX_API SHERPA_ONNX_DEPRECATED(

    "Use SherpaOnnxOfflineTtsGenerateWithConfig() instead") const

    SherpaOnnxGeneratedAudio *SherpaOnnxOfflineTtsGenerateWithCallback(

        const SherpaOnnxOfflineTts *tts, const char *text, int32_t sid,

        float speed, SherpaOnnxGeneratedAudioCallback callback);


SHERPA_ONNX_API SHERPA_ONNX_DEPRECATED(

    "Use SherpaOnnxOfflineTtsGenerateWithConfig() instead") const

    SherpaOnnxGeneratedAudio *SherpaOnnxOfflineTtsGenerateWithProgressCallback(

        const SherpaOnnxOfflineTts *tts, const char *text, int32_t sid,

        float speed, SherpaOnnxGeneratedAudioProgressCallback callback);


SHERPA_ONNX_API SHERPA_ONNX_DEPRECATED(

    "Use SherpaOnnxOfflineTtsGenerateWithConfig() instead") const

    SherpaOnnxGeneratedAudio

        *SherpaOnnxOfflineTtsGenerateWithProgressCallbackWithArg(

            const SherpaOnnxOfflineTts *tts, const char *text, int32_t sid,

            float speed,

            SherpaOnnxGeneratedAudioProgressCallbackWithArg callback,

            void *arg);


SHERPA_ONNX_API SHERPA_ONNX_DEPRECATED(

    "Use SherpaOnnxOfflineTtsGenerateWithConfig() instead") const

    SherpaOnnxGeneratedAudio *SherpaOnnxOfflineTtsGenerateWithCallbackWithArg(

        const SherpaOnnxOfflineTts *tts, const char *text, int32_t sid,

        float speed, SherpaOnnxGeneratedAudioCallbackWithArg callback,

        void *arg);


SHERPA_ONNX_API SHERPA_ONNX_DEPRECATED(

    "Use SherpaOnnxOfflineTtsGenerateWithConfig() instead") const

    SherpaOnnxGeneratedAudio *SherpaOnnxOfflineTtsGenerateWithZipvoice(

        const SherpaOnnxOfflineTts *tts, const char *text,

        const char *prompt_text, const float *prompt_samples, int32_t n_prompt,

        int32_t prompt_sr, float speed, int32_t num_steps);


typedef struct SherpaOnnxGenerationConfig {

  float silence_scale;

  float speed;

  int32_t sid;

  const float *reference_audio;

  int32_t reference_audio_len;

  int32_t reference_sample_rate;

  const char *reference_text;

  int32_t num_steps;

  const char *extra;

} SherpaOnnxGenerationConfig;


SHERPA_ONNX_API const SherpaOnnxGeneratedAudio *

SherpaOnnxOfflineTtsGenerateWithConfig(

    const SherpaOnnxOfflineTts *tts, const char *text,

    const SherpaOnnxGenerationConfig *config,

    SherpaOnnxGeneratedAudioProgressCallbackWithArg callback, void *arg);


SHERPA_ONNX_API void SherpaOnnxDestroyOfflineTtsGeneratedAudio(

    const SherpaOnnxGeneratedAudio *p);


SHERPA_ONNX_API int32_t SherpaOnnxWriteWave(const float *samples, int32_t n,

                                            int32_t sample_rate,

                                            const char *filename);


SHERPA_ONNX_API int64_t SherpaOnnxWaveFileSize(int32_t n_samples);


SHERPA_ONNX_API void SherpaOnnxWriteWaveToBuffer(const float *samples,

                                                 int32_t n, int32_t sample_rate,

                                                 char *buffer);


SHERPA_ONNX_API int32_t SherpaOnnxWriteWaveMultiChannel(

    const float *const *samples, int32_t n, int32_t sample_rate,

    int32_t num_channels, const char *filename);


typedef struct SherpaOnnxWave {

  const float *samples;

  int32_t sample_rate;

  int32_t num_samples;

} SherpaOnnxWave;


SHERPA_ONNX_API const SherpaOnnxWave *SherpaOnnxReadWave(const char *filename);


SHERPA_ONNX_API const SherpaOnnxWave *SherpaOnnxReadWaveFromBinaryData(

    const char *data, int32_t n);


SHERPA_ONNX_API void SherpaOnnxFreeWave(const SherpaOnnxWave *wave);


typedef struct SherpaOnnxMultiChannelWave {

  const float *const *samples;

  int32_t num_channels;

  int32_t num_samples;

  int32_t sample_rate;

} SherpaOnnxMultiChannelWave;


SHERPA_ONNX_API const SherpaOnnxMultiChannelWave *

SherpaOnnxReadWaveMultiChannel(const char *filename);


SHERPA_ONNX_API void SherpaOnnxFreeMultiChannelWave(

    const SherpaOnnxMultiChannelWave *wave);


// ============================================================

// For spoken language identification

// ============================================================


typedef struct SherpaOnnxSpokenLanguageIdentificationWhisperConfig {

  const char *encoder;

  const char *decoder;

  int32_t tail_paddings;

} SherpaOnnxSpokenLanguageIdentificationWhisperConfig;


typedef struct SherpaOnnxSpokenLanguageIdentificationConfig {

  SherpaOnnxSpokenLanguageIdentificationWhisperConfig whisper;

  int32_t num_threads;

  int32_t debug;

  const char *provider;

} SherpaOnnxSpokenLanguageIdentificationConfig;


typedef struct SherpaOnnxSpokenLanguageIdentification

    SherpaOnnxSpokenLanguageIdentification;


SHERPA_ONNX_API const SherpaOnnxSpokenLanguageIdentification *

SherpaOnnxCreateSpokenLanguageIdentification(

    const SherpaOnnxSpokenLanguageIdentificationConfig *config);


SHERPA_ONNX_API void SherpaOnnxDestroySpokenLanguageIdentification(

    const SherpaOnnxSpokenLanguageIdentification *slid);


SHERPA_ONNX_API SherpaOnnxOfflineStream *

SherpaOnnxSpokenLanguageIdentificationCreateOfflineStream(

    const SherpaOnnxSpokenLanguageIdentification *slid);


typedef struct SherpaOnnxSpokenLanguageIdentificationResult {

  const char *lang;

} SherpaOnnxSpokenLanguageIdentificationResult;


SHERPA_ONNX_API const SherpaOnnxSpokenLanguageIdentificationResult *

SherpaOnnxSpokenLanguageIdentificationCompute(

    const SherpaOnnxSpokenLanguageIdentification *slid,

    const SherpaOnnxOfflineStream *s);


SHERPA_ONNX_API void SherpaOnnxDestroySpokenLanguageIdentificationResult(

    const SherpaOnnxSpokenLanguageIdentificationResult *r);


// ============================================================

// For speaker embedding extraction

// ============================================================


typedef struct SherpaOnnxSpeakerEmbeddingExtractorConfig {

  const char *model;

  int32_t num_threads;

  int32_t debug;

  const char *provider;

} SherpaOnnxSpeakerEmbeddingExtractorConfig;


typedef struct SherpaOnnxSpeakerEmbeddingExtractor

    SherpaOnnxSpeakerEmbeddingExtractor;


SHERPA_ONNX_API const SherpaOnnxSpeakerEmbeddingExtractor *

SherpaOnnxCreateSpeakerEmbeddingExtractor(

    const SherpaOnnxSpeakerEmbeddingExtractorConfig *config);


SHERPA_ONNX_API void SherpaOnnxDestroySpeakerEmbeddingExtractor(

    const SherpaOnnxSpeakerEmbeddingExtractor *p);


SHERPA_ONNX_API int32_t SherpaOnnxSpeakerEmbeddingExtractorDim(

    const SherpaOnnxSpeakerEmbeddingExtractor *p);


SHERPA_ONNX_API const SherpaOnnxOnlineStream *

SherpaOnnxSpeakerEmbeddingExtractorCreateStream(

    const SherpaOnnxSpeakerEmbeddingExtractor *p);


SHERPA_ONNX_API int32_t SherpaOnnxSpeakerEmbeddingExtractorIsReady(

    const SherpaOnnxSpeakerEmbeddingExtractor *p,

    const SherpaOnnxOnlineStream *s);


SHERPA_ONNX_API const float *

SherpaOnnxSpeakerEmbeddingExtractorComputeEmbedding(

    const SherpaOnnxSpeakerEmbeddingExtractor *p,

    const SherpaOnnxOnlineStream *s);


SHERPA_ONNX_API void SherpaOnnxSpeakerEmbeddingExtractorDestroyEmbedding(

    const float *v);


typedef struct SherpaOnnxSpeakerEmbeddingManager

    SherpaOnnxSpeakerEmbeddingManager;


SHERPA_ONNX_API const SherpaOnnxSpeakerEmbeddingManager *

SherpaOnnxCreateSpeakerEmbeddingManager(int32_t dim);


SHERPA_ONNX_API void SherpaOnnxDestroySpeakerEmbeddingManager(

    const SherpaOnnxSpeakerEmbeddingManager *p);


SHERPA_ONNX_API int32_t

SherpaOnnxSpeakerEmbeddingManagerAdd(const SherpaOnnxSpeakerEmbeddingManager *p,

                                     const char *name, const float *v);


SHERPA_ONNX_API int32_t SherpaOnnxSpeakerEmbeddingManagerAddList(

    const SherpaOnnxSpeakerEmbeddingManager *p, const char *name,

    const float **v);


SHERPA_ONNX_API int32_t SherpaOnnxSpeakerEmbeddingManagerAddListFlattened(

    const SherpaOnnxSpeakerEmbeddingManager *p, const char *name,

    const float *v, int32_t n);


SHERPA_ONNX_API int32_t SherpaOnnxSpeakerEmbeddingManagerRemove(

    const SherpaOnnxSpeakerEmbeddingManager *p, const char *name);


SHERPA_ONNX_API const char *SherpaOnnxSpeakerEmbeddingManagerSearch(

    const SherpaOnnxSpeakerEmbeddingManager *p, const float *v,

    float threshold);


SHERPA_ONNX_API void SherpaOnnxSpeakerEmbeddingManagerFreeSearch(

    const char *name);


typedef struct SherpaOnnxSpeakerEmbeddingManagerSpeakerMatch {

  float score;

  const char *name;

} SherpaOnnxSpeakerEmbeddingManagerSpeakerMatch;


typedef struct SherpaOnnxSpeakerEmbeddingManagerBestMatchesResult {

  const SherpaOnnxSpeakerEmbeddingManagerSpeakerMatch *matches;

  int32_t count;

} SherpaOnnxSpeakerEmbeddingManagerBestMatchesResult;


SHERPA_ONNX_API const SherpaOnnxSpeakerEmbeddingManagerBestMatchesResult *

SherpaOnnxSpeakerEmbeddingManagerGetBestMatches(

    const SherpaOnnxSpeakerEmbeddingManager *p, const float *v, float threshold,

    int32_t n);


SHERPA_ONNX_API void SherpaOnnxSpeakerEmbeddingManagerFreeBestMatches(

    const SherpaOnnxSpeakerEmbeddingManagerBestMatchesResult *r);


SHERPA_ONNX_API int32_t SherpaOnnxSpeakerEmbeddingManagerVerify(

    const SherpaOnnxSpeakerEmbeddingManager *p, const char *name,

    const float *v, float threshold);


SHERPA_ONNX_API int32_t SherpaOnnxSpeakerEmbeddingManagerContains(

    const SherpaOnnxSpeakerEmbeddingManager *p, const char *name);


SHERPA_ONNX_API int32_t SherpaOnnxSpeakerEmbeddingManagerNumSpeakers(

    const SherpaOnnxSpeakerEmbeddingManager *p);


SHERPA_ONNX_API const char *const *

SherpaOnnxSpeakerEmbeddingManagerGetAllSpeakers(

    const SherpaOnnxSpeakerEmbeddingManager *p);


SHERPA_ONNX_API void SherpaOnnxSpeakerEmbeddingManagerFreeAllSpeakers(

    const char *const *names);


// ============================================================

// For audio tagging

// ============================================================


typedef struct SherpaOnnxOfflineZipformerAudioTaggingModelConfig {

  const char *model;

} SherpaOnnxOfflineZipformerAudioTaggingModelConfig;


typedef struct SherpaOnnxAudioTaggingModelConfig {

  SherpaOnnxOfflineZipformerAudioTaggingModelConfig zipformer;

  const char *ced;

  int32_t num_threads;

  int32_t debug;

  const char *provider;

} SherpaOnnxAudioTaggingModelConfig;


typedef struct SherpaOnnxAudioTaggingConfig {

  SherpaOnnxAudioTaggingModelConfig model;

  const char *labels;

  int32_t top_k;

} SherpaOnnxAudioTaggingConfig;


typedef struct SherpaOnnxAudioEvent {

  const char *name;

  int32_t index;

  float prob;

} SherpaOnnxAudioEvent;


typedef struct SherpaOnnxAudioTagging SherpaOnnxAudioTagging;


SHERPA_ONNX_API const SherpaOnnxAudioTagging *SherpaOnnxCreateAudioTagging(

    const SherpaOnnxAudioTaggingConfig *config);


SHERPA_ONNX_API void SherpaOnnxDestroyAudioTagging(

    const SherpaOnnxAudioTagging *tagger);


SHERPA_ONNX_API const SherpaOnnxOfflineStream *

SherpaOnnxAudioTaggingCreateOfflineStream(const SherpaOnnxAudioTagging *tagger);


SHERPA_ONNX_API const SherpaOnnxAudioEvent *const *

SherpaOnnxAudioTaggingCompute(const SherpaOnnxAudioTagging *tagger,

                              const SherpaOnnxOfflineStream *s, int32_t top_k);


SHERPA_ONNX_API void SherpaOnnxAudioTaggingFreeResults(

    const SherpaOnnxAudioEvent *const *p);


// ============================================================

// For punctuation

// ============================================================


typedef struct SherpaOnnxOfflinePunctuationModelConfig {

  const char *ct_transformer;

  int32_t num_threads;

  int32_t debug;

  const char *provider;

} SherpaOnnxOfflinePunctuationModelConfig;


typedef struct SherpaOnnxOfflinePunctuationConfig {

  SherpaOnnxOfflinePunctuationModelConfig model;

} SherpaOnnxOfflinePunctuationConfig;


typedef struct SherpaOnnxOfflinePunctuation SherpaOnnxOfflinePunctuation;


SHERPA_ONNX_API const SherpaOnnxOfflinePunctuation *

SherpaOnnxCreateOfflinePunctuation(

    const SherpaOnnxOfflinePunctuationConfig *config);


SHERPA_ONNX_API void SherpaOnnxDestroyOfflinePunctuation(

    const SherpaOnnxOfflinePunctuation *punct);


SHERPA_ONNX_API const char *SherpaOfflinePunctuationAddPunct(

    const SherpaOnnxOfflinePunctuation *punct, const char *text);


SHERPA_ONNX_API void SherpaOfflinePunctuationFreeText(const char *text);


typedef struct SherpaOnnxOnlinePunctuationModelConfig {

  const char *cnn_bilstm;

  const char *bpe_vocab;

  int32_t num_threads;

  int32_t debug;

  const char *provider;

} SherpaOnnxOnlinePunctuationModelConfig;


typedef struct SherpaOnnxOnlinePunctuationConfig {

  SherpaOnnxOnlinePunctuationModelConfig model;

} SherpaOnnxOnlinePunctuationConfig;


typedef struct SherpaOnnxOnlinePunctuation SherpaOnnxOnlinePunctuation;


SHERPA_ONNX_API const SherpaOnnxOnlinePunctuation *

SherpaOnnxCreateOnlinePunctuation(

    const SherpaOnnxOnlinePunctuationConfig *config);


SHERPA_ONNX_API void SherpaOnnxDestroyOnlinePunctuation(

    const SherpaOnnxOnlinePunctuation *punctuation);


SHERPA_ONNX_API const char *SherpaOnnxOnlinePunctuationAddPunct(

    const SherpaOnnxOnlinePunctuation *punctuation, const char *text);


SHERPA_ONNX_API void SherpaOnnxOnlinePunctuationFreeText(const char *text);


// For resampling

typedef struct SherpaOnnxLinearResampler SherpaOnnxLinearResampler;


SHERPA_ONNX_API const SherpaOnnxLinearResampler *

SherpaOnnxCreateLinearResampler(int32_t samp_rate_in_hz,

                                int32_t samp_rate_out_hz,

                                float filter_cutoff_hz, int32_t num_zeros);


SHERPA_ONNX_API void SherpaOnnxDestroyLinearResampler(

    const SherpaOnnxLinearResampler *p);


SHERPA_ONNX_API void SherpaOnnxLinearResamplerReset(

    const SherpaOnnxLinearResampler *p);


typedef struct SherpaOnnxResampleOut {

  const float *samples;

  int32_t n;

} SherpaOnnxResampleOut;


SHERPA_ONNX_API const SherpaOnnxResampleOut *SherpaOnnxLinearResamplerResample(

    const SherpaOnnxLinearResampler *p, const float *input, int32_t input_dim,

    int32_t flush);


SHERPA_ONNX_API void SherpaOnnxLinearResamplerResampleFree(

    const SherpaOnnxResampleOut *p);


SHERPA_ONNX_API int32_t SherpaOnnxLinearResamplerResampleGetInputSampleRate(

    const SherpaOnnxLinearResampler *p);


SHERPA_ONNX_API int32_t SherpaOnnxLinearResamplerResampleGetOutputSampleRate(

    const SherpaOnnxLinearResampler *p);


// =========================================================================

// For offline speaker diarization (i.e., non-streaming speaker diarization)

// =========================================================================


typedef struct SherpaOnnxOfflineSpeakerSegmentationPyannoteModelConfig {

  const char *model;

} SherpaOnnxOfflineSpeakerSegmentationPyannoteModelConfig;


typedef struct SherpaOnnxOfflineSpeakerSegmentationModelConfig {

  SherpaOnnxOfflineSpeakerSegmentationPyannoteModelConfig pyannote;

  int32_t num_threads;

  int32_t debug;

  const char *provider;

} SherpaOnnxOfflineSpeakerSegmentationModelConfig;


typedef struct SherpaOnnxFastClusteringConfig {

  int32_t num_clusters;

  float threshold;

} SherpaOnnxFastClusteringConfig;


typedef struct SherpaOnnxOfflineSpeakerDiarizationConfig {

  SherpaOnnxOfflineSpeakerSegmentationModelConfig segmentation;

  SherpaOnnxSpeakerEmbeddingExtractorConfig embedding;

  SherpaOnnxFastClusteringConfig clustering;

  float min_duration_on;

  float min_duration_off;

} SherpaOnnxOfflineSpeakerDiarizationConfig;


typedef struct SherpaOnnxOfflineSpeakerDiarization

    SherpaOnnxOfflineSpeakerDiarization;


SHERPA_ONNX_API const SherpaOnnxOfflineSpeakerDiarization *

SherpaOnnxCreateOfflineSpeakerDiarization(

    const SherpaOnnxOfflineSpeakerDiarizationConfig *config);


SHERPA_ONNX_API void SherpaOnnxDestroyOfflineSpeakerDiarization(

    const SherpaOnnxOfflineSpeakerDiarization *sd);


SHERPA_ONNX_API int32_t SherpaOnnxOfflineSpeakerDiarizationGetSampleRate(

    const SherpaOnnxOfflineSpeakerDiarization *sd);


SHERPA_ONNX_API void SherpaOnnxOfflineSpeakerDiarizationSetConfig(

    const SherpaOnnxOfflineSpeakerDiarization *sd,

    const SherpaOnnxOfflineSpeakerDiarizationConfig *config);


typedef struct SherpaOnnxOfflineSpeakerDiarizationResult

    SherpaOnnxOfflineSpeakerDiarizationResult;


typedef struct SherpaOnnxOfflineSpeakerDiarizationSegment {

  float start;

  float end;

  int32_t speaker;

} SherpaOnnxOfflineSpeakerDiarizationSegment;


SHERPA_ONNX_API int32_t SherpaOnnxOfflineSpeakerDiarizationResultGetNumSpeakers(

    const SherpaOnnxOfflineSpeakerDiarizationResult *r);


SHERPA_ONNX_API int32_t SherpaOnnxOfflineSpeakerDiarizationResultGetNumSegments(

    const SherpaOnnxOfflineSpeakerDiarizationResult *r);


SHERPA_ONNX_API const SherpaOnnxOfflineSpeakerDiarizationSegment *

SherpaOnnxOfflineSpeakerDiarizationResultSortByStartTime(

    const SherpaOnnxOfflineSpeakerDiarizationResult *r);


SHERPA_ONNX_API void SherpaOnnxOfflineSpeakerDiarizationDestroySegment(

    const SherpaOnnxOfflineSpeakerDiarizationSegment *s);


typedef int32_t (*SherpaOnnxOfflineSpeakerDiarizationProgressCallback)(

    int32_t num_processed_chunks, int32_t num_total_chunks, void *arg);


typedef int32_t (*SherpaOnnxOfflineSpeakerDiarizationProgressCallbackNoArg)(

    int32_t num_processed_chunks, int32_t num_total_chunks);


SHERPA_ONNX_API const SherpaOnnxOfflineSpeakerDiarizationResult *

SherpaOnnxOfflineSpeakerDiarizationProcess(

    const SherpaOnnxOfflineSpeakerDiarization *sd, const float *samples,

    int32_t n);


SHERPA_ONNX_API const SherpaOnnxOfflineSpeakerDiarizationResult *

SherpaOnnxOfflineSpeakerDiarizationProcessWithCallback(

    const SherpaOnnxOfflineSpeakerDiarization *sd, const float *samples,

    int32_t n, SherpaOnnxOfflineSpeakerDiarizationProgressCallback callback,

    void *arg);


SHERPA_ONNX_API const SherpaOnnxOfflineSpeakerDiarizationResult *

SherpaOnnxOfflineSpeakerDiarizationProcessWithCallbackNoArg(

    const SherpaOnnxOfflineSpeakerDiarization *sd, const float *samples,

    int32_t n,

    SherpaOnnxOfflineSpeakerDiarizationProgressCallbackNoArg callback);


SHERPA_ONNX_API void SherpaOnnxOfflineSpeakerDiarizationDestroyResult(

    const SherpaOnnxOfflineSpeakerDiarizationResult *r);


// =========================================================================

// For offline speech enhancement

// =========================================================================


typedef struct SherpaOnnxOfflineSpeechDenoiserGtcrnModelConfig {

  const char *model;

} SherpaOnnxOfflineSpeechDenoiserGtcrnModelConfig;


typedef struct SherpaOnnxOfflineSpeechDenoiserDpdfNetModelConfig {

  const char *model;

} SherpaOnnxOfflineSpeechDenoiserDpdfNetModelConfig;


typedef struct SherpaOnnxOfflineSpeechDenoiserModelConfig {

  SherpaOnnxOfflineSpeechDenoiserGtcrnModelConfig gtcrn;

  int32_t num_threads;

  int32_t debug;

  const char *provider;

  SherpaOnnxOfflineSpeechDenoiserDpdfNetModelConfig dpdfnet;

} SherpaOnnxOfflineSpeechDenoiserModelConfig;


typedef struct SherpaOnnxOfflineSpeechDenoiserConfig {

  SherpaOnnxOfflineSpeechDenoiserModelConfig model;

} SherpaOnnxOfflineSpeechDenoiserConfig;


typedef struct SherpaOnnxOfflineSpeechDenoiser SherpaOnnxOfflineSpeechDenoiser;


SHERPA_ONNX_API const SherpaOnnxOfflineSpeechDenoiser *

SherpaOnnxCreateOfflineSpeechDenoiser(

    const SherpaOnnxOfflineSpeechDenoiserConfig *config);


SHERPA_ONNX_API void SherpaOnnxDestroyOfflineSpeechDenoiser(

    const SherpaOnnxOfflineSpeechDenoiser *sd);


SHERPA_ONNX_API int32_t SherpaOnnxOfflineSpeechDenoiserGetSampleRate(

    const SherpaOnnxOfflineSpeechDenoiser *sd);


typedef struct SherpaOnnxDenoisedAudio {

  const float *samples;

  int32_t n;

  int32_t sample_rate;

} SherpaOnnxDenoisedAudio;


SHERPA_ONNX_API const SherpaOnnxDenoisedAudio *

SherpaOnnxOfflineSpeechDenoiserRun(const SherpaOnnxOfflineSpeechDenoiser *sd,

                                   const float *samples, int32_t n,

                                   int32_t sample_rate);


SHERPA_ONNX_API void SherpaOnnxDestroyDenoisedAudio(

    const SherpaOnnxDenoisedAudio *p);


// =========================================================================

// For streaming speech enhancement

// =========================================================================


typedef struct SherpaOnnxOnlineSpeechDenoiserConfig {

  SherpaOnnxOfflineSpeechDenoiserModelConfig model;

} SherpaOnnxOnlineSpeechDenoiserConfig;


typedef struct SherpaOnnxOnlineSpeechDenoiser SherpaOnnxOnlineSpeechDenoiser;


SHERPA_ONNX_API const SherpaOnnxOnlineSpeechDenoiser *

SherpaOnnxCreateOnlineSpeechDenoiser(

    const SherpaOnnxOnlineSpeechDenoiserConfig *config);


SHERPA_ONNX_API void SherpaOnnxDestroyOnlineSpeechDenoiser(

    const SherpaOnnxOnlineSpeechDenoiser *sd);


SHERPA_ONNX_API int32_t SherpaOnnxOnlineSpeechDenoiserGetSampleRate(

    const SherpaOnnxOnlineSpeechDenoiser *sd);


SHERPA_ONNX_API int32_t SherpaOnnxOnlineSpeechDenoiserGetFrameShiftInSamples(

    const SherpaOnnxOnlineSpeechDenoiser *sd);


SHERPA_ONNX_API const SherpaOnnxDenoisedAudio *

SherpaOnnxOnlineSpeechDenoiserRun(const SherpaOnnxOnlineSpeechDenoiser *sd,

                                  const float *samples, int32_t n,

                                  int32_t sample_rate);


SHERPA_ONNX_API const SherpaOnnxDenoisedAudio *

SherpaOnnxOnlineSpeechDenoiserFlush(const SherpaOnnxOnlineSpeechDenoiser *sd);


SHERPA_ONNX_API void SherpaOnnxOnlineSpeechDenoiserReset(

    const SherpaOnnxOnlineSpeechDenoiser *sd);


// =========================================================================

// Source separation

// =========================================================================


typedef struct SherpaOnnxOfflineSourceSeparationSpleeterModelConfig {

  const char *vocals;

  const char *accompaniment;

} SherpaOnnxOfflineSourceSeparationSpleeterModelConfig;


typedef struct SherpaOnnxOfflineSourceSeparationUvrModelConfig {

  const char *model;

} SherpaOnnxOfflineSourceSeparationUvrModelConfig;


typedef struct SherpaOnnxOfflineSourceSeparationModelConfig {

  SherpaOnnxOfflineSourceSeparationSpleeterModelConfig spleeter;

  SherpaOnnxOfflineSourceSeparationUvrModelConfig uvr;

  int32_t num_threads;

  int32_t debug;

  const char *provider;

} SherpaOnnxOfflineSourceSeparationModelConfig;


typedef struct SherpaOnnxOfflineSourceSeparationConfig {

  SherpaOnnxOfflineSourceSeparationModelConfig model;

} SherpaOnnxOfflineSourceSeparationConfig;


typedef struct SherpaOnnxOfflineSourceSeparation

    SherpaOnnxOfflineSourceSeparation;


SHERPA_ONNX_API const SherpaOnnxOfflineSourceSeparation *

SherpaOnnxCreateOfflineSourceSeparation(

    const SherpaOnnxOfflineSourceSeparationConfig *config);


SHERPA_ONNX_API void SherpaOnnxDestroyOfflineSourceSeparation(

    const SherpaOnnxOfflineSourceSeparation *ss);


SHERPA_ONNX_API int32_t SherpaOnnxOfflineSourceSeparationGetOutputSampleRate(

    const SherpaOnnxOfflineSourceSeparation *ss);


SHERPA_ONNX_API int32_t SherpaOnnxOfflineSourceSeparationGetNumberOfStems(

    const SherpaOnnxOfflineSourceSeparation *ss);


typedef struct SherpaOnnxSourceSeparationStem {

  float **samples;

  int32_t num_channels;

  int32_t n;

} SherpaOnnxSourceSeparationStem;


typedef struct SherpaOnnxSourceSeparationOutput {

  const SherpaOnnxSourceSeparationStem *stems;

  int32_t num_stems;

  int32_t sample_rate;

} SherpaOnnxSourceSeparationOutput;


SHERPA_ONNX_API const SherpaOnnxSourceSeparationOutput *

SherpaOnnxOfflineSourceSeparationProcess(

    const SherpaOnnxOfflineSourceSeparation *ss, const float *const *samples,

    int32_t num_channels, int32_t num_samples, int32_t sample_rate);


SHERPA_ONNX_API void SherpaOnnxDestroySourceSeparationOutput(

    const SherpaOnnxSourceSeparationOutput *p);


#ifdef __OHOS__


typedef struct NativeResourceManager NativeResourceManager;


SHERPA_ONNX_API const SherpaOnnxOfflineSpeechDenoiser *

SherpaOnnxCreateOfflineSpeechDenoiserOHOS(

    const SherpaOnnxOfflineSpeechDenoiserConfig *config,

    NativeResourceManager *mgr);


SHERPA_ONNX_API const SherpaOnnxOnlineSpeechDenoiser *

SherpaOnnxCreateOnlineSpeechDenoiserOHOS(

    const SherpaOnnxOnlineSpeechDenoiserConfig *config,

    NativeResourceManager *mgr);


SHERPA_ONNX_API const SherpaOnnxOnlineRecognizer *

SherpaOnnxCreateOnlineRecognizerOHOS(

    const SherpaOnnxOnlineRecognizerConfig *config, NativeResourceManager *mgr);


SHERPA_ONNX_API const SherpaOnnxOfflineRecognizer *

SherpaOnnxCreateOfflineRecognizerOHOS(

    const SherpaOnnxOfflineRecognizerConfig *config,

    NativeResourceManager *mgr);


SHERPA_ONNX_API const SherpaOnnxVoiceActivityDetector *

SherpaOnnxCreateVoiceActivityDetectorOHOS(

    const SherpaOnnxVadModelConfig *config, float buffer_size_in_seconds,

    NativeResourceManager *mgr);


SHERPA_ONNX_API const SherpaOnnxOfflineTts *SherpaOnnxCreateOfflineTtsOHOS(

    const SherpaOnnxOfflineTtsConfig *config, NativeResourceManager *mgr);


SHERPA_ONNX_API const SherpaOnnxOfflinePunctuation *

SherpaOnnxCreateOfflinePunctuationOHOS(

    const SherpaOnnxOfflinePunctuationConfig *config,

    NativeResourceManager *mgr);


SHERPA_ONNX_API const SherpaOnnxOnlinePunctuation *

SherpaOnnxCreateOnlinePunctuationOHOS(

    const SherpaOnnxOnlinePunctuationConfig *config,

    NativeResourceManager *mgr);


SHERPA_ONNX_API const SherpaOnnxSpeakerEmbeddingExtractor *

SherpaOnnxCreateSpeakerEmbeddingExtractorOHOS(

    const SherpaOnnxSpeakerEmbeddingExtractorConfig *config,

    NativeResourceManager *mgr);


SHERPA_ONNX_API const SherpaOnnxKeywordSpotter *

SherpaOnnxCreateKeywordSpotterOHOS(const SherpaOnnxKeywordSpotterConfig *config,

                                   NativeResourceManager *mgr);


SHERPA_ONNX_API const SherpaOnnxOfflineSpeakerDiarization *

SherpaOnnxCreateOfflineSpeakerDiarizationOHOS(

    const SherpaOnnxOfflineSpeakerDiarizationConfig *config,

    NativeResourceManager *mgr);


SHERPA_ONNX_API const SherpaOnnxOfflineSourceSeparation *

SherpaOnnxCreateOfflineSourceSeparationOHOS(

    const SherpaOnnxOfflineSourceSeparationConfig *config,

    NativeResourceManager *mgr);

#endif


#if defined(__GNUC__)

#pragma GCC diagnostic pop

#endif


#ifdef __cplusplus

} /* extern "C" */

#endif


#endif  // SHERPA_ONNX_C_API_C_API_H_

SherpaOnnxOfflineSpeakerDiarizationResultGetNumSegments
int32_t SherpaOnnxOfflineSpeakerDiarizationResultGetNumSegments(const SherpaOnnxOfflineSpeakerDiarizationResult *r)
Return the number of diarization segments.

SherpaOnnxVoiceActivityDetectorDetected
int32_t SherpaOnnxVoiceActivityDetectorDetected(const SherpaOnnxVoiceActivityDetector *p)
Check whether the detector is currently inside speech.

SherpaOnnxVoiceActivityDetectorFront
const SherpaOnnxSpeechSegment * SherpaOnnxVoiceActivityDetectorFront(const SherpaOnnxVoiceActivityDetector *p)
Get the first queued speech segment.

SherpaOnnxOfflineRecognizerSetConfig
void SherpaOnnxOfflineRecognizerSetConfig(const SherpaOnnxOfflineRecognizer *recognizer, const SherpaOnnxOfflineRecognizerConfig *config)
Update the configuration of an existing offline recognizer.

SherpaOnnxReadWaveMultiChannel
const SherpaOnnxMultiChannelWave * SherpaOnnxReadWaveMultiChannel(const char *filename)
Read a multi-channel 16-bit PCM WAVE file.

SherpaOnnxFreeWave
void SherpaOnnxFreeWave(const SherpaOnnxWave *wave)
Destroy a wave object returned by SherpaOnnxReadWave() or SherpaOnnxReadWaveFromBinaryData().

SherpaOnnxSpokenLanguageIdentification
struct SherpaOnnxSpokenLanguageIdentification SherpaOnnxSpokenLanguageIdentification
Opaque spoken-language identification handle.
Definition c-api.h:2979

SherpaOnnxOfflineSpeakerDiarizationProcess
const SherpaOnnxOfflineSpeakerDiarizationResult * SherpaOnnxOfflineSpeakerDiarizationProcess(const SherpaOnnxOfflineSpeakerDiarization *sd, const float *samples, int32_t n)
Run offline speaker diarization.

SherpaOnnxDestroySpokenLanguageIdentification
void SherpaOnnxDestroySpokenLanguageIdentification(const SherpaOnnxSpokenLanguageIdentification *slid)
Destroy a spoken-language identifier.

SherpaOnnxSpeakerEmbeddingManagerNumSpeakers
int32_t SherpaOnnxSpeakerEmbeddingManagerNumSpeakers(const SherpaOnnxSpeakerEmbeddingManager *p)
Return the number of enrolled speakers.

SherpaOnnxGeneratedAudioCallback
int32_t(* SherpaOnnxGeneratedAudioCallback)(const float *samples, int32_t n)
Callback invoked during incremental generation.
Definition c-api.h:2477

SherpaOnnxOnlineSpeechDenoiserReset
void SherpaOnnxOnlineSpeechDenoiserReset(const SherpaOnnxOnlineSpeechDenoiser *sd)
Reset an online denoiser so it can process a new stream.

SherpaOnnxOfflineTtsGenerateWithZipvoice
const SherpaOnnxGeneratedAudio * SherpaOnnxOfflineTtsGenerateWithZipvoice(const SherpaOnnxOfflineTts *tts, const char *text, const char *prompt_text, const float *prompt_samples, int32_t n_prompt, int32_t prompt_sr, float speed, int32_t num_steps)
Deprecated ZipVoice-specific generation API.

SherpaOnnxOfflineStreamGetOption
const char * SherpaOnnxOfflineStreamGetOption(const SherpaOnnxOfflineStream *stream, const char *key)
Get a per-stream runtime option for offline ASR.

SherpaOnnxSpeakerEmbeddingManagerRemove
int32_t SherpaOnnxSpeakerEmbeddingManagerRemove(const SherpaOnnxSpeakerEmbeddingManager *p, const char *name)
Remove a speaker from the manager.

SherpaOnnxCreateSpeakerEmbeddingExtractor
const SherpaOnnxSpeakerEmbeddingExtractor * SherpaOnnxCreateSpeakerEmbeddingExtractor(const SherpaOnnxSpeakerEmbeddingExtractorConfig *config)
Create a speaker embedding extractor.

SherpaOnnxOfflineSpeechDenoiser
struct SherpaOnnxOfflineSpeechDenoiser SherpaOnnxOfflineSpeechDenoiser
Opaque offline speech denoiser handle.
Definition c-api.h:4119

SherpaOnnxDestroyKeywordSpotter
void SherpaOnnxDestroyKeywordSpotter(const SherpaOnnxKeywordSpotter *spotter)
Destroy a keyword spotter.

SherpaOnnxDestroyOnlineSpeechDenoiser
void SherpaOnnxDestroyOnlineSpeechDenoiser(const SherpaOnnxOnlineSpeechDenoiser *sd)
Destroy an online speech denoiser.

SherpaOnnxCreateLinearResampler
const SherpaOnnxLinearResampler * SherpaOnnxCreateLinearResampler(int32_t samp_rate_in_hz, int32_t samp_rate_out_hz, float filter_cutoff_hz, int32_t num_zeros)
Create a linear resampler.

SherpaOnnxOfflineSpeechDenoiserGetSampleRate
int32_t SherpaOnnxOfflineSpeechDenoiserGetSampleRate(const SherpaOnnxOfflineSpeechDenoiser *sd)
Return the expected sample rate for the denoiser.

SherpaOnnxReadWave
const SherpaOnnxWave * SherpaOnnxReadWave(const char *filename)
Read a mono 16-bit PCM WAVE file.

SherpaOnnxOnlineStreamAcceptWaveform
void SherpaOnnxOnlineStreamAcceptWaveform(const SherpaOnnxOnlineStream *stream, int32_t sample_rate, const float *samples, int32_t n)
Append audio samples to a streaming ASR stream.

SherpaOnnxDestroyOnlineStreamResultJson
void SherpaOnnxDestroyOnlineStreamResultJson(const char *s)
Free a JSON string returned by SherpaOnnxGetOnlineStreamResultAsJson().

SherpaOnnxAudioTaggingFreeResults
void SherpaOnnxAudioTaggingFreeResults(const SherpaOnnxAudioEvent *const *p)
Destroy results returned by SherpaOnnxAudioTaggingCompute().

SherpaOnnxDestroyOfflineSpeakerDiarization
void SherpaOnnxDestroyOfflineSpeakerDiarization(const SherpaOnnxOfflineSpeakerDiarization *sd)
Destroy an offline speaker diarizer.

SherpaOnnxCreateOfflineRecognizer
const SherpaOnnxOfflineRecognizer * SherpaOnnxCreateOfflineRecognizer(const SherpaOnnxOfflineRecognizerConfig *config)
Create a non-streaming ASR recognizer.

SherpaOnnxSpeakerEmbeddingExtractorDestroyEmbedding
void SherpaOnnxSpeakerEmbeddingExtractorDestroyEmbedding(const float *v)
Destroy an embedding vector returned by SherpaOnnxSpeakerEmbeddingExtractorComputeEmbedding().

SherpaOnnxOfflineSpeakerDiarizationProgressCallbackNoArg
int32_t(* SherpaOnnxOfflineSpeakerDiarizationProgressCallbackNoArg)(int32_t num_processed_chunks, int32_t num_total_chunks)
Same as SherpaOnnxOfflineSpeakerDiarizationProgressCallback but without a user pointer.
Definition c-api.h:4011

SherpaOnnxCreateOfflineTts
const SherpaOnnxOfflineTts * SherpaOnnxCreateOfflineTts(const SherpaOnnxOfflineTtsConfig *config)
Create an offline TTS engine.

SherpaOnnxVoiceActivityDetectorFlush
void SherpaOnnxVoiceActivityDetectorFlush(const SherpaOnnxVoiceActivityDetector *p)
Flush buffered tail samples and force final segmentation.

SherpaOnnxDestroyOfflineStream
void SherpaOnnxDestroyOfflineStream(const SherpaOnnxOfflineStream *stream)
Destroy a non-streaming ASR stream.

SherpaOnnxSpeakerEmbeddingExtractorComputeEmbedding
const float * SherpaOnnxSpeakerEmbeddingExtractorComputeEmbedding(const SherpaOnnxSpeakerEmbeddingExtractor *p, const SherpaOnnxOnlineStream *s)
Compute the embedding for a stream.

SherpaOnnxGetOfflineStreamResult
const SherpaOnnxOfflineRecognizerResult * SherpaOnnxGetOfflineStreamResult(const SherpaOnnxOfflineStream *stream)
Get the recognition result for an offline ASR stream.

SherpaOnnxFreeMultiChannelWave
void SherpaOnnxFreeMultiChannelWave(const SherpaOnnxMultiChannelWave *wave)
Destroy a multi-channel wave object.

SherpaOnnxOnlineStreamSetOption
void SherpaOnnxOnlineStreamSetOption(const SherpaOnnxOnlineStream *stream, const char *key, const char *value)
Set a per-stream runtime option.

SherpaOnnxGetOfflineStreamResultAsJson
const char * SherpaOnnxGetOfflineStreamResultAsJson(const SherpaOnnxOfflineStream *stream)
Get the offline ASR result as JSON.

SherpaOnnxOfflineSpeakerDiarizationProgressCallback
int32_t(* SherpaOnnxOfflineSpeakerDiarizationProgressCallback)(int32_t num_processed_chunks, int32_t num_total_chunks, void *arg)
Progress callback for offline speaker diarization.
Definition c-api.h:4004

SherpaOnnxGetKeywordResultAsJson
const char * SherpaOnnxGetKeywordResultAsJson(const SherpaOnnxKeywordSpotter *spotter, const SherpaOnnxOnlineStream *stream)
Get the current keyword spotting result as JSON.

SherpaOnnxCircularBufferGet
const float * SherpaOnnxCircularBufferGet(const SherpaOnnxCircularBuffer *buffer, int32_t start_index, int32_t n)
Copy out a slice of samples from a circular buffer.

SherpaOnnxOnlinePunctuationAddPunct
const char * SherpaOnnxOnlinePunctuationAddPunct(const SherpaOnnxOnlinePunctuation *punctuation, const char *text)
Add punctuation to one text chunk using the online punctuation model.

SherpaOnnxSpeakerEmbeddingManagerAddList
int32_t SherpaOnnxSpeakerEmbeddingManagerAddList(const SherpaOnnxSpeakerEmbeddingManager *p, const char *name, const float **v)
Add multiple enrollment embeddings for one speaker.

SherpaOnnxDecodeOfflineStream
void SherpaOnnxDecodeOfflineStream(const SherpaOnnxOfflineRecognizer *recognizer, const SherpaOnnxOfflineStream *stream)
Run offline ASR on one stream.

SherpaOnnxIsKeywordStreamReady
int32_t SherpaOnnxIsKeywordStreamReady(const SherpaOnnxKeywordSpotter *spotter, const SherpaOnnxOnlineStream *stream)
Check whether a keyword stream has enough audio for decoding.

SherpaOnnxSpeakerEmbeddingManagerAdd
int32_t SherpaOnnxSpeakerEmbeddingManagerAdd(const SherpaOnnxSpeakerEmbeddingManager *p, const char *name, const float *v)
Add one enrollment embedding for a speaker.

SherpaOnnxDecodeKeywordStream
void SherpaOnnxDecodeKeywordStream(const SherpaOnnxKeywordSpotter *spotter, const SherpaOnnxOnlineStream *stream)
Decode one ready keyword stream.

SherpaOnnxDestroySpeakerEmbeddingManager
void SherpaOnnxDestroySpeakerEmbeddingManager(const SherpaOnnxSpeakerEmbeddingManager *p)
Destroy a speaker embedding manager.

SherpaOnnxOfflineSpeakerDiarizationProcessWithCallback
const SherpaOnnxOfflineSpeakerDiarizationResult * SherpaOnnxOfflineSpeakerDiarizationProcessWithCallback(const SherpaOnnxOfflineSpeakerDiarization *sd, const float *samples, int32_t n, SherpaOnnxOfflineSpeakerDiarizationProgressCallback callback, void *arg)
Run offline speaker diarization with a progress callback.

SherpaOnnxLinearResamplerResample
const SherpaOnnxResampleOut * SherpaOnnxLinearResamplerResample(const SherpaOnnxLinearResampler *p, const float *input, int32_t input_dim, int32_t flush)
Resample one chunk of input audio.

SherpaOnnxOfflineStream
struct SherpaOnnxOfflineStream SherpaOnnxOfflineStream
Non-streaming decoding state for one utterance.
Definition c-api.h:1199

SHERPA_ONNX_API
#define SHERPA_ONNX_API
Definition c-api.h:106

SherpaOnnxOnlinePunctuationFreeText
void SherpaOnnxOnlinePunctuationFreeText(const char *text)
Free a string returned by SherpaOnnxOnlinePunctuationAddPunct().

SherpaOnnxCircularBufferPush
void SherpaOnnxCircularBufferPush(const SherpaOnnxCircularBuffer *buffer, const float *p, int32_t n)
Append samples to a circular buffer.

SherpaOnnxGetOnlineStreamResultAsJson
const char * SherpaOnnxGetOnlineStreamResultAsJson(const SherpaOnnxOnlineRecognizer *recognizer, const SherpaOnnxOnlineStream *stream)
Get the current streaming ASR result as JSON.

SherpaOnnxOnlineSpeechDenoiser
struct SherpaOnnxOnlineSpeechDenoiser SherpaOnnxOnlineSpeechDenoiser
Opaque online speech denoiser handle.
Definition c-api.h:4217

SherpaOnnxCreateOnlinePunctuation
const SherpaOnnxOnlinePunctuation * SherpaOnnxCreateOnlinePunctuation(const SherpaOnnxOnlinePunctuationConfig *config)
Create an online punctuation processor.

SherpaOnnxOnlineStream
struct SherpaOnnxOnlineStream SherpaOnnxOnlineStream
Streaming decoding state for one utterance or stream.
Definition c-api.h:426

SherpaOnnxDestroyLinearResampler
void SherpaOnnxDestroyLinearResampler(const SherpaOnnxLinearResampler *p)
Destroy a linear resampler.

SherpaOnnxOnlineSpeechDenoiserRun
const SherpaOnnxDenoisedAudio * SherpaOnnxOnlineSpeechDenoiserRun(const SherpaOnnxOnlineSpeechDenoiser *sd, const float *samples, int32_t n, int32_t sample_rate)
Process one chunk of streaming audio.

SherpaOnnxCreateOfflineSourceSeparation
const SherpaOnnxOfflineSourceSeparation * SherpaOnnxCreateOfflineSourceSeparation(const SherpaOnnxOfflineSourceSeparationConfig *config)
Create a source-separation engine.

SherpaOnnxDestroyOfflineRecognizer
void SherpaOnnxDestroyOfflineRecognizer(const SherpaOnnxOfflineRecognizer *recognizer)
Destroy a non-streaming recognizer.

SherpaOnnxLinearResamplerReset
void SherpaOnnxLinearResamplerReset(const SherpaOnnxLinearResampler *p)
Reset a linear resampler to its initial state.

SherpaOnnxDestroyOnlineRecognizerResult
void SherpaOnnxDestroyOnlineRecognizerResult(const SherpaOnnxOnlineRecognizerResult *r)
Destroy a result returned by SherpaOnnxGetOnlineStreamResult().

SherpaOnnxAudioTaggingCompute
const SherpaOnnxAudioEvent *const * SherpaOnnxAudioTaggingCompute(const SherpaOnnxAudioTagging *tagger, const SherpaOnnxOfflineStream *s, int32_t top_k)
Run audio tagging on an offline stream.

SherpaOnnxLinearResamplerResampleFree
void SherpaOnnxLinearResamplerResampleFree(const SherpaOnnxResampleOut *p)
Destroy a resampler output chunk.

SherpaOnnxOfflineSourceSeparationGetOutputSampleRate
int32_t SherpaOnnxOfflineSourceSeparationGetOutputSampleRate(const SherpaOnnxOfflineSourceSeparation *ss)
Return the output sample rate of the source-separation engine.

SherpaOnnxDecodeMultipleKeywordStreams
void SherpaOnnxDecodeMultipleKeywordStreams(const SherpaOnnxKeywordSpotter *spotter, const SherpaOnnxOnlineStream **streams, int32_t n)
Decode multiple ready keyword streams in parallel.

SherpaOnnxCircularBufferSize
int32_t SherpaOnnxCircularBufferSize(const SherpaOnnxCircularBuffer *buffer)
Return the number of currently stored samples.

SherpaOnnxVoiceActivityDetectorReset
void SherpaOnnxVoiceActivityDetectorReset(const SherpaOnnxVoiceActivityDetector *p)
Reset a voice activity detector so it can process a new stream.

SherpaOnnxCreateOnlineSpeechDenoiser
const SherpaOnnxOnlineSpeechDenoiser * SherpaOnnxCreateOnlineSpeechDenoiser(const SherpaOnnxOnlineSpeechDenoiserConfig *config)
Create an online speech denoiser.

SherpaOnnxGeneratedAudioProgressCallback
int32_t(* SherpaOnnxGeneratedAudioProgressCallback)(const float *samples, int32_t n, float p)
Progress callback invoked during incremental generation.
Definition c-api.h:2496

SherpaOnnxDestroyOfflineTtsGeneratedAudio
void SherpaOnnxDestroyOfflineTtsGeneratedAudio(const SherpaOnnxGeneratedAudio *p)
Destroy audio returned by a TTS generation API.

SherpaOnnxAudioTaggingCreateOfflineStream
const SherpaOnnxOfflineStream * SherpaOnnxAudioTaggingCreateOfflineStream(const SherpaOnnxAudioTagging *tagger)
Create an offline stream for audio tagging.

SherpaOfflinePunctuationAddPunct
const char * SherpaOfflinePunctuationAddPunct(const SherpaOnnxOfflinePunctuation *punct, const char *text)
Add punctuation to a complete input text.

SherpaOnnxVoiceActivityDetectorEmpty
int32_t SherpaOnnxVoiceActivityDetectorEmpty(const SherpaOnnxVoiceActivityDetector *p)
Check whether the detector currently has any completed speech segment.

SherpaOnnxIsOnlineStreamReady
int32_t SherpaOnnxIsOnlineStreamReady(const SherpaOnnxOnlineRecognizer *recognizer, const SherpaOnnxOnlineStream *stream)
Check whether a streaming ASR stream is ready to decode.

SherpaOnnxSpeakerEmbeddingExtractorIsReady
int32_t SherpaOnnxSpeakerEmbeddingExtractorIsReady(const SherpaOnnxSpeakerEmbeddingExtractor *p, const SherpaOnnxOnlineStream *s)
Check whether enough audio has been provided to compute an embedding.

SherpaOnnxCircularBufferPop
void SherpaOnnxCircularBufferPop(const SherpaOnnxCircularBuffer *buffer, int32_t n)
Drop samples from the front of a circular buffer.

SherpaOnnxOnlineSpeechDenoiserGetFrameShiftInSamples
int32_t SherpaOnnxOnlineSpeechDenoiserGetFrameShiftInSamples(const SherpaOnnxOnlineSpeechDenoiser *sd)
Return the recommended chunk size in samples for streaming input.

SherpaOnnxSpeakerEmbeddingManagerFreeSearch
void SherpaOnnxSpeakerEmbeddingManagerFreeSearch(const char *name)
Free a string returned by SherpaOnnxSpeakerEmbeddingManagerSearch().

SherpaOnnxDestroySpeakerEmbeddingExtractor
void SherpaOnnxDestroySpeakerEmbeddingExtractor(const SherpaOnnxSpeakerEmbeddingExtractor *p)
Destroy a speaker embedding extractor.

SherpaOnnxCreateOfflineSpeakerDiarization
const SherpaOnnxOfflineSpeakerDiarization * SherpaOnnxCreateOfflineSpeakerDiarization(const SherpaOnnxOfflineSpeakerDiarizationConfig *config)
Create an offline speaker diarization pipeline.

SherpaOnnxOfflineRecognizer
struct SherpaOnnxOfflineRecognizer SherpaOnnxOfflineRecognizer
Non-streaming recognizer handle.
Definition c-api.h:1196

SherpaOnnxSpeakerEmbeddingManagerSearch
const char * SherpaOnnxSpeakerEmbeddingManagerSearch(const SherpaOnnxSpeakerEmbeddingManager *p, const float *v, float threshold)
Search for the best matching enrolled speaker.

SherpaOnnxOfflineSpeakerDiarizationDestroyResult
void SherpaOnnxOfflineSpeakerDiarizationDestroyResult(const SherpaOnnxOfflineSpeakerDiarizationResult *r)
Destroy a diarization result.

SherpaOnnxCreateSpeakerEmbeddingManager
const SherpaOnnxSpeakerEmbeddingManager * SherpaOnnxCreateSpeakerEmbeddingManager(int32_t dim)
Create a speaker embedding manager.

SherpaOnnxLinearResamplerResampleGetOutputSampleRate
int32_t SherpaOnnxLinearResamplerResampleGetOutputSampleRate(const SherpaOnnxLinearResampler *p)
Return the resampler output sample rate.

SherpaOnnxOfflineTtsGenerateWithProgressCallback
const SherpaOnnxGeneratedAudio * SherpaOnnxOfflineTtsGenerateWithProgressCallback(const SherpaOnnxOfflineTts *tts, const char *text, int32_t sid, float speed, SherpaOnnxGeneratedAudioProgressCallback callback)
Generate speech with a progress callback.

SherpaOnnxDestroyAudioTagging
void SherpaOnnxDestroyAudioTagging(const SherpaOnnxAudioTagging *tagger)
Destroy an audio tagger.

SherpaOnnxOfflineTtsSampleRate
int32_t SherpaOnnxOfflineTtsSampleRate(const SherpaOnnxOfflineTts *tts)
Return the output sample rate of a TTS engine.

SherpaOnnxOfflineSpeakerDiarizationSetConfig
void SherpaOnnxOfflineSpeakerDiarizationSetConfig(const SherpaOnnxOfflineSpeakerDiarization *sd, const SherpaOnnxOfflineSpeakerDiarizationConfig *config)
Update clustering-related settings of an existing diarizer.

SherpaOnnxDestroyCircularBuffer
void SherpaOnnxDestroyCircularBuffer(const SherpaOnnxCircularBuffer *buffer)
Destroy a circular buffer.

SherpaOnnxDestroyOfflineStreamResultJson
void SherpaOnnxDestroyOfflineStreamResultJson(const char *s)
Free a JSON string returned by SherpaOnnxGetOfflineStreamResultAsJson().

SherpaOnnxOfflineTtsGenerateWithCallback
const SherpaOnnxGeneratedAudio * SherpaOnnxOfflineTtsGenerateWithCallback(const SherpaOnnxOfflineTts *tts, const char *text, int32_t sid, float speed, SherpaOnnxGeneratedAudioCallback callback)
Generate speech and receive incremental audio chunks through a callback.

SherpaOnnxOfflineSpeakerDiarizationGetSampleRate
int32_t SherpaOnnxOfflineSpeakerDiarizationGetSampleRate(const SherpaOnnxOfflineSpeakerDiarization *sd)
Return the expected input sample rate.

SherpaOnnxAcceptWaveformOffline
void SherpaOnnxAcceptWaveformOffline(const SherpaOnnxOfflineStream *stream, int32_t sample_rate, const float *samples, int32_t n)
Provide the full utterance to an offline ASR stream.

SherpaOnnxSpeakerEmbeddingManagerGetAllSpeakers
const char *const * SherpaOnnxSpeakerEmbeddingManagerGetAllSpeakers(const SherpaOnnxSpeakerEmbeddingManager *p)
Return all enrolled speaker names.

SherpaOnnxGetOnlineStreamResult
const SherpaOnnxOnlineRecognizerResult * SherpaOnnxGetOnlineStreamResult(const SherpaOnnxOnlineRecognizer *recognizer, const SherpaOnnxOnlineStream *stream)
Get the current streaming ASR result for a stream.

SherpaOnnxSpeakerEmbeddingManager
struct SherpaOnnxSpeakerEmbeddingManager SherpaOnnxSpeakerEmbeddingManager
Opaque speaker embedding manager handle.
Definition c-api.h:3204

SherpaOnnxKeywordSpotter
struct SherpaOnnxKeywordSpotter SherpaOnnxKeywordSpotter
Opaque keyword spotter handle.
Definition c-api.h:1707

SherpaOnnxSpeakerEmbeddingManagerContains
int32_t SherpaOnnxSpeakerEmbeddingManagerContains(const SherpaOnnxSpeakerEmbeddingManager *p, const char *name)
Check whether a speaker is enrolled.

SherpaOnnxOfflineStreamHasOption
int32_t SherpaOnnxOfflineStreamHasOption(const SherpaOnnxOfflineStream *stream, const char *key)
Check whether a per-stream runtime option exists.

SherpaOnnxDestroyOnlineRecognizer
void SherpaOnnxDestroyOnlineRecognizer(const SherpaOnnxOnlineRecognizer *recognizer)
Destroy a streaming recognizer.

SherpaOnnxWriteWaveToBuffer
void SherpaOnnxWriteWaveToBuffer(const float *samples, int32_t n, int32_t sample_rate, char *buffer)
Write a mono 16-bit WAVE file to a caller-provided buffer.

SherpaOnnxSpeakerEmbeddingManagerVerify
int32_t SherpaOnnxSpeakerEmbeddingManagerVerify(const SherpaOnnxSpeakerEmbeddingManager *p, const char *name, const float *v, float threshold)
Verify whether a query embedding matches a named speaker.

SherpaOnnxOnlinePunctuation
struct SherpaOnnxOnlinePunctuation SherpaOnnxOnlinePunctuation
Opaque online punctuation handle.
Definition c-api.h:3674

SherpaOnnxCreateOfflineStreamWithHotwords
const SherpaOnnxOfflineStream * SherpaOnnxCreateOfflineStreamWithHotwords(const SherpaOnnxOfflineRecognizer *recognizer, const char *hotwords)
Create a non-streaming ASR input stream with per-stream hotwords.

SherpaOnnxCircularBufferHead
int32_t SherpaOnnxCircularBufferHead(const SherpaOnnxCircularBuffer *buffer)
Return the current head index of the buffer timeline.

SherpaOnnxOnlineRecognizer
struct SherpaOnnxOnlineRecognizer SherpaOnnxOnlineRecognizer
Streaming recognizer handle.
Definition c-api.h:424

SherpaOnnxDestroyOfflineSpeechDenoiser
void SherpaOnnxDestroyOfflineSpeechDenoiser(const SherpaOnnxOfflineSpeechDenoiser *sd)
Destroy an offline speech denoiser.

SherpaOnnxOnlineStreamIsEndpoint
int32_t SherpaOnnxOnlineStreamIsEndpoint(const SherpaOnnxOnlineRecognizer *recognizer, const SherpaOnnxOnlineStream *stream)
Check whether endpoint detection has triggered for a stream.

SherpaOnnxOfflineTtsGenerate
const SherpaOnnxGeneratedAudio * SherpaOnnxOfflineTtsGenerate(const SherpaOnnxOfflineTts *tts, const char *text, int32_t sid, float speed)
Generate speech from text using the simple sid/speed interface.

SherpaOnnxSpeakerEmbeddingManagerFreeAllSpeakers
void SherpaOnnxSpeakerEmbeddingManagerFreeAllSpeakers(const char *const *names)
Free an array returned by SherpaOnnxSpeakerEmbeddingManagerGetAllSpeakers().

SherpaOnnxOfflineSpeechDenoiserRun
const SherpaOnnxDenoisedAudio * SherpaOnnxOfflineSpeechDenoiserRun(const SherpaOnnxOfflineSpeechDenoiser *sd, const float *samples, int32_t n, int32_t sample_rate)
Run offline speech denoising on a complete waveform.

SherpaOnnxDestroySourceSeparationOutput
void SherpaOnnxDestroySourceSeparationOutput(const SherpaOnnxSourceSeparationOutput *p)
Destroy the output of a source-separation run.

SherpaOnnxCreateKeywordSpotter
const SherpaOnnxKeywordSpotter * SherpaOnnxCreateKeywordSpotter(const SherpaOnnxKeywordSpotterConfig *config)
Create a keyword spotter.

SherpaOnnxVoiceActivityDetectorPop
void SherpaOnnxVoiceActivityDetectorPop(const SherpaOnnxVoiceActivityDetector *p)
Remove the front speech segment from the detector queue.

SherpaOnnxCircularBuffer
struct SherpaOnnxCircularBuffer SherpaOnnxCircularBuffer
Opaque circular-buffer handle used by helper APIs.
Definition c-api.h:1963

SherpaOnnxDestroyKeywordResult
void SherpaOnnxDestroyKeywordResult(const SherpaOnnxKeywordResult *r)
Destroy a keyword result snapshot.

SherpaOnnxOfflineStreamSetOption
void SherpaOnnxOfflineStreamSetOption(const SherpaOnnxOfflineStream *stream, const char *key, const char *value)
Set a per-stream runtime option for offline ASR.

SherpaOnnxOfflineSpeakerDiarizationResultGetNumSpeakers
int32_t SherpaOnnxOfflineSpeakerDiarizationResultGetNumSpeakers(const SherpaOnnxOfflineSpeakerDiarizationResult *r)
Return the number of speakers in a diarization result.

SherpaOnnxCreateKeywordStreamWithKeywords
const SherpaOnnxOnlineStream * SherpaOnnxCreateKeywordStreamWithKeywords(const SherpaOnnxKeywordSpotter *spotter, const char *keywords)
Create a keyword spotting stream with extra or replacement keywords.

SherpaOnnxDestroyDisplay
void SherpaOnnxDestroyDisplay(const SherpaOnnxDisplay *display)
Destroy a display helper.

SherpaOnnxReadWaveFromBinaryData
const SherpaOnnxWave * SherpaOnnxReadWaveFromBinaryData(const char *data, int32_t n)
Read a mono 16-bit PCM WAVE file from binary memory.

SherpaOnnxDestroyOfflineRecognizerResult
void SherpaOnnxDestroyOfflineRecognizerResult(const SherpaOnnxOfflineRecognizerResult *r)
Destroy a result returned by SherpaOnnxGetOfflineStreamResult().

SherpaOnnxSpeakerEmbeddingManagerGetBestMatches
const SherpaOnnxSpeakerEmbeddingManagerBestMatchesResult * SherpaOnnxSpeakerEmbeddingManagerGetBestMatches(const SherpaOnnxSpeakerEmbeddingManager *p, const float *v, float threshold, int32_t n)
Return up to n best matches above a similarity threshold.

SherpaOnnxOfflineTts
struct SherpaOnnxOfflineTts SherpaOnnxOfflineTts
Opaque offline TTS handle.
Definition c-api.h:2507

SherpaOnnxDecodeMultipleOnlineStreams
void SherpaOnnxDecodeMultipleOnlineStreams(const SherpaOnnxOnlineRecognizer *recognizer, const SherpaOnnxOnlineStream **streams, int32_t n)
Decode multiple streaming ASR streams in parallel.

SherpaOnnxFileExists
int32_t SherpaOnnxFileExists(const char *filename)
Check whether a file exists.

SherpaOnnxOfflineSpeakerDiarizationResult
struct SherpaOnnxOfflineSpeakerDiarizationResult SherpaOnnxOfflineSpeakerDiarizationResult
Opaque offline speaker diarization result.
Definition c-api.h:3938

SherpaOfflinePunctuationFreeText
void SherpaOfflinePunctuationFreeText(const char *text)
Free a string returned by SherpaOfflinePunctuationAddPunct().

SherpaOnnxFreeKeywordResultJson
void SherpaOnnxFreeKeywordResultJson(const char *s)
Free a JSON string returned by SherpaOnnxGetKeywordResultAsJson().

SherpaOnnxCreateDisplay
const SherpaOnnxDisplay * SherpaOnnxCreateDisplay(int32_t max_word_per_line)
Create a display helper.

SherpaOnnxCreateSpokenLanguageIdentification
const SherpaOnnxSpokenLanguageIdentification * SherpaOnnxCreateSpokenLanguageIdentification(const SherpaOnnxSpokenLanguageIdentificationConfig *config)
Create a spoken-language identifier.

SherpaOnnxOfflineSpeakerDiarizationDestroySegment
void SherpaOnnxOfflineSpeakerDiarizationDestroySegment(const SherpaOnnxOfflineSpeakerDiarizationSegment *s)
Destroy a segment array returned by SherpaOnnxOfflineSpeakerDiarizationResultSortByStartTime().

SherpaOnnxDestroyOfflineSourceSeparation
void SherpaOnnxDestroyOfflineSourceSeparation(const SherpaOnnxOfflineSourceSeparation *ss)
Destroy a source-separation engine.

SherpaOnnxCreateOfflineStream
const SherpaOnnxOfflineStream * SherpaOnnxCreateOfflineStream(const SherpaOnnxOfflineRecognizer *recognizer)
Create a non-streaming ASR input stream.

SherpaOnnxOfflineTtsGenerateWithConfig
const SherpaOnnxGeneratedAudio * SherpaOnnxOfflineTtsGenerateWithConfig(const SherpaOnnxOfflineTts *tts, const char *text, const SherpaOnnxGenerationConfig *config, SherpaOnnxGeneratedAudioProgressCallbackWithArg callback, void *arg)
Generate speech using the advanced configuration interface.

SherpaOnnxLinearResampler
struct SherpaOnnxLinearResampler SherpaOnnxLinearResampler
Opaque linear resampler handle.
Definition c-api.h:3723

SherpaOnnxDecodeMultipleOfflineStreams
void SherpaOnnxDecodeMultipleOfflineStreams(const SherpaOnnxOfflineRecognizer *recognizer, const SherpaOnnxOfflineStream **streams, int32_t n)
Run offline ASR on multiple streams in parallel.

SherpaOnnxCircularBufferReset
void SherpaOnnxCircularBufferReset(const SherpaOnnxCircularBuffer *buffer)
Clear a circular buffer and reset its head index.

SherpaOnnxCircularBufferFree
void SherpaOnnxCircularBufferFree(const float *p)
Free an array returned by SherpaOnnxCircularBufferGet().

SherpaOnnxOnlineSpeechDenoiserGetSampleRate
int32_t SherpaOnnxOnlineSpeechDenoiserGetSampleRate(const SherpaOnnxOnlineSpeechDenoiser *sd)
Return the expected input sample rate for the online denoiser.

SherpaOnnxVoiceActivityDetectorAcceptWaveform
void SherpaOnnxVoiceActivityDetectorAcceptWaveform(const SherpaOnnxVoiceActivityDetector *p, const float *samples, int32_t n)
Feed audio samples to the VAD.

SherpaOnnxSpokenLanguageIdentificationCompute
const SherpaOnnxSpokenLanguageIdentificationResult * SherpaOnnxSpokenLanguageIdentificationCompute(const SherpaOnnxSpokenLanguageIdentification *slid, const SherpaOnnxOfflineStream *s)
Run spoken-language identification on an offline stream.

SherpaOnnxOfflineSourceSeparation
struct SherpaOnnxOfflineSourceSeparation SherpaOnnxOfflineSourceSeparation
Opaque source-separation engine handle.
Definition c-api.h:4331

SherpaOnnxOfflineSpeakerDiarization
struct SherpaOnnxOfflineSpeakerDiarization SherpaOnnxOfflineSpeakerDiarization
Opaque offline speaker diarization handle.
Definition c-api.h:3892

SherpaOnnxSpeakerEmbeddingExtractorCreateStream
const SherpaOnnxOnlineStream * SherpaOnnxSpeakerEmbeddingExtractorCreateStream(const SherpaOnnxSpeakerEmbeddingExtractor *p)
Create a streaming feature buffer for embedding extraction.

SherpaOnnxOnlineSpeechDenoiserFlush
const SherpaOnnxDenoisedAudio * SherpaOnnxOnlineSpeechDenoiserFlush(const SherpaOnnxOnlineSpeechDenoiser *sd)
Flush buffered samples and reset the online denoiser.

SherpaOnnxDestroySpeechSegment
void SherpaOnnxDestroySpeechSegment(const SherpaOnnxSpeechSegment *p)
Destroy a speech segment returned by SherpaOnnxVoiceActivityDetectorFront().

SherpaOnnxDestroyOnlineStream
void SherpaOnnxDestroyOnlineStream(const SherpaOnnxOnlineStream *stream)
Destroy a streaming ASR state object.

SherpaOnnxDestroyVoiceActivityDetector
void SherpaOnnxDestroyVoiceActivityDetector(const SherpaOnnxVoiceActivityDetector *p)
Destroy a voice activity detector.

SherpaOnnxCreateOnlineStreamWithHotwords
const SherpaOnnxOnlineStream * SherpaOnnxCreateOnlineStreamWithHotwords(const SherpaOnnxOnlineRecognizer *recognizer, const char *hotwords)
Create a streaming ASR state object with per-stream hotwords.

SherpaOnnxVoiceActivityDetectorClear
void SherpaOnnxVoiceActivityDetectorClear(const SherpaOnnxVoiceActivityDetector *p)
Remove all queued speech segments.

SherpaOnnxCreateVoiceActivityDetector
const SherpaOnnxVoiceActivityDetector * SherpaOnnxCreateVoiceActivityDetector(const SherpaOnnxVadModelConfig *config, float buffer_size_in_seconds)
Create a voice activity detector.

SherpaOnnxOfflineSourceSeparationProcess
const SherpaOnnxSourceSeparationOutput * SherpaOnnxOfflineSourceSeparationProcess(const SherpaOnnxOfflineSourceSeparation *ss, const float *const *samples, int32_t num_channels, int32_t num_samples, int32_t sample_rate)
Run source separation on multi-channel audio.

SherpaOnnxWaveFileSize
int64_t SherpaOnnxWaveFileSize(int32_t n_samples)
Return the number of bytes needed for a mono 16-bit WAVE file.

SherpaOnnxSpokenLanguageIdentificationCreateOfflineStream
SherpaOnnxOfflineStream * SherpaOnnxSpokenLanguageIdentificationCreateOfflineStream(const SherpaOnnxSpokenLanguageIdentification *slid)
Create an offline stream for spoken-language identification.

SherpaOnnxGetGitSha1
const char * SherpaOnnxGetGitSha1()
Return the Git SHA1 used to build the library.

SherpaOnnxCreateKeywordStream
const SherpaOnnxOnlineStream * SherpaOnnxCreateKeywordStream(const SherpaOnnxKeywordSpotter *spotter)
Create a keyword spotting stream using the spotter's built-in keyword list.

SherpaOnnxOfflineTtsNumSpeakers
int32_t SherpaOnnxOfflineTtsNumSpeakers(const SherpaOnnxOfflineTts *tts)
Return the number of available speaker IDs.

SherpaOnnxOfflineSpeakerDiarizationResultSortByStartTime
const SherpaOnnxOfflineSpeakerDiarizationSegment * SherpaOnnxOfflineSpeakerDiarizationResultSortByStartTime(const SherpaOnnxOfflineSpeakerDiarizationResult *r)
Return segments sorted by start time.

SherpaOnnxOnlineStreamReset
void SherpaOnnxOnlineStreamReset(const SherpaOnnxOnlineRecognizer *recognizer, const SherpaOnnxOnlineStream *stream)
Reset a streaming ASR stream after an endpoint or utterance boundary.

SherpaOnnxDestroySpokenLanguageIdentificationResult
void SherpaOnnxDestroySpokenLanguageIdentificationResult(const SherpaOnnxSpokenLanguageIdentificationResult *r)
Destroy a spoken-language identification result.

SherpaOnnxCreateOfflineSpeechDenoiser
const SherpaOnnxOfflineSpeechDenoiser * SherpaOnnxCreateOfflineSpeechDenoiser(const SherpaOnnxOfflineSpeechDenoiserConfig *config)
Create an offline speech denoiser.

SherpaOnnxSpeakerEmbeddingExtractor
struct SherpaOnnxSpeakerEmbeddingExtractor SherpaOnnxSpeakerEmbeddingExtractor
Opaque speaker embedding extractor handle.
Definition c-api.h:3099

SherpaOnnxDestroyOnlinePunctuation
void SherpaOnnxDestroyOnlinePunctuation(const SherpaOnnxOnlinePunctuation *punctuation)
Destroy an online punctuation processor.

SherpaOnnxGeneratedAudioCallbackWithArg
int32_t(* SherpaOnnxGeneratedAudioCallbackWithArg)(const float *samples, int32_t n, void *arg)
Same as SherpaOnnxGeneratedAudioCallback but with an extra user pointer.
Definition c-api.h:2484

SherpaOnnxAudioTagging
struct SherpaOnnxAudioTagging SherpaOnnxAudioTagging
Opaque audio tagger handle.
Definition c-api.h:3493

SherpaOnnxOnlineStreamHasOption
int32_t SherpaOnnxOnlineStreamHasOption(const SherpaOnnxOnlineStream *stream, const char *key)
Check whether a per-stream runtime option exists.

SherpaOnnxDisplay
struct SherpaOnnxDisplay SherpaOnnxDisplay
Helper for pretty-printing incremental recognition results.
Definition c-api.h:788

SherpaOnnxCreateAudioTagging
const SherpaOnnxAudioTagging * SherpaOnnxCreateAudioTagging(const SherpaOnnxAudioTaggingConfig *config)
Create an audio tagger.

SherpaOnnxOnlineStreamInputFinished
void SherpaOnnxOnlineStreamInputFinished(const SherpaOnnxOnlineStream *stream)
Signal end-of-input for a streaming ASR stream.

SherpaOnnxDestroyOfflinePunctuation
void SherpaOnnxDestroyOfflinePunctuation(const SherpaOnnxOfflinePunctuation *punct)
Destroy an offline punctuation processor.

SherpaOnnxOfflineTtsGenerateWithProgressCallbackWithArg
const SherpaOnnxGeneratedAudio * SherpaOnnxOfflineTtsGenerateWithProgressCallbackWithArg(const SherpaOnnxOfflineTts *tts, const char *text, int32_t sid, float speed, SherpaOnnxGeneratedAudioProgressCallbackWithArg callback, void *arg)
Generate speech with a progress callback that receives a user pointer.

SherpaOnnxWriteWave
int32_t SherpaOnnxWriteWave(const float *samples, int32_t n, int32_t sample_rate, const char *filename)
Write floating-point PCM to a mono 16-bit WAVE file.

SherpaOnnxCreateOnlineStream
const SherpaOnnxOnlineStream * SherpaOnnxCreateOnlineStream(const SherpaOnnxOnlineRecognizer *recognizer)
Create a streaming ASR state object.

SherpaOnnxOfflineTtsGenerateWithCallbackWithArg
const SherpaOnnxGeneratedAudio * SherpaOnnxOfflineTtsGenerateWithCallbackWithArg(const SherpaOnnxOfflineTts *tts, const char *text, int32_t sid, float speed, SherpaOnnxGeneratedAudioCallbackWithArg callback, void *arg)
Same as SherpaOnnxOfflineTtsGenerateWithCallback() but with a user pointer.

SherpaOnnxSpeakerEmbeddingExtractorDim
int32_t SherpaOnnxSpeakerEmbeddingExtractorDim(const SherpaOnnxSpeakerEmbeddingExtractor *p)
Return the embedding dimension produced by the extractor.

SherpaOnnxResetKeywordStream
void SherpaOnnxResetKeywordStream(const SherpaOnnxKeywordSpotter *spotter, const SherpaOnnxOnlineStream *stream)
Reset a keyword stream after a keyword is detected.

SherpaOnnxDecodeOnlineStream
void SherpaOnnxDecodeOnlineStream(const SherpaOnnxOnlineRecognizer *recognizer, const SherpaOnnxOnlineStream *stream)
Decode one step of a streaming ASR stream.

SherpaOnnxGetKeywordResult
const SherpaOnnxKeywordResult * SherpaOnnxGetKeywordResult(const SherpaOnnxKeywordSpotter *spotter, const SherpaOnnxOnlineStream *stream)
Get the current keyword spotting result for a stream.

SherpaOnnxOnlineStreamGetOption
const char * SherpaOnnxOnlineStreamGetOption(const SherpaOnnxOnlineStream *stream, const char *key)
Get a per-stream runtime option.

SherpaOnnxDestroyDenoisedAudio
void SherpaOnnxDestroyDenoisedAudio(const SherpaOnnxDenoisedAudio *p)
Destroy denoised audio returned by a speech enhancement API.

SherpaOnnxOfflinePunctuation
struct SherpaOnnxOfflinePunctuation SherpaOnnxOfflinePunctuation
Opaque offline punctuation handle.
Definition c-api.h:3597

SherpaOnnxOfflineSpeakerDiarizationProcessWithCallbackNoArg
const SherpaOnnxOfflineSpeakerDiarizationResult * SherpaOnnxOfflineSpeakerDiarizationProcessWithCallbackNoArg(const SherpaOnnxOfflineSpeakerDiarization *sd, const float *samples, int32_t n, SherpaOnnxOfflineSpeakerDiarizationProgressCallbackNoArg callback)
Run offline speaker diarization with a progress callback that has no user pointer.

SherpaOnnxSpeakerEmbeddingManagerFreeBestMatches
void SherpaOnnxSpeakerEmbeddingManagerFreeBestMatches(const SherpaOnnxSpeakerEmbeddingManagerBestMatchesResult *r)
Destroy a best-matches result.

SherpaOnnxCreateOnlineRecognizer
const SherpaOnnxOnlineRecognizer * SherpaOnnxCreateOnlineRecognizer(const SherpaOnnxOnlineRecognizerConfig *config)
Create a streaming ASR recognizer.

SherpaOnnxGetGitDate
const char * SherpaOnnxGetGitDate()
Return the Git build date used to build the library.

SherpaOnnxOfflineSourceSeparationGetNumberOfStems
int32_t SherpaOnnxOfflineSourceSeparationGetNumberOfStems(const SherpaOnnxOfflineSourceSeparation *ss)
Return the number of stems produced by the engine.

SherpaOnnxVoiceActivityDetector
struct SherpaOnnxVoiceActivityDetector SherpaOnnxVoiceActivityDetector
Opaque voice activity detector handle.
Definition c-api.h:2082

SherpaOnnxLinearResamplerResampleGetInputSampleRate
int32_t SherpaOnnxLinearResamplerResampleGetInputSampleRate(const SherpaOnnxLinearResampler *p)
Return the resampler input sample rate.

SherpaOnnxCreateCircularBuffer
const SherpaOnnxCircularBuffer * SherpaOnnxCreateCircularBuffer(int32_t capacity)
Create a floating-point circular buffer.

SherpaOnnxGeneratedAudioProgressCallbackWithArg
int32_t(* SherpaOnnxGeneratedAudioProgressCallbackWithArg)(const float *samples, int32_t n, float p, void *arg)
Same as SherpaOnnxGeneratedAudioProgressCallback but with an extra user pointer.
Definition c-api.h:2503

SherpaOnnxGetVersionStr
const char * SherpaOnnxGetVersionStr()
Return the sherpa-onnx version string.

SherpaOnnxWriteWaveMultiChannel
int32_t SherpaOnnxWriteWaveMultiChannel(const float *const *samples, int32_t n, int32_t sample_rate, int32_t num_channels, const char *filename)
Write multi-channel audio to a WAVE file (16-bit PCM).

SherpaOnnxCreateOfflinePunctuation
const SherpaOnnxOfflinePunctuation * SherpaOnnxCreateOfflinePunctuation(const SherpaOnnxOfflinePunctuationConfig *config)
Create an offline punctuation processor.

SherpaOnnxSpeakerEmbeddingManagerAddListFlattened
int32_t SherpaOnnxSpeakerEmbeddingManagerAddListFlattened(const SherpaOnnxSpeakerEmbeddingManager *p, const char *name, const float *v, int32_t n)
Add multiple enrollment embeddings packed in one flat array.

SherpaOnnxPrint
void SherpaOnnxPrint(const SherpaOnnxDisplay *display, int32_t idx, const char *s)
Print one line of text using the display helper.

SherpaOnnxDestroyOfflineTts
void SherpaOnnxDestroyOfflineTts(const SherpaOnnxOfflineTts *tts)
Destroy an offline TTS engine.

SherpaOnnxAudioEvent
One audio-tagging prediction.
Definition c-api.h:3483

SherpaOnnxAudioEvent::prob
float prob
Definition c-api.h:3489

SherpaOnnxAudioEvent::index
int32_t index
Definition c-api.h:3487

SherpaOnnxAudioEvent::name
const char * name
Definition c-api.h:3485

SherpaOnnxAudioTaggingConfig
Configuration for audio tagging.
Definition c-api.h:3470

SherpaOnnxAudioTaggingConfig::model
SherpaOnnxAudioTaggingModelConfig model
Definition c-api.h:3472

SherpaOnnxAudioTaggingConfig::top_k
int32_t top_k
Definition c-api.h:3477

SherpaOnnxAudioTaggingConfig::labels
const char * labels
Definition c-api.h:3474

SherpaOnnxAudioTaggingModelConfig
Audio-tagging model configuration.
Definition c-api.h:3441

SherpaOnnxAudioTaggingModelConfig::zipformer
SherpaOnnxOfflineZipformerAudioTaggingModelConfig zipformer
Definition c-api.h:3443

SherpaOnnxAudioTaggingModelConfig::num_threads
int32_t num_threads
Definition c-api.h:3447

SherpaOnnxAudioTaggingModelConfig::debug
int32_t debug
Definition c-api.h:3449

SherpaOnnxAudioTaggingModelConfig::provider
const char * provider
Definition c-api.h:3451

SherpaOnnxAudioTaggingModelConfig::ced
const char * ced
Definition c-api.h:3445

SherpaOnnxDenoisedAudio
Denoised audio returned by offline or online speech enhancement APIs.
Definition c-api.h:4164

SherpaOnnxDenoisedAudio::n
int32_t n
Definition c-api.h:4168

SherpaOnnxDenoisedAudio::sample_rate
int32_t sample_rate
Definition c-api.h:4170

SherpaOnnxDenoisedAudio::samples
const float * samples
Definition c-api.h:4166

SherpaOnnxFastClusteringConfig
Fast clustering configuration.
Definition c-api.h:3855

SherpaOnnxFastClusteringConfig::threshold
float threshold
Definition c-api.h:3860

SherpaOnnxFastClusteringConfig::num_clusters
int32_t num_clusters
Definition c-api.h:3858

SherpaOnnxFeatureConfig
Feature extraction settings for ASR.
Definition c-api.h:277

SherpaOnnxFeatureConfig::sample_rate
int32_t sample_rate
Definition c-api.h:279

SherpaOnnxFeatureConfig::feature_dim
int32_t feature_dim
Definition c-api.h:282

SherpaOnnxGeneratedAudio
Generated waveform returned by TTS APIs.
Definition c-api.h:2460

SherpaOnnxGeneratedAudio::n
int32_t n
Definition c-api.h:2464

SherpaOnnxGeneratedAudio::sample_rate
int32_t sample_rate
Definition c-api.h:2466

SherpaOnnxGeneratedAudio::samples
const float * samples
Definition c-api.h:2462

SherpaOnnxGenerationConfig
Generation-time parameters shared by advanced TTS APIs.
Definition c-api.h:2717

SherpaOnnxGenerationConfig::reference_text
const char * reference_text
Definition c-api.h:2731

SherpaOnnxGenerationConfig::extra
const char * extra
Definition c-api.h:2735

SherpaOnnxGenerationConfig::reference_audio
const float * reference_audio
Definition c-api.h:2725

SherpaOnnxGenerationConfig::speed
float speed
Definition c-api.h:2721

SherpaOnnxGenerationConfig::sid
int32_t sid
Definition c-api.h:2723

SherpaOnnxGenerationConfig::reference_audio_len
int32_t reference_audio_len
Definition c-api.h:2727

SherpaOnnxGenerationConfig::num_steps
int32_t num_steps
Definition c-api.h:2733

SherpaOnnxGenerationConfig::reference_sample_rate
int32_t reference_sample_rate
Definition c-api.h:2729

SherpaOnnxGenerationConfig::silence_scale
float silence_scale
Definition c-api.h:2719

SherpaOnnxHomophoneReplacerConfig
Configuration for homophone replacement.
Definition c-api.h:294

SherpaOnnxHomophoneReplacerConfig::dict_dir
const char * dict_dir
Definition c-api.h:296

SherpaOnnxHomophoneReplacerConfig::lexicon
const char * lexicon
Definition c-api.h:298

SherpaOnnxHomophoneReplacerConfig::rule_fsts
const char * rule_fsts
Definition c-api.h:300

SherpaOnnxKeywordResult
Snapshot of the current keyword spotting result.
Definition c-api.h:1598

SherpaOnnxKeywordResult::keyword
const char * keyword
Definition c-api.h:1605

SherpaOnnxKeywordResult::count
int32_t count
Definition c-api.h:1622

SherpaOnnxKeywordResult::json
const char * json
Definition c-api.h:1640

SherpaOnnxKeywordResult::timestamps
float * timestamps
Definition c-api.h:1630

SherpaOnnxKeywordResult::tokens_arr
const char *const  * tokens_arr
Definition c-api.h:1619

SherpaOnnxKeywordResult::start_time
float start_time
Definition c-api.h:1633

SherpaOnnxKeywordResult::tokens
const char * tokens
Definition c-api.h:1612

SherpaOnnxKeywordSpotterConfig
Configuration for keyword spotting.
Definition c-api.h:1684

SherpaOnnxKeywordSpotterConfig::max_active_paths
int32_t max_active_paths
Definition c-api.h:1690

SherpaOnnxKeywordSpotterConfig::keywords_threshold
float keywords_threshold
Definition c-api.h:1696

SherpaOnnxKeywordSpotterConfig::model_config
SherpaOnnxOnlineModelConfig model_config
Definition c-api.h:1688

SherpaOnnxKeywordSpotterConfig::feat_config
SherpaOnnxFeatureConfig feat_config
Definition c-api.h:1686

SherpaOnnxKeywordSpotterConfig::keywords_file
const char * keywords_file
Definition c-api.h:1698

SherpaOnnxKeywordSpotterConfig::keywords_buf
const char * keywords_buf
Definition c-api.h:1701

SherpaOnnxKeywordSpotterConfig::keywords_score
float keywords_score
Definition c-api.h:1694

SherpaOnnxKeywordSpotterConfig::keywords_buf_size
int32_t keywords_buf_size
Definition c-api.h:1703

SherpaOnnxKeywordSpotterConfig::num_trailing_blanks
int32_t num_trailing_blanks
Definition c-api.h:1692

SherpaOnnxMultiChannelWave
Decoded multi-channel WAVE file content.
Definition c-api.h:2894

SherpaOnnxMultiChannelWave::num_samples
int32_t num_samples
Definition c-api.h:2903

SherpaOnnxMultiChannelWave::samples
const float *const  * samples
Definition c-api.h:2899

SherpaOnnxMultiChannelWave::sample_rate
int32_t sample_rate
Definition c-api.h:2905

SherpaOnnxMultiChannelWave::num_channels
int32_t num_channels
Definition c-api.h:2901

SherpaOnnxOfflineCanaryModelConfig
Configuration for a Canary model.
Definition c-api.h:875

SherpaOnnxOfflineCanaryModelConfig::tgt_lang
const char * tgt_lang
Definition c-api.h:883

SherpaOnnxOfflineCanaryModelConfig::encoder
const char * encoder
Definition c-api.h:877

SherpaOnnxOfflineCanaryModelConfig::use_pnc
int32_t use_pnc
Definition c-api.h:885

SherpaOnnxOfflineCanaryModelConfig::src_lang
const char * src_lang
Definition c-api.h:881

SherpaOnnxOfflineCanaryModelConfig::decoder
const char * decoder
Definition c-api.h:879

SherpaOnnxOfflineCohereTranscribeModelConfig
Configuration for a Cohere Transcribe model.
Definition c-api.h:889

SherpaOnnxOfflineCohereTranscribeModelConfig::encoder
const char * encoder
Definition c-api.h:891

SherpaOnnxOfflineCohereTranscribeModelConfig::language
const char * language
Definition c-api.h:895

SherpaOnnxOfflineCohereTranscribeModelConfig::use_itn
int32_t use_itn
Definition c-api.h:899

SherpaOnnxOfflineCohereTranscribeModelConfig::use_punct
int32_t use_punct
Definition c-api.h:897

SherpaOnnxOfflineCohereTranscribeModelConfig::decoder
const char * decoder
Definition c-api.h:893

SherpaOnnxOfflineDolphinModelConfig
Configuration for a Dolphin model.
Definition c-api.h:955

SherpaOnnxOfflineDolphinModelConfig::model
const char * model
Definition c-api.h:957

SherpaOnnxOfflineFireRedAsrCtcModelConfig
Configuration for a FireRedAsr CTC model.
Definition c-api.h:911

SherpaOnnxOfflineFireRedAsrCtcModelConfig::model
const char * model
Definition c-api.h:913

SherpaOnnxOfflineFireRedAsrModelConfig
Configuration for a FireRedAsr encoder/decoder model.
Definition c-api.h:903

SherpaOnnxOfflineFireRedAsrModelConfig::decoder
const char * decoder
Definition c-api.h:907

SherpaOnnxOfflineFireRedAsrModelConfig::encoder
const char * encoder
Definition c-api.h:905

SherpaOnnxOfflineFunASRNanoModelConfig
Configuration for an offline FunASR Nano model.
Definition c-api.h:979

SherpaOnnxOfflineFunASRNanoModelConfig::embedding
const char * embedding
Definition c-api.h:985

SherpaOnnxOfflineFunASRNanoModelConfig::max_new_tokens
int32_t max_new_tokens
Definition c-api.h:993

SherpaOnnxOfflineFunASRNanoModelConfig::language
const char * language
Definition c-api.h:1001

SherpaOnnxOfflineFunASRNanoModelConfig::top_p
float top_p
Definition c-api.h:997

SherpaOnnxOfflineFunASRNanoModelConfig::temperature
float temperature
Definition c-api.h:995

SherpaOnnxOfflineFunASRNanoModelConfig::encoder_adaptor
const char * encoder_adaptor
Definition c-api.h:981

SherpaOnnxOfflineFunASRNanoModelConfig::hotwords
const char * hotwords
Definition c-api.h:1005

SherpaOnnxOfflineFunASRNanoModelConfig::itn
int32_t itn
Definition c-api.h:1003

SherpaOnnxOfflineFunASRNanoModelConfig::seed
int32_t seed
Definition c-api.h:999

SherpaOnnxOfflineFunASRNanoModelConfig::user_prompt
const char * user_prompt
Definition c-api.h:991

SherpaOnnxOfflineFunASRNanoModelConfig::llm
const char * llm
Definition c-api.h:983

SherpaOnnxOfflineFunASRNanoModelConfig::tokenizer
const char * tokenizer
Definition c-api.h:987

SherpaOnnxOfflineFunASRNanoModelConfig::system_prompt
const char * system_prompt
Definition c-api.h:989

SherpaOnnxOfflineLMConfig
Configuration for an offline language model.
Definition c-api.h:937

SherpaOnnxOfflineLMConfig::scale
float scale
Definition c-api.h:941

SherpaOnnxOfflineLMConfig::model
const char * model
Definition c-api.h:939

SherpaOnnxOfflineMedAsrCtcModelConfig
Configuration for a MedASR CTC model.
Definition c-api.h:1034

SherpaOnnxOfflineMedAsrCtcModelConfig::model
const char * model
Definition c-api.h:1036

SherpaOnnxOfflineModelConfig
Model configuration shared by offline ASR recognizers.
Definition c-api.h:1056

SherpaOnnxOfflineModelConfig::qwen3_asr
SherpaOnnxOfflineQwen3ASRModelConfig qwen3_asr
Definition c-api.h:1107

SherpaOnnxOfflineModelConfig::paraformer
SherpaOnnxOfflineParaformerModelConfig paraformer
Definition c-api.h:1060

SherpaOnnxOfflineModelConfig::modeling_unit
const char * modeling_unit
Definition c-api.h:1079

SherpaOnnxOfflineModelConfig::dolphin
SherpaOnnxOfflineDolphinModelConfig dolphin
Definition c-api.h:1091

SherpaOnnxOfflineModelConfig::model_type
const char * model_type
Definition c-api.h:1077

SherpaOnnxOfflineModelConfig::canary
SherpaOnnxOfflineCanaryModelConfig canary
Definition c-api.h:1095

SherpaOnnxOfflineModelConfig::moonshine
SherpaOnnxOfflineMoonshineModelConfig moonshine
Definition c-api.h:1087

SherpaOnnxOfflineModelConfig::funasr_nano
SherpaOnnxOfflineFunASRNanoModelConfig funasr_nano
Definition c-api.h:1103

SherpaOnnxOfflineModelConfig::telespeech_ctc
const char * telespeech_ctc
Definition c-api.h:1083

SherpaOnnxOfflineModelConfig::fire_red_asr_ctc
SherpaOnnxOfflineFireRedAsrCtcModelConfig fire_red_asr_ctc
Definition c-api.h:1105

SherpaOnnxOfflineModelConfig::omnilingual
SherpaOnnxOfflineOmnilingualAsrCtcModelConfig omnilingual
Definition c-api.h:1099

SherpaOnnxOfflineModelConfig::sense_voice
SherpaOnnxOfflineSenseVoiceModelConfig sense_voice
Definition c-api.h:1085

SherpaOnnxOfflineModelConfig::provider
const char * provider
Definition c-api.h:1075

SherpaOnnxOfflineModelConfig::num_threads
int32_t num_threads
Definition c-api.h:1071

SherpaOnnxOfflineModelConfig::whisper
SherpaOnnxOfflineWhisperModelConfig whisper
Definition c-api.h:1064

SherpaOnnxOfflineModelConfig::tdnn
SherpaOnnxOfflineTdnnModelConfig tdnn
Definition c-api.h:1066

SherpaOnnxOfflineModelConfig::nemo_ctc
SherpaOnnxOfflineNemoEncDecCtcModelConfig nemo_ctc
Definition c-api.h:1062

SherpaOnnxOfflineModelConfig::medasr
SherpaOnnxOfflineMedAsrCtcModelConfig medasr
Definition c-api.h:1101

SherpaOnnxOfflineModelConfig::bpe_vocab
const char * bpe_vocab
Definition c-api.h:1081

SherpaOnnxOfflineModelConfig::fire_red_asr
SherpaOnnxOfflineFireRedAsrModelConfig fire_red_asr
Definition c-api.h:1089

SherpaOnnxOfflineModelConfig::debug
int32_t debug
Definition c-api.h:1073

SherpaOnnxOfflineModelConfig::cohere_transcribe
SherpaOnnxOfflineCohereTranscribeModelConfig cohere_transcribe
Definition c-api.h:1109

SherpaOnnxOfflineModelConfig::tokens
const char * tokens
Definition c-api.h:1069

SherpaOnnxOfflineModelConfig::zipformer_ctc
SherpaOnnxOfflineZipformerCtcModelConfig zipformer_ctc
Definition c-api.h:1093

SherpaOnnxOfflineModelConfig::transducer
SherpaOnnxOfflineTransducerModelConfig transducer
Definition c-api.h:1058

SherpaOnnxOfflineModelConfig::wenet_ctc
SherpaOnnxOfflineWenetCtcModelConfig wenet_ctc
Definition c-api.h:1097

SherpaOnnxOfflineMoonshineModelConfig
Configuration for a Moonshine model.
Definition c-api.h:917

SherpaOnnxOfflineMoonshineModelConfig::uncached_decoder
const char * uncached_decoder
Definition c-api.h:923

SherpaOnnxOfflineMoonshineModelConfig::encoder
const char * encoder
Definition c-api.h:921

SherpaOnnxOfflineMoonshineModelConfig::preprocessor
const char * preprocessor
Definition c-api.h:919

SherpaOnnxOfflineMoonshineModelConfig::cached_decoder
const char * cached_decoder
Definition c-api.h:925

SherpaOnnxOfflineMoonshineModelConfig::merged_decoder
const char * merged_decoder
Definition c-api.h:927

SherpaOnnxOfflineNemoEncDecCtcModelConfig
Configuration for a non-streaming NeMo CTC model.
Definition c-api.h:847

SherpaOnnxOfflineNemoEncDecCtcModelConfig::model
const char * model
Definition c-api.h:849

SherpaOnnxOfflineOmnilingualAsrCtcModelConfig
Configuration for an omnilingual offline CTC model.
Definition c-api.h:973

SherpaOnnxOfflineOmnilingualAsrCtcModelConfig::model
const char * model
Definition c-api.h:975

SherpaOnnxOfflineParaformerModelConfig
Configuration for a non-streaming Paraformer model.
Definition c-api.h:841

SherpaOnnxOfflineParaformerModelConfig::model
const char * model
Definition c-api.h:843

SherpaOnnxOfflinePunctuationConfig
Configuration for offline punctuation.
Definition c-api.h:3591

SherpaOnnxOfflinePunctuationConfig::model
SherpaOnnxOfflinePunctuationModelConfig model
Definition c-api.h:3593

SherpaOnnxOfflinePunctuationModelConfig
Offline punctuation model configuration.
Definition c-api.h:3579

SherpaOnnxOfflinePunctuationModelConfig::debug
int32_t debug
Definition c-api.h:3585

SherpaOnnxOfflinePunctuationModelConfig::num_threads
int32_t num_threads
Definition c-api.h:3583

SherpaOnnxOfflinePunctuationModelConfig::provider
const char * provider
Definition c-api.h:3587

SherpaOnnxOfflinePunctuationModelConfig::ct_transformer
const char * ct_transformer
Definition c-api.h:3581

SherpaOnnxOfflineQwen3ASRModelConfig
Configuration for an offline Qwen3-ASR model.
Definition c-api.h:1009

SherpaOnnxOfflineQwen3ASRModelConfig::hotwords
const char * hotwords
Definition c-api.h:1030

SherpaOnnxOfflineQwen3ASRModelConfig::max_new_tokens
int32_t max_new_tokens
Definition c-api.h:1021

SherpaOnnxOfflineQwen3ASRModelConfig::conv_frontend
const char * conv_frontend
Definition c-api.h:1011

SherpaOnnxOfflineQwen3ASRModelConfig::temperature
float temperature
Definition c-api.h:1023

SherpaOnnxOfflineQwen3ASRModelConfig::top_p
float top_p
Definition c-api.h:1025

SherpaOnnxOfflineQwen3ASRModelConfig::tokenizer
const char * tokenizer
Definition c-api.h:1017

SherpaOnnxOfflineQwen3ASRModelConfig::max_total_len
int32_t max_total_len
Definition c-api.h:1019

SherpaOnnxOfflineQwen3ASRModelConfig::encoder
const char * encoder
Definition c-api.h:1013

SherpaOnnxOfflineQwen3ASRModelConfig::decoder
const char * decoder
Definition c-api.h:1015

SherpaOnnxOfflineQwen3ASRModelConfig::seed
int32_t seed
Definition c-api.h:1027

SherpaOnnxOfflineRecognizerConfig
Configuration for a non-streaming ASR recognizer.
Definition c-api.h:1166

SherpaOnnxOfflineRecognizerConfig::rule_fars
const char * rule_fars
Definition c-api.h:1187

SherpaOnnxOfflineRecognizerConfig::model_config
SherpaOnnxOfflineModelConfig model_config
Definition c-api.h:1170

SherpaOnnxOfflineRecognizerConfig::hotwords_file
const char * hotwords_file
Definition c-api.h:1180

SherpaOnnxOfflineRecognizerConfig::feat_config
SherpaOnnxFeatureConfig feat_config
Definition c-api.h:1168

SherpaOnnxOfflineRecognizerConfig::blank_penalty
float blank_penalty
Definition c-api.h:1189

SherpaOnnxOfflineRecognizerConfig::hotwords_score
float hotwords_score
Definition c-api.h:1183

SherpaOnnxOfflineRecognizerConfig::hr
SherpaOnnxHomophoneReplacerConfig hr
Definition c-api.h:1192

SherpaOnnxOfflineRecognizerConfig::lm_config
SherpaOnnxOfflineLMConfig lm_config
Definition c-api.h:1172

SherpaOnnxOfflineRecognizerConfig::decoding_method
const char * decoding_method
Definition c-api.h:1175

SherpaOnnxOfflineRecognizerConfig::rule_fsts
const char * rule_fsts
Definition c-api.h:1185

SherpaOnnxOfflineRecognizerConfig::max_active_paths
int32_t max_active_paths
Definition c-api.h:1177

SherpaOnnxOfflineRecognizerResult
Recognition result for a non-streaming ASR stream.
Definition c-api.h:1460

SherpaOnnxOfflineRecognizerResult::timestamps
float * timestamps
Definition c-api.h:1471

SherpaOnnxOfflineRecognizerResult::count
int32_t count
Definition c-api.h:1474

SherpaOnnxOfflineRecognizerResult::segment_texts_arr
const char *const  * segment_texts_arr
Definition c-api.h:1516

SherpaOnnxOfflineRecognizerResult::ys_log_probs
float * ys_log_probs
Definition c-api.h:1502

SherpaOnnxOfflineRecognizerResult::segment_durations
const float * segment_durations
Definition c-api.h:1510

SherpaOnnxOfflineRecognizerResult::segment_timestamps
const float * segment_timestamps
Definition c-api.h:1506

SherpaOnnxOfflineRecognizerResult::segment_count
int32_t segment_count
Definition c-api.h:1519

SherpaOnnxOfflineRecognizerResult::tokens_arr
const char *const  * tokens_arr
Definition c-api.h:1484

SherpaOnnxOfflineRecognizerResult::segment_texts
const char * segment_texts
Definition c-api.h:1513

SherpaOnnxOfflineRecognizerResult::json
const char * json
Definition c-api.h:1487

SherpaOnnxOfflineRecognizerResult::event
const char * event
Definition c-api.h:1496

SherpaOnnxOfflineRecognizerResult::tokens
const char * tokens
Definition c-api.h:1481

SherpaOnnxOfflineRecognizerResult::emotion
const char * emotion
Definition c-api.h:1493

SherpaOnnxOfflineRecognizerResult::lang
const char * lang
Definition c-api.h:1490

SherpaOnnxOfflineRecognizerResult::durations
float * durations
Definition c-api.h:1499

SherpaOnnxOfflineRecognizerResult::text
const char * text
Definition c-api.h:1462

SherpaOnnxOfflineSenseVoiceModelConfig
Configuration for a SenseVoice model.
Definition c-api.h:945

SherpaOnnxOfflineSenseVoiceModelConfig::language
const char * language
Definition c-api.h:949

SherpaOnnxOfflineSenseVoiceModelConfig::use_itn
int32_t use_itn
Definition c-api.h:951

SherpaOnnxOfflineSenseVoiceModelConfig::model
const char * model
Definition c-api.h:947

SherpaOnnxOfflineSourceSeparationConfig
Top-level source-separation configuration.
Definition c-api.h:4326

SherpaOnnxOfflineSourceSeparationConfig::model
SherpaOnnxOfflineSourceSeparationModelConfig model
Definition c-api.h:4327

SherpaOnnxOfflineSourceSeparationModelConfig
Source-separation model configuration.
Definition c-api.h:4317

SherpaOnnxOfflineSourceSeparationModelConfig::uvr
SherpaOnnxOfflineSourceSeparationUvrModelConfig uvr
Definition c-api.h:4319

SherpaOnnxOfflineSourceSeparationModelConfig::spleeter
SherpaOnnxOfflineSourceSeparationSpleeterModelConfig spleeter
Definition c-api.h:4318

SherpaOnnxOfflineSourceSeparationModelConfig::provider
const char * provider
Definition c-api.h:4322

SherpaOnnxOfflineSourceSeparationModelConfig::num_threads
int32_t num_threads
Definition c-api.h:4320

SherpaOnnxOfflineSourceSeparationModelConfig::debug
int32_t debug
Definition c-api.h:4321

SherpaOnnxOfflineSourceSeparationSpleeterModelConfig
Spleeter source-separation model configuration.
Definition c-api.h:4303

SherpaOnnxOfflineSourceSeparationSpleeterModelConfig::accompaniment
const char * accompaniment
Definition c-api.h:4307

SherpaOnnxOfflineSourceSeparationSpleeterModelConfig::vocals
const char * vocals
Definition c-api.h:4305

SherpaOnnxOfflineSourceSeparationUvrModelConfig
UVR (MDX-Net) source-separation model configuration.
Definition c-api.h:4311

SherpaOnnxOfflineSourceSeparationUvrModelConfig::model
const char * model
Definition c-api.h:4313

SherpaOnnxOfflineSpeakerDiarizationConfig
Configuration for offline speaker diarization.
Definition c-api.h:3878

SherpaOnnxOfflineSpeakerDiarizationConfig::clustering
SherpaOnnxFastClusteringConfig clustering
Definition c-api.h:3884

SherpaOnnxOfflineSpeakerDiarizationConfig::min_duration_off
float min_duration_off
Definition c-api.h:3888

SherpaOnnxOfflineSpeakerDiarizationConfig::min_duration_on
float min_duration_on
Definition c-api.h:3886

SherpaOnnxOfflineSpeakerDiarizationConfig::embedding
SherpaOnnxSpeakerEmbeddingExtractorConfig embedding
Definition c-api.h:3882

SherpaOnnxOfflineSpeakerDiarizationConfig::segmentation
SherpaOnnxOfflineSpeakerSegmentationModelConfig segmentation
Definition c-api.h:3880

SherpaOnnxOfflineSpeakerDiarizationSegment
One diarization segment.
Definition c-api.h:3944

SherpaOnnxOfflineSpeakerDiarizationSegment::start
float start
Definition c-api.h:3946

SherpaOnnxOfflineSpeakerDiarizationSegment::speaker
int32_t speaker
Definition c-api.h:3950

SherpaOnnxOfflineSpeakerDiarizationSegment::end
float end
Definition c-api.h:3948

SherpaOnnxOfflineSpeakerSegmentationModelConfig
Segmentation model configuration for offline speaker diarization.
Definition c-api.h:3837

SherpaOnnxOfflineSpeakerSegmentationModelConfig::pyannote
SherpaOnnxOfflineSpeakerSegmentationPyannoteModelConfig pyannote
Definition c-api.h:3839

SherpaOnnxOfflineSpeakerSegmentationModelConfig::debug
int32_t debug
Definition c-api.h:3843

SherpaOnnxOfflineSpeakerSegmentationModelConfig::num_threads
int32_t num_threads
Definition c-api.h:3841

SherpaOnnxOfflineSpeakerSegmentationModelConfig::provider
const char * provider
Definition c-api.h:3845

SherpaOnnxOfflineSpeakerSegmentationPyannoteModelConfig
Pyannote speaker-segmentation model configuration.
Definition c-api.h:3826

SherpaOnnxOfflineSpeakerSegmentationPyannoteModelConfig::model
const char * model
Definition c-api.h:3828

SherpaOnnxOfflineSpeechDenoiserConfig
Configuration for offline speech denoising.
Definition c-api.h:4113

SherpaOnnxOfflineSpeechDenoiserConfig::model
SherpaOnnxOfflineSpeechDenoiserModelConfig model
Definition c-api.h:4115

SherpaOnnxOfflineSpeechDenoiserDpdfNetModelConfig
DPDFNet offline denoiser model configuration.
Definition c-api.h:4088

SherpaOnnxOfflineSpeechDenoiserDpdfNetModelConfig::model
const char * model
Definition c-api.h:4090

SherpaOnnxOfflineSpeechDenoiserGtcrnModelConfig
GTCRN offline denoiser model configuration.
Definition c-api.h:4082

SherpaOnnxOfflineSpeechDenoiserGtcrnModelConfig::model
const char * model
Definition c-api.h:4084

SherpaOnnxOfflineSpeechDenoiserModelConfig
Speech denoiser model configuration shared by offline and online APIs.
Definition c-api.h:4099

SherpaOnnxOfflineSpeechDenoiserModelConfig::gtcrn
SherpaOnnxOfflineSpeechDenoiserGtcrnModelConfig gtcrn
Definition c-api.h:4101

SherpaOnnxOfflineSpeechDenoiserModelConfig::debug
int32_t debug
Definition c-api.h:4105

SherpaOnnxOfflineSpeechDenoiserModelConfig::num_threads
int32_t num_threads
Definition c-api.h:4103

SherpaOnnxOfflineSpeechDenoiserModelConfig::dpdfnet
SherpaOnnxOfflineSpeechDenoiserDpdfNetModelConfig dpdfnet
Definition c-api.h:4109

SherpaOnnxOfflineSpeechDenoiserModelConfig::provider
const char * provider
Definition c-api.h:4107

SherpaOnnxOfflineTdnnModelConfig
Configuration for a TDNN model.
Definition c-api.h:931

SherpaOnnxOfflineTdnnModelConfig::model
const char * model
Definition c-api.h:933

SherpaOnnxOfflineTransducerModelConfig
Configuration for a non-streaming transducer model.
Definition c-api.h:831

SherpaOnnxOfflineTransducerModelConfig::joiner
const char * joiner
Definition c-api.h:837

SherpaOnnxOfflineTransducerModelConfig::decoder
const char * decoder
Definition c-api.h:835

SherpaOnnxOfflineTransducerModelConfig::encoder
const char * encoder
Definition c-api.h:833

SherpaOnnxOfflineTtsConfig
Configuration for offline text-to-speech.
Definition c-api.h:2440

SherpaOnnxOfflineTtsConfig::rule_fars
const char * rule_fars
Definition c-api.h:2448

SherpaOnnxOfflineTtsConfig::max_num_sentences
int32_t max_num_sentences
Definition c-api.h:2446

SherpaOnnxOfflineTtsConfig::model
SherpaOnnxOfflineTtsModelConfig model
Definition c-api.h:2442

SherpaOnnxOfflineTtsConfig::rule_fsts
const char * rule_fsts
Definition c-api.h:2444

SherpaOnnxOfflineTtsConfig::silence_scale
float silence_scale
Definition c-api.h:2450

SherpaOnnxOfflineTtsKittenModelConfig
Configuration for a Kitten TTS model.
Definition c-api.h:2307

SherpaOnnxOfflineTtsKittenModelConfig::length_scale
float length_scale
Definition c-api.h:2317

SherpaOnnxOfflineTtsKittenModelConfig::model
const char * model
Definition c-api.h:2309

SherpaOnnxOfflineTtsKittenModelConfig::data_dir
const char * data_dir
Definition c-api.h:2315

SherpaOnnxOfflineTtsKittenModelConfig::voices
const char * voices
Definition c-api.h:2311

SherpaOnnxOfflineTtsKittenModelConfig::tokens
const char * tokens
Definition c-api.h:2313

SherpaOnnxOfflineTtsKokoroModelConfig
Configuration for a Kokoro TTS model.
Definition c-api.h:2287

SherpaOnnxOfflineTtsKokoroModelConfig::model
const char * model
Definition c-api.h:2289

SherpaOnnxOfflineTtsKokoroModelConfig::lang
const char * lang
Definition c-api.h:2303

SherpaOnnxOfflineTtsKokoroModelConfig::voices
const char * voices
Definition c-api.h:2291

SherpaOnnxOfflineTtsKokoroModelConfig::length_scale
float length_scale
Definition c-api.h:2297

SherpaOnnxOfflineTtsKokoroModelConfig::dict_dir
const char * dict_dir
Definition c-api.h:2299

SherpaOnnxOfflineTtsKokoroModelConfig::data_dir
const char * data_dir
Definition c-api.h:2295

SherpaOnnxOfflineTtsKokoroModelConfig::tokens
const char * tokens
Definition c-api.h:2293

SherpaOnnxOfflineTtsKokoroModelConfig::lexicon
const char * lexicon
Definition c-api.h:2301

SherpaOnnxOfflineTtsMatchaModelConfig
Configuration for a Matcha TTS model.
Definition c-api.h:2267

SherpaOnnxOfflineTtsMatchaModelConfig::vocoder
const char * vocoder
Definition c-api.h:2271

SherpaOnnxOfflineTtsMatchaModelConfig::length_scale
float length_scale
Definition c-api.h:2281

SherpaOnnxOfflineTtsMatchaModelConfig::acoustic_model
const char * acoustic_model
Definition c-api.h:2269

SherpaOnnxOfflineTtsMatchaModelConfig::dict_dir
const char * dict_dir
Definition c-api.h:2283

SherpaOnnxOfflineTtsMatchaModelConfig::lexicon
const char * lexicon
Definition c-api.h:2273

SherpaOnnxOfflineTtsMatchaModelConfig::noise_scale
float noise_scale
Definition c-api.h:2279

SherpaOnnxOfflineTtsMatchaModelConfig::tokens
const char * tokens
Definition c-api.h:2275

SherpaOnnxOfflineTtsMatchaModelConfig::data_dir
const char * data_dir
Definition c-api.h:2277

SherpaOnnxOfflineTtsModelConfig
Configuration shared by offline TTS models.
Definition c-api.h:2399

SherpaOnnxOfflineTtsModelConfig::vits
SherpaOnnxOfflineTtsVitsModelConfig vits
Definition c-api.h:2401

SherpaOnnxOfflineTtsModelConfig::kokoro
SherpaOnnxOfflineTtsKokoroModelConfig kokoro
Definition c-api.h:2411

SherpaOnnxOfflineTtsModelConfig::debug
int32_t debug
Definition c-api.h:2405

SherpaOnnxOfflineTtsModelConfig::supertonic
SherpaOnnxOfflineTtsSupertonicModelConfig supertonic
Definition c-api.h:2419

SherpaOnnxOfflineTtsModelConfig::kitten
SherpaOnnxOfflineTtsKittenModelConfig kitten
Definition c-api.h:2413

SherpaOnnxOfflineTtsModelConfig::provider
const char * provider
Definition c-api.h:2407

SherpaOnnxOfflineTtsModelConfig::pocket
SherpaOnnxOfflineTtsPocketModelConfig pocket
Definition c-api.h:2417

SherpaOnnxOfflineTtsModelConfig::matcha
SherpaOnnxOfflineTtsMatchaModelConfig matcha
Definition c-api.h:2409

SherpaOnnxOfflineTtsModelConfig::num_threads
int32_t num_threads
Definition c-api.h:2403

SherpaOnnxOfflineTtsModelConfig::zipvoice
SherpaOnnxOfflineTtsZipvoiceModelConfig zipvoice
Definition c-api.h:2415

SherpaOnnxOfflineTtsPocketModelConfig
Configuration for a Pocket TTS model.
Definition c-api.h:2345

SherpaOnnxOfflineTtsPocketModelConfig::lm_main
const char * lm_main
Definition c-api.h:2349

SherpaOnnxOfflineTtsPocketModelConfig::text_conditioner
const char * text_conditioner
Definition c-api.h:2355

SherpaOnnxOfflineTtsPocketModelConfig::vocab_json
const char * vocab_json
Definition c-api.h:2357

SherpaOnnxOfflineTtsPocketModelConfig::token_scores_json
const char * token_scores_json
Definition c-api.h:2359

SherpaOnnxOfflineTtsPocketModelConfig::lm_flow
const char * lm_flow
Definition c-api.h:2347

SherpaOnnxOfflineTtsPocketModelConfig::encoder
const char * encoder
Definition c-api.h:2351

SherpaOnnxOfflineTtsPocketModelConfig::voice_embedding_cache_capacity
int32_t voice_embedding_cache_capacity
Definition c-api.h:2361

SherpaOnnxOfflineTtsPocketModelConfig::decoder
const char * decoder
Definition c-api.h:2353

SherpaOnnxOfflineTtsSupertonicModelConfig
Configuration for a Supertonic TTS model.
Definition c-api.h:2365

SherpaOnnxOfflineTtsSupertonicModelConfig::vocoder
const char * vocoder
Definition c-api.h:2373

SherpaOnnxOfflineTtsSupertonicModelConfig::vector_estimator
const char * vector_estimator
Definition c-api.h:2371

SherpaOnnxOfflineTtsSupertonicModelConfig::text_encoder
const char * text_encoder
Definition c-api.h:2369

SherpaOnnxOfflineTtsSupertonicModelConfig::duration_predictor
const char * duration_predictor
Definition c-api.h:2367

SherpaOnnxOfflineTtsSupertonicModelConfig::unicode_indexer
const char * unicode_indexer
Definition c-api.h:2377

SherpaOnnxOfflineTtsSupertonicModelConfig::tts_json
const char * tts_json
Definition c-api.h:2375

SherpaOnnxOfflineTtsSupertonicModelConfig::voice_style
const char * voice_style
Definition c-api.h:2379

SherpaOnnxOfflineTtsVitsModelConfig
Configuration for a VITS TTS model.
Definition c-api.h:2247

SherpaOnnxOfflineTtsVitsModelConfig::noise_scale_w
float noise_scale_w
Definition c-api.h:2259

SherpaOnnxOfflineTtsVitsModelConfig::data_dir
const char * data_dir
Definition c-api.h:2255

SherpaOnnxOfflineTtsVitsModelConfig::model
const char * model
Definition c-api.h:2249

SherpaOnnxOfflineTtsVitsModelConfig::dict_dir
const char * dict_dir
Definition c-api.h:2263

SherpaOnnxOfflineTtsVitsModelConfig::lexicon
const char * lexicon
Definition c-api.h:2251

SherpaOnnxOfflineTtsVitsModelConfig::noise_scale
float noise_scale
Definition c-api.h:2257

SherpaOnnxOfflineTtsVitsModelConfig::length_scale
float length_scale
Definition c-api.h:2261

SherpaOnnxOfflineTtsVitsModelConfig::tokens
const char * tokens
Definition c-api.h:2253

SherpaOnnxOfflineTtsZipvoiceModelConfig
Configuration for a ZipVoice TTS model.
Definition c-api.h:2321

SherpaOnnxOfflineTtsZipvoiceModelConfig::tokens
const char * tokens
Definition c-api.h:2323

SherpaOnnxOfflineTtsZipvoiceModelConfig::data_dir
const char * data_dir
Definition c-api.h:2331

SherpaOnnxOfflineTtsZipvoiceModelConfig::guidance_scale
float guidance_scale
Definition c-api.h:2341

SherpaOnnxOfflineTtsZipvoiceModelConfig::target_rms
float target_rms
Definition c-api.h:2339

SherpaOnnxOfflineTtsZipvoiceModelConfig::feat_scale
float feat_scale
Definition c-api.h:2335

SherpaOnnxOfflineTtsZipvoiceModelConfig::encoder
const char * encoder
Definition c-api.h:2325

SherpaOnnxOfflineTtsZipvoiceModelConfig::vocoder
const char * vocoder
Definition c-api.h:2329

SherpaOnnxOfflineTtsZipvoiceModelConfig::t_shift
float t_shift
Definition c-api.h:2337

SherpaOnnxOfflineTtsZipvoiceModelConfig::lexicon
const char * lexicon
Definition c-api.h:2333

SherpaOnnxOfflineTtsZipvoiceModelConfig::decoder
const char * decoder
Definition c-api.h:2327

SherpaOnnxOfflineWenetCtcModelConfig
Configuration for an offline WeNet CTC model.
Definition c-api.h:967

SherpaOnnxOfflineWenetCtcModelConfig::model
const char * model
Definition c-api.h:969

SherpaOnnxOfflineWhisperModelConfig
Configuration for a non-streaming Whisper model.
Definition c-api.h:855

SherpaOnnxOfflineWhisperModelConfig::encoder
const char * encoder
Definition c-api.h:857

SherpaOnnxOfflineWhisperModelConfig::tail_paddings
int32_t tail_paddings
Definition c-api.h:865

SherpaOnnxOfflineWhisperModelConfig::decoder
const char * decoder
Definition c-api.h:859

SherpaOnnxOfflineWhisperModelConfig::enable_segment_timestamps
int32_t enable_segment_timestamps
Definition c-api.h:871

SherpaOnnxOfflineWhisperModelConfig::enable_token_timestamps
int32_t enable_token_timestamps
Definition c-api.h:868

SherpaOnnxOfflineWhisperModelConfig::language
const char * language
Definition c-api.h:861

SherpaOnnxOfflineWhisperModelConfig::task
const char * task
Definition c-api.h:863

SherpaOnnxOfflineZipformerAudioTaggingModelConfig
Zipformer audio-tagging model configuration.
Definition c-api.h:3418

SherpaOnnxOfflineZipformerAudioTaggingModelConfig::model
const char * model
Definition c-api.h:3420

SherpaOnnxOfflineZipformerCtcModelConfig
Configuration for an offline Zipformer CTC model.
Definition c-api.h:961

SherpaOnnxOfflineZipformerCtcModelConfig::model
const char * model
Definition c-api.h:963

SherpaOnnxOnlineCtcFstDecoderConfig
Configuration for HLG/FST-based online CTC decoding.
Definition c-api.h:286

SherpaOnnxOnlineCtcFstDecoderConfig::max_active
int32_t max_active
Definition c-api.h:290

SherpaOnnxOnlineCtcFstDecoderConfig::graph
const char * graph
Definition c-api.h:288

SherpaOnnxOnlineModelConfig
Model configuration shared by streaming ASR recognizers.
Definition c-api.h:232

SherpaOnnxOnlineModelConfig::tokens_buf_size
int32_t tokens_buf_size
Definition c-api.h:264

SherpaOnnxOnlineModelConfig::model_type
const char * model_type
Definition c-api.h:248

SherpaOnnxOnlineModelConfig::zipformer2_ctc
SherpaOnnxOnlineZipformer2CtcModelConfig zipformer2_ctc
Definition c-api.h:238

SherpaOnnxOnlineModelConfig::modeling_unit
const char * modeling_unit
Definition c-api.h:257

SherpaOnnxOnlineModelConfig::nemo_ctc
SherpaOnnxOnlineNemoCtcModelConfig nemo_ctc
Definition c-api.h:266

SherpaOnnxOnlineModelConfig::provider
const char * provider
Definition c-api.h:244

SherpaOnnxOnlineModelConfig::tokens
const char * tokens
Definition c-api.h:240

SherpaOnnxOnlineModelConfig::t_one_ctc
SherpaOnnxOnlineToneCtcModelConfig t_one_ctc
Definition c-api.h:268

SherpaOnnxOnlineModelConfig::num_threads
int32_t num_threads
Definition c-api.h:242

SherpaOnnxOnlineModelConfig::bpe_vocab
const char * bpe_vocab
Definition c-api.h:259

SherpaOnnxOnlineModelConfig::debug
int32_t debug
Definition c-api.h:246

SherpaOnnxOnlineModelConfig::tokens_buf
const char * tokens_buf
Definition c-api.h:262

SherpaOnnxOnlineModelConfig::transducer
SherpaOnnxOnlineTransducerModelConfig transducer
Definition c-api.h:234

SherpaOnnxOnlineModelConfig::paraformer
SherpaOnnxOnlineParaformerModelConfig paraformer
Definition c-api.h:236

SherpaOnnxOnlineNemoCtcModelConfig
Configuration for a streaming NeMo CTC model.
Definition c-api.h:206

SherpaOnnxOnlineNemoCtcModelConfig::model
const char * model
Definition c-api.h:208

SherpaOnnxOnlineParaformerModelConfig
Configuration for a streaming Paraformer model.
Definition c-api.h:190

SherpaOnnxOnlineParaformerModelConfig::decoder
const char * decoder
Definition c-api.h:194

SherpaOnnxOnlineParaformerModelConfig::encoder
const char * encoder
Definition c-api.h:192

SherpaOnnxOnlinePunctuationConfig
Configuration for online punctuation.
Definition c-api.h:3668

SherpaOnnxOnlinePunctuationConfig::model
SherpaOnnxOnlinePunctuationModelConfig model
Definition c-api.h:3670

SherpaOnnxOnlinePunctuationModelConfig
Online punctuation model configuration.
Definition c-api.h:3654

SherpaOnnxOnlinePunctuationModelConfig::provider
const char * provider
Definition c-api.h:3664

SherpaOnnxOnlinePunctuationModelConfig::bpe_vocab
const char * bpe_vocab
Definition c-api.h:3658

SherpaOnnxOnlinePunctuationModelConfig::cnn_bilstm
const char * cnn_bilstm
Definition c-api.h:3656

SherpaOnnxOnlinePunctuationModelConfig::debug
int32_t debug
Definition c-api.h:3662

SherpaOnnxOnlinePunctuationModelConfig::num_threads
int32_t num_threads
Definition c-api.h:3660

SherpaOnnxOnlineRecognizerConfig
Configuration for a streaming ASR recognizer.
Definition c-api.h:338

SherpaOnnxOnlineRecognizerConfig::ctc_fst_decoder_config
SherpaOnnxOnlineCtcFstDecoderConfig ctc_fst_decoder_config
Definition c-api.h:369

SherpaOnnxOnlineRecognizerConfig::model_config
SherpaOnnxOnlineModelConfig model_config
Definition c-api.h:342

SherpaOnnxOnlineRecognizerConfig::hr
SherpaOnnxHomophoneReplacerConfig hr
Definition c-api.h:382

SherpaOnnxOnlineRecognizerConfig::rule3_min_utterance_length
float rule3_min_utterance_length
Definition c-api.h:360

SherpaOnnxOnlineRecognizerConfig::decoding_method
const char * decoding_method
Definition c-api.h:345

SherpaOnnxOnlineRecognizerConfig::rule1_min_trailing_silence
float rule1_min_trailing_silence
Definition c-api.h:354

SherpaOnnxOnlineRecognizerConfig::enable_endpoint
int32_t enable_endpoint
Definition c-api.h:351

SherpaOnnxOnlineRecognizerConfig::max_active_paths
int32_t max_active_paths
Definition c-api.h:348

SherpaOnnxOnlineRecognizerConfig::rule_fsts
const char * rule_fsts
Definition c-api.h:371

SherpaOnnxOnlineRecognizerConfig::hotwords_buf_size
int32_t hotwords_buf_size
Definition c-api.h:380

SherpaOnnxOnlineRecognizerConfig::hotwords_score
float hotwords_score
Definition c-api.h:366

SherpaOnnxOnlineRecognizerConfig::rule2_min_trailing_silence
float rule2_min_trailing_silence
Definition c-api.h:357

SherpaOnnxOnlineRecognizerConfig::rule_fars
const char * rule_fars
Definition c-api.h:373

SherpaOnnxOnlineRecognizerConfig::hotwords_buf
const char * hotwords_buf
Definition c-api.h:378

SherpaOnnxOnlineRecognizerConfig::hotwords_file
const char * hotwords_file
Definition c-api.h:363

SherpaOnnxOnlineRecognizerConfig::blank_penalty
float blank_penalty
Definition c-api.h:375

SherpaOnnxOnlineRecognizerConfig::feat_config
SherpaOnnxFeatureConfig feat_config
Definition c-api.h:340

SherpaOnnxOnlineRecognizerResult
Incremental recognition result for a streaming ASR stream.
Definition c-api.h:393

SherpaOnnxOnlineRecognizerResult::timestamps
float * timestamps
Definition c-api.h:414

SherpaOnnxOnlineRecognizerResult::tokens_arr
const char *const  * tokens_arr
Definition c-api.h:405

SherpaOnnxOnlineRecognizerResult::text
const char * text
Definition c-api.h:395

SherpaOnnxOnlineRecognizerResult::count
int32_t count
Definition c-api.h:417

SherpaOnnxOnlineRecognizerResult::tokens
const char * tokens
Definition c-api.h:402

SherpaOnnxOnlineRecognizerResult::json
const char * json
Definition c-api.h:420

SherpaOnnxOnlineSpeechDenoiserConfig
Configuration for streaming speech denoising.
Definition c-api.h:4211

SherpaOnnxOnlineSpeechDenoiserConfig::model
SherpaOnnxOfflineSpeechDenoiserModelConfig model
Definition c-api.h:4213

SherpaOnnxOnlineToneCtcModelConfig
Configuration for a streaming T-One CTC model.
Definition c-api.h:212

SherpaOnnxOnlineToneCtcModelConfig::model
const char * model
Definition c-api.h:214

SherpaOnnxOnlineTransducerModelConfig
Configuration for a streaming transducer model.
Definition c-api.h:174

SherpaOnnxOnlineTransducerModelConfig::encoder
const char * encoder
Definition c-api.h:176

SherpaOnnxOnlineTransducerModelConfig::decoder
const char * decoder
Definition c-api.h:178

SherpaOnnxOnlineTransducerModelConfig::joiner
const char * joiner
Definition c-api.h:180

SherpaOnnxOnlineZipformer2CtcModelConfig
Configuration for a streaming Zipformer2 CTC model.
Definition c-api.h:200

SherpaOnnxOnlineZipformer2CtcModelConfig::model
const char * model
Definition c-api.h:202

SherpaOnnxResampleOut
Output chunk returned by SherpaOnnxLinearResamplerResample().
Definition c-api.h:3773

SherpaOnnxResampleOut::n
int32_t n
Definition c-api.h:3777

SherpaOnnxResampleOut::samples
const float * samples
Definition c-api.h:3775

SherpaOnnxSileroVadModelConfig
Configuration for a Silero VAD model.
Definition c-api.h:1874

SherpaOnnxSileroVadModelConfig::threshold
float threshold
Definition c-api.h:1878

SherpaOnnxSileroVadModelConfig::min_silence_duration
float min_silence_duration
Definition c-api.h:1880

SherpaOnnxSileroVadModelConfig::window_size
int32_t window_size
Definition c-api.h:1884

SherpaOnnxSileroVadModelConfig::model
const char * model
Definition c-api.h:1876

SherpaOnnxSileroVadModelConfig::max_speech_duration
float max_speech_duration
Definition c-api.h:1891

SherpaOnnxSileroVadModelConfig::min_speech_duration
float min_speech_duration
Definition c-api.h:1882

SherpaOnnxSourceSeparationOutput
Output of a source-separation run.
Definition c-api.h:4386

SherpaOnnxSourceSeparationOutput::stems
const SherpaOnnxSourceSeparationStem * stems
Definition c-api.h:4388

SherpaOnnxSourceSeparationOutput::num_stems
int32_t num_stems
Definition c-api.h:4390

SherpaOnnxSourceSeparationOutput::sample_rate
int32_t sample_rate
Definition c-api.h:4392

SherpaOnnxSourceSeparationStem
A single stem (one output track) with one or more channels.
Definition c-api.h:4376

SherpaOnnxSourceSeparationStem::num_channels
int32_t num_channels
Definition c-api.h:4380

SherpaOnnxSourceSeparationStem::n
int32_t n
Definition c-api.h:4382

SherpaOnnxSourceSeparationStem::samples
float ** samples
Definition c-api.h:4378

SherpaOnnxSpeakerEmbeddingExtractorConfig
Configuration for speaker embedding extraction.
Definition c-api.h:3087

SherpaOnnxSpeakerEmbeddingExtractorConfig::debug
int32_t debug
Definition c-api.h:3093

SherpaOnnxSpeakerEmbeddingExtractorConfig::provider
const char * provider
Definition c-api.h:3095

SherpaOnnxSpeakerEmbeddingExtractorConfig::num_threads
int32_t num_threads
Definition c-api.h:3091

SherpaOnnxSpeakerEmbeddingExtractorConfig::model
const char * model
Definition c-api.h:3089

SherpaOnnxSpeakerEmbeddingManagerBestMatchesResult
Collection of best speaker matches.
Definition c-api.h:3327

SherpaOnnxSpeakerEmbeddingManagerBestMatchesResult::count
int32_t count
Definition c-api.h:3331

SherpaOnnxSpeakerEmbeddingManagerBestMatchesResult::matches
const SherpaOnnxSpeakerEmbeddingManagerSpeakerMatch * matches
Definition c-api.h:3329

SherpaOnnxSpeakerEmbeddingManagerSpeakerMatch
One speaker match returned by the best-matches API.
Definition c-api.h:3315

SherpaOnnxSpeakerEmbeddingManagerSpeakerMatch::score
float score
Definition c-api.h:3317

SherpaOnnxSpeakerEmbeddingManagerSpeakerMatch::name
const char * name
Definition c-api.h:3319

SherpaOnnxSpeechSegment
One detected speech segment returned by the VAD.
Definition c-api.h:2072

SherpaOnnxSpeechSegment::start
int32_t start
Definition c-api.h:2074

SherpaOnnxSpeechSegment::n
int32_t n
Definition c-api.h:2078

SherpaOnnxSpeechSegment::samples
float * samples
Definition c-api.h:2076

SherpaOnnxSpokenLanguageIdentificationConfig
Configuration for spoken language identification.
Definition c-api.h:2967

SherpaOnnxSpokenLanguageIdentificationConfig::provider
const char * provider
Definition c-api.h:2975

SherpaOnnxSpokenLanguageIdentificationConfig::whisper
SherpaOnnxSpokenLanguageIdentificationWhisperConfig whisper
Definition c-api.h:2969

SherpaOnnxSpokenLanguageIdentificationConfig::num_threads
int32_t num_threads
Definition c-api.h:2971

SherpaOnnxSpokenLanguageIdentificationConfig::debug
int32_t debug
Definition c-api.h:2973

SherpaOnnxSpokenLanguageIdentificationResult
Result of spoken-language identification.
Definition c-api.h:3024

SherpaOnnxSpokenLanguageIdentificationResult::lang
const char * lang
Definition c-api.h:3028

SherpaOnnxSpokenLanguageIdentificationWhisperConfig
Whisper-based model files for spoken language identification.
Definition c-api.h:2942

SherpaOnnxSpokenLanguageIdentificationWhisperConfig::tail_paddings
int32_t tail_paddings
Definition c-api.h:2948

SherpaOnnxSpokenLanguageIdentificationWhisperConfig::encoder
const char * encoder
Definition c-api.h:2944

SherpaOnnxSpokenLanguageIdentificationWhisperConfig::decoder
const char * decoder
Definition c-api.h:2946

SherpaOnnxTenVadModelConfig
Configuration for a Ten VAD model.
Definition c-api.h:1895

SherpaOnnxTenVadModelConfig::threshold
float threshold
Definition c-api.h:1899

SherpaOnnxTenVadModelConfig::window_size
int32_t window_size
Definition c-api.h:1905

SherpaOnnxTenVadModelConfig::min_silence_duration
float min_silence_duration
Definition c-api.h:1901

SherpaOnnxTenVadModelConfig::max_speech_duration
float max_speech_duration
Definition c-api.h:1912

SherpaOnnxTenVadModelConfig::min_speech_duration
float min_speech_duration
Definition c-api.h:1903

SherpaOnnxTenVadModelConfig::model
const char * model
Definition c-api.h:1897

SherpaOnnxVadModelConfig
Configuration shared by voice activity detectors.
Definition c-api.h:1947

SherpaOnnxVadModelConfig::silero_vad
SherpaOnnxSileroVadModelConfig silero_vad
Definition c-api.h:1949

SherpaOnnxVadModelConfig::sample_rate
int32_t sample_rate
Definition c-api.h:1951

SherpaOnnxVadModelConfig::num_threads
int32_t num_threads
Definition c-api.h:1953

SherpaOnnxVadModelConfig::debug
int32_t debug
Definition c-api.h:1957

SherpaOnnxVadModelConfig::ten_vad
SherpaOnnxTenVadModelConfig ten_vad
Definition c-api.h:1959

SherpaOnnxVadModelConfig::provider
const char * provider
Definition c-api.h:1955

SherpaOnnxWave
Decoded mono WAVE file content.
Definition c-api.h:2843

SherpaOnnxWave::num_samples
int32_t num_samples
Definition c-api.h:2849

SherpaOnnxWave::samples
const float * samples
Definition c-api.h:2845

SherpaOnnxWave::sample_rate
int32_t sample_rate
Definition c-api.h:2847