Gladia

Overview

GladiaSTTService provides real-time speech recognition using Gladia’s WebSocket API with support for 99+ languages, custom vocabulary, translation, sentiment analysis, and advanced audio processing features.

API Reference

Complete API documentation and method details

Gladia Docs

Official Gladia documentation and features

Example Code

Working example with interruption handling

Installation

To use Gladia services, install the required dependency:

pip install "pipecat-ai[gladia]"

You’ll also need to set up your Gladia API key and region as an environment variables:

GLADIA_API_KEY.
GLADIA_REGION eu-west or us-west. (optional, defaults to “eu-west”)

Get your API key from Gladia.

Frames

Input

InputAudioRawFrame - Raw PCM audio data (16-bit, 16kHz, mono)
STTUpdateSettingsFrame - Runtime transcription configuration updates
STTMuteFrame - Mute audio input for transcription

Output

InterimTranscriptionFrame - Real-time transcription updates
TranscriptionFrame - Final transcription results
TranslationFrame - Real-time translation results (when enabled)
ErrorFrame - Connection or processing errors

Models

Gladia offers several models optimized for different use cases:

Model	Description	Best For
`solaria-1`	Latest general-purpose model	High accuracy, balanced performance

See Gladia’s model documentation for detailed comparisons.

Language Support

Gladia STT supports 99+ languages with automatic detection and code-switching:

View All Supported Languages

Language Code	Description	Service Code
`Language.AF`	Afrikaans	`af`
`Language.AM`	Amharic	`am`
`Language.AR`	Arabic	`ar`
`Language.AS`	Assamese	`as`
`Language.AZ`	Azerbaijani	`az`
`Language.BA`	Bashkir	`ba`
`Language.BE`	Belarusian	`be`
`Language.BG`	Bulgarian	`bg`
`Language.BN`	Bengali	`bn`
`Language.BO`	Tibetan	`bo`
`Language.BR`	Breton	`br`
`Language.BS`	Bosnian	`bs`
`Language.CA`	Catalan	`ca`
`Language.CS`	Czech	`cs`
`Language.CY`	Welsh	`cy`
`Language.DA`	Danish	`da`
`Language.DE`	German	`de`
`Language.EL`	Greek	`el`
`Language.EN`	English	`en`
`Language.ES`	Spanish	`es`
`Language.ET`	Estonian	`et`
`Language.EU`	Basque	`eu`
`Language.FA`	Persian	`fa`
`Language.FI`	Finnish	`fi`
`Language.FO`	Faroese	`fo`
`Language.FR`	French	`fr`
`Language.GL`	Galician	`gl`
`Language.GU`	Gujarati	`gu`
`Language.HA`	Hausa	`ha`
`Language.HAW`	Hawaiian	`haw`
`Language.HE`	Hebrew	`he`
`Language.HI`	Hindi	`hi`
`Language.HR`	Croatian	`hr`
`Language.HT`	Haitian Creole	`ht`
`Language.HU`	Hungarian	`hu`
`Language.HY`	Armenian	`hy`
`Language.ID`	Indonesian	`id`
`Language.IS`	Icelandic	`is`
`Language.IT`	Italian	`it`
`Language.JA`	Japanese	`ja`
`Language.JV`	Javanese	`jv`
`Language.KA`	Georgian	`ka`
`Language.KK`	Kazakh	`kk`
`Language.KM`	Khmer	`km`
`Language.KN`	Kannada	`kn`
`Language.KO`	Korean	`ko`
`Language.LA`	Latin	`la`
`Language.LB`	Luxembourgish	`lb`
`Language.LN`	Lingala	`ln`
`Language.LO`	Lao	`lo`
`Language.LT`	Lithuanian	`lt`
`Language.LV`	Latvian	`lv`
`Language.MG`	Malagasy	`mg`
`Language.MI`	Maori	`mi`
`Language.MK`	Macedonian	`mk`
`Language.ML`	Malayalam	`ml`
`Language.MN`	Mongolian	`mn`
`Language.MR`	Marathi	`mr`
`Language.MS`	Malay	`ms`
`Language.MT`	Maltese	`mt`
`Language.MY_MR`	Burmese	`mymr`
`Language.NE`	Nepali	`ne`
`Language.NL`	Dutch	`nl`
`Language.NN`	Norwegian (Nynorsk)	`nn`
`Language.NO`	Norwegian	`no`
`Language.OC`	Occitan	`oc`
`Language.PA`	Punjabi	`pa`
`Language.PL`	Polish	`pl`
`Language.PS`	Pashto	`ps`
`Language.PT`	Portuguese	`pt`
`Language.RO`	Romanian	`ro`
`Language.RU`	Russian	`ru`
`Language.SA`	Sanskrit	`sa`
`Language.SD`	Sindhi	`sd`
`Language.SI`	Sinhala	`si`
`Language.SK`	Slovak	`sk`
`Language.SL`	Slovenian	`sl`
`Language.SN`	Shona	`sn`
`Language.SO`	Somali	`so`
`Language.SQ`	Albanian	`sq`
`Language.SR`	Serbian	`sr`
`Language.SU`	Sundanese	`su`
`Language.SV`	Swedish	`sv`
`Language.SW`	Swahili	`sw`
`Language.TA`	Tamil	`ta`
`Language.TE`	Telugu	`te`
`Language.TG`	Tajik	`tg`
`Language.TH`	Thai	`th`
`Language.TK`	Turkmen	`tk`
`Language.TL`	Tagalog	`tl`
`Language.TR`	Turkish	`tr`
`Language.TT`	Tatar	`tt`
`Language.UK`	Ukrainian	`uk`
`Language.UR`	Urdu	`ur`
`Language.UZ`	Uzbek	`uz`
`Language.VI`	Vietnamese	`vi`
`Language.YI`	Yiddish	`yi`
`Language.YO`	Yoruba	`yo`
`Language.ZH`	Chinese	`zh`

Common languages:

Language.EN - English - en
Language.ES - Spanish - es
Language.FR - French - fr
Language.DE - German - de
Language.IT - Italian - it
Language.JA - Japanese - ja

Advanced Features

Automatic Language Detection

Single language: Fixed language for entire session
Multiple languages: Auto-detect per utterance with code_switching=True
No languages specified: Auto-detect from all supported languages

Custom Vocabulary

Add domain-specific terms with bias intensity (0.0-1.0)
Mix strings and CustomVocabularyItem objects
Configure default intensity for simple strings

Real-time Translation

Translate to multiple target languages simultaneously
Enhanced model for higher accuracy
Align translations with original utterances

Usage Example

Basic Configuration

Initialize the GladiaSTTService and use it in a pipeline:

from pipecat.services.gladia.stt import GladiaSTTService
from pipecat.services.gladia.config import GladiaInputParams, LanguageConfig

# Simple setup
stt = GladiaSTTService(
    api_key=os.getenv("GLADIA_API_KEY"),
    region=os.getenv("GLADIA_REGION"),
)

# Use in pipeline
pipeline = Pipeline([
    transport.input(),
    stt,
    context_aggregator.user(),
    llm,
    tts,
    transport.output(),
    context_aggregator.assistant()
])

Dynamic Configuration

Make settings updates by pushing an STTUpdateSettingsFrame for the GladiaSTTService:

from pipecat.frames.frames import STTUpdateSettingsFrame

await task.queue_frame(
    STTUpdateSettingsFrame(settings={"language": Language.FR})
)

Multi-language Configuration

from pipecat.services.gladia.config import LanguageConfig

# Multi-language with auto-detection
params = GladiaInputParams(
    language_config=LanguageConfig(
        languages=["en", "es", "fr"],  # English, Spanish, French
        code_switching=True  # Auto-detect language changes
    )
)

stt = GladiaSTTService(
    api_key=os.getenv("GLADIA_API_KEY"),
    region=os.getenv("GLADIA_REGION"),
    params=params
)

Real-time Translation

from pipecat.services.gladia.config import (
    RealtimeProcessingConfig,
    TranslationConfig
)

# Enable real-time translation
params = GladiaInputParams(
    language_config=LanguageConfig(languages=["en"]),
    realtime_processing=RealtimeProcessingConfig(
        translation=True,
        translation_config=TranslationConfig(
            target_languages=["es"],
            match_original_utterances=True
        )
    )
)

stt = GladiaSTTService(
    api_key=os.getenv("GLADIA_API_KEY"),
    region=os.getenv("GLADIA_REGION"),
    params=params
)

Custom Vocabulary

from pipecat.services.gladia.config import (
    CustomVocabularyConfig,
    CustomVocabularyItem,
    RealtimeProcessingConfig
)

# Add domain-specific vocabulary
custom_vocab = CustomVocabularyConfig(
    vocabulary=[
        CustomVocabularyItem(value="Pipecat", intensity=0.9),
        CustomVocabularyItem(value="WebRTC", intensity=0.8),
        "JavaScript",  # Simple string with default intensity
    ],
    default_intensity=0.6
)

params = GladiaInputParams(
    realtime_processing=RealtimeProcessingConfig(
        custom_vocabulary=True,
        custom_vocabulary_config=custom_vocab
    )
)

Metrics

The service provides comprehensive metrics:

Time to First Byte (TTFB) - Latency from audio input to first transcription
Processing Duration - Total time spent processing audio

Learn how to enable Metrics in your Pipeline.

API Reference

Services

Utilities

Frameworks

Pipeline

Overview

API Reference

Gladia Docs

Example Code

Installation

Frames

Input

Output

Models

Language Support

Advanced Features

Automatic Language Detection

Custom Vocabulary

Real-time Translation

Usage Example

Basic Configuration

Dynamic Configuration

Multi-language Configuration

Real-time Translation

Custom Vocabulary

Metrics

API Reference

Services

Utilities

Frameworks

Pipeline

​Overview

API Reference

Gladia Docs

Example Code

​Installation

​Frames

​Input

​Output

​Models

​Language Support

​Advanced Features

​Automatic Language Detection

​Custom Vocabulary

​Real-time Translation

​Usage Example

​Basic Configuration

​Dynamic Configuration

​Multi-language Configuration

​Real-time Translation

​Custom Vocabulary

​Metrics

Overview

Installation

Frames

Input

Output

Models

Language Support

Advanced Features

Automatic Language Detection

Custom Vocabulary

Real-time Translation

Usage Example

Basic Configuration

Dynamic Configuration

Multi-language Configuration

Real-time Translation

Custom Vocabulary

Metrics