EasyTranslator Documentation

This directory contains locally cached documentation for the libraries and APIs used in the EasyTranslator project.

README.md - Overview and quick start guide
API.md - Complete API reference with all methods, properties, and events
USAGE.md - Detailed usage guide with best practices and patterns
examples/ - Working code examples
- basic-recognition.js - Simple speech recognition
- continuous-recognition.js - Continuous recognition with interim results
- on-device-recognition.js - On-device processing with language pack management
- contextual-biasing.js - Domain-specific recognition improvement
- speech-synthesis.js - Text-to-speech with voice selection
version.txt - Version info and compatibility notes

Key Features:

Speech recognition (audio to text)
Speech synthesis (text to audio)
On-device processing (experimental)
Contextual biasing
Multilingual support

Browser Compatibility: Requires vendor prefixes (webkitSpeechRecognition)

Mistral Voxtral

Location: /docs/mistral-voxtral/

Mistral AI's frontier speech understanding models for transcription and audio Q&A.

Files:

README.md - Overview, model variants, and quick start
API.md - Complete API reference with endpoints and parameters
examples/ - Integration examples
- basic-transcription.js - Simple audio transcription
- transcription-with-timestamps.js - Segment-level timestamps for subtitles
- audio-chat.js - Q&A and summarization from audio
- function-calling.js - Voice commands triggering backend functions
- vue-composable.ts - Vue 3 composable for EasyTranslator integration
- edge-function.ts - Serverless function to hide API key
version.txt - Version info, pricing, and capabilities

Model Variants:

Voxtral (24B) - Production scale (voxtral-small-latest)
Voxtral Mini (3B) - Edge deployment (voxtral-mini-latest)
Voxtral Mini Transcribe - API-optimized transcription

Key Features:

32k token context (30+ minutes audio)
Built-in Q&A and summarization
Native multilingual support (auto-detection)
Function-calling from voice
$0.001 per minute pricing

API Endpoints:

POST /v1/audio/transcriptions - Transcription only
POST /v1/chat/completions - Chat with audio input

Quick Reference

When to Use Which?

Use Web Speech API when:

Need browser-native recognition (no API costs)
Building voice commands for UI
Want text-to-speech synthesis
Privacy is critical (can run on-device)
Working offline

Limitations:

Server-based in Chrome (requires network)
Less accurate than Voxtral
No built-in translation
Variable browser support

Use Mistral Voxtral when:

Need high-accuracy transcription
Want to ask questions about audio
Building translation features
Need function-calling from voice
Working with long-form audio (up to 30 min)

Limitations:

Requires API key and network
Costs $0.001 per minute
Not available offline

EasyTranslator Integration

Current Implementation

EasyTranslator currently uses Voxtral Mini for transcription:

// In useAudioRecorder.ts
const formData = new FormData()
formData.append('file', audioBlob, 'recording.webm')
formData.append('model', 'voxtral-mini')  // ← Current model

const response = await fetch('https://api.mistral.ai/v1/audio/transcriptions', {
  method: 'POST',
  headers: { 'x-api-key': apiKey },
  body: formData,
})

Potential Enhancements

Add Web Speech API as Fallback
- Use for quick, local recognition
- Fall back to Voxtral for accuracy
- Enable offline mode
Implement Audio Q&A
- Let users ask questions about conversations
- Summarize long recordings
- Extract action items from meetings
Enable Function Calling
- Voice commands: "Translate to French"
- Auto-detect: "Send this to my email"
- Smart actions: "Save this conversation"
Add Timestamp Support
- Generate subtitles from transcriptions
- Enable seeking in long recordings
- Create conversation chapters
Optimize with Edge Functions
- Hide API key from frontend
- Add rate limiting
- Implement caching

Documentation Maintenance

Last Updated: 2025-11-26

Update Schedule:

Check for API changes monthly
Update examples when EasyTranslator architecture changes
Add new examples based on user needs

How to Update:

Visit source URLs listed in each version.txt
Check for API changes or new features
Update relevant markdown files
Add new examples if needed
Update this README with changes

External Links

Web Speech API

Mistral Voxtral

Announcement: https://mistral.ai/news/voxtral
API Docs: https://docs.mistral.ai/capabilities/audio_transcription
Pricing: https://mistral.ai/pricing

Contributing

When adding new documentation:

Follow the existing structure
Include working code examples
Document browser/API compatibility
Update this README
Add version info to version.txt

Name		Name	Last commit message	Last commit date
Latest commit History 35 Commits
.claude		.claude
api		api
docs		docs
public		public
src		src
.env.example		.env.example
.gitignore		.gitignore
.mcp.json		.mcp.json
AGENT.md		AGENT.md
CLAUDE.md		CLAUDE.md
add-ui-translations.js		add-ui-translations.js
index.html		index.html
package-lock.json		package-lock.json
package.json		package.json
tsconfig.json		tsconfig.json
tsconfig.node.json		tsconfig.node.json
vite.config.ts		vite.config.ts

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

EasyTranslator Documentation

Contents

Web Speech API

Mistral Voxtral

Quick Reference

When to Use Which?

EasyTranslator Integration

Current Implementation

Potential Enhancements

Documentation Maintenance

External Links

Web Speech API

Mistral Voxtral

Contributing

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

rowild/EasyTranslator

Folders and files

Latest commit

History

Repository files navigation

EasyTranslator Documentation

Contents

Web Speech API

Mistral Voxtral

Quick Reference

When to Use Which?

EasyTranslator Integration

Current Implementation

Potential Enhancements

Documentation Maintenance

External Links

Web Speech API

Mistral Voxtral

Contributing

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages