Providers & modellen¶
De app gebruikt LiteLLM als universele adapter. Dit betekent dat je met één instelling (MODEL in .env) kunt wisselen tussen vrijwel alle grote taalmodellen — zonder code te wijzigen.
Het MODEL veld volgt altijd het formaat provider/model-naam.
Cloud providers¶
Lokale modellen met Ollama¶
Ollama laat je open modellen lokaal draaien — geen cloud API key nodig, geen data die de organisatie verlaat.
Installatie¶
Installeer Ollama en pull een model:
# Installeer Ollama (zie https://ollama.com/download)
ollama pull gpt-oss:20b # aanbevolen, goede tool calling
ollama pull llama3.1:8b # alternatief
ollama pull qwen2.5:14b # alternatief
Configuratie¶
In Docker (als Ollama op de host draait):
Gebruik ollama_chat/ — niet ollama/
LiteLLM heeft twee prefixen voor Ollama. Alleen ollama_chat/ ondersteunt tools en tool_choice. De app heeft tool calling nodig om data op te halen bij CBS, RIO en DUO — met ollama/ werken de databronnen niet.
Geen API key nodig
Ollama vereist geen API key. De app toont ook geen waarschuwing over ontbrekende keys wanneer MODEL begint met ollama_chat/ of ollama/.
Aanbevolen modellen¶
| Model | Grootte | Opmerkingen |
|---|---|---|
gpt-oss:20b |
~12 GB | Sterk in tool calling, aanbevolen |
llama3.1:8b |
5 GB | Goede balans snelheid/kwaliteit |
qwen2.5:14b |
9 GB | Complexere analyses |
mistral |
4 GB | Meertalig, goed Nederlands |
Controleer de Ollama library op de tag Tools om te zien welke modellen tool calling ondersteunen.
SURF Willma AI-Hub¶
Willma biedt toegang tot open modellen voor het Nederlandse onderwijs via SURF. Zie Configuratie voor de instelling.
Hoe LiteLLM providers koppelt¶
LiteLLM leest omgevingsvariabelen automatisch per provider:
| Provider | Omgevingsvariabele |
|---|---|
| Anthropic | ANTHROPIC_API_KEY |
| OpenAI | OPENAI_API_KEY |
| Azure OpenAI | AZURE_API_KEY, AZURE_API_BASE, AZURE_API_VERSION |
| Azure AI Foundry | AZURE_AI_API_KEY, AZURE_AI_API_BASE |
| Gemini | GEMINI_API_KEY |
| Ollama | OPENAI_API_BASE (bijv. http://localhost:11434/v1) |
Je hoeft dus alleen de variabelen in te stellen die bij jouw gekozen provider horen — de rest kan leeg blijven. Alle providers zijn ook gedocumenteerd in .env.example.