Published on9. März 2026Ollama Cluster: Load Balancing für 200+ Nutzerollamaclusterload-balancingself-hostedmittelstanddeutschlandOllama Cluster mit Load Balancing: 200+ Nutzer, automatisches Failover, horizontale Skalierung. Nginx-Setup für den Mittelstand.
Published on9. März 2026Ollama GPU CUDA Setup: Ubuntu Server Anleitungollamagpucudaubuntuself-hostedmittelstanddeutschlandOllama mit NVIDIA GPU und CUDA auf Ubuntu: 8x schneller als CPU. Anleitung für CUDA-Treiber, VRAM-Optimierung und Produktion.
Published on9. März 2026OpenWebUI Teams: Rollen und API-Keys verwaltenopenwebuiteamsrollenself-hostedmittelstanddeutschlandOpenWebUI für Teams: Rollen, API-Keys und Berechtigungen verwalten. Mit LDAP-Anbindung und Kostencontrolling pro Nutzer.
Published on9. März 2026OpenWebUI + Ollama: Firmen-ChatGPT in 30 Minopenwebuiollamafirmen-chatgptself-hostedmittelstanddeutschlandOpenWebUI und Ollama als Firmen-ChatGPT: Multi-User, RAG und DSGVO-konform für €89/Monat. Docker-Compose-Anleitung.
Published on9. März 2026Whisper API vs lokal: Kosten pro Audiostundewhisperspracherkennungtranskriptionkostenself-hosteddeutschlandWhisper API vs. Self-Hosted: Ab 80 Audiostunden/Monat lohnt der eigene Server – €0,02 statt €0,36 pro Minute Transkription.