Published on

Eigenen Chatbot erstellen: €34k sparen mit DIY-Anleitung [OpenWebUI 2025]

Authors

Der €34.000-Unterschied: ChatGPT vs Eigener Chatbot

Szenario: KMU mit 50 Mitarbeitern, jeder nutzt ChatGPT für Recherche, E-Mails, Code.

ChatGPT Plus: €250/Mt (50 User × €5/Mt + Teams-Features)

  • Kosten: €3.000/Jahr
  • Problem: Keine Firmendaten, keine Integration, Daten in USA

Eigener Chatbot (OpenWebUI + Ollama)

  • Kosten: €60/Jahr (Server-Strom)
  • Vorteil: Firmendaten-Integration (RAG), DSGVO, volle Kontrolle
  • Ersparnis: €2.940/Jahr

🚀 30-Minuten-Setup: Eigenen Chatbot erstellen

Schritt 1: Server vorbereiten (5 Min)

Hardware-Anforderungen:

Minimal (bis 10 User):
  - CPU: 4 Cores
  - RAM: 16 GB
  - GPU: Optional (Intel/AMD integriert)
  - Storage: 100 GB SSD
  - Kosten: €500 (gebraucht) ODER Cloud €15/Mt

Empfohlen (bis 50 User):
  - CPU: 8 Cores (AMD Ryzen 7 / Intel i7)
  - RAM: 32 GB
  - GPU: NVIDIA GTX 1660 Ti (6 GB) ODER besser
  - Storage: 500 GB NVMe
  - Kosten: €1.200 (neu) ODER Cloud €45/Mt

OS: Ubuntu 22.04 LTS

# System aktualisieren
sudo apt update && sudo apt upgrade -y

# Docker installieren
curl -fsSL https://get.docker.com -o get-docker.sh
sudo sh get-docker.sh
sudo usermod -aG docker $USER

# NVIDIA GPU Support (falls vorhanden)
# https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/latest/install-guide.html

Schritt 2: Ollama installieren (3 Min)

# Ollama CLI installieren
curl -fsSL https://ollama.ai/install.sh | sh

# LLM-Modelle herunterladen (wähle 1-2)
ollama pull llama3.2:3b        # Schnell, 2 GB RAM
ollama pull llama3.1:8b        # Balanced, 5 GB RAM
ollama pull mixtral:8x7b       # High-Quality, 26 GB RAM

# Test
ollama run llama3.2:3b
>>> Hallo, wie geht's?

Schritt 3: OpenWebUI deployen (2 Min)

# OpenWebUI mit Docker (inklusive Ollama)
docker run -d \
  --name openwebui \
  -p 3000:8080 \
  -v openwebui:/app/backend/data \
  --add-host=host.docker.internal:host-gateway \
  --restart always \
  ghcr.io/open-webui/open-webui:main

# Oder mit externem Ollama
docker run -d \
  --name openwebui \
  -p 3000:8080 \
  -e OLLAMA_BASE_URL=http://host.docker.internal:11434 \
  -v openwebui:/app/backend/data \
  --restart always \
  ghcr.io/open-webui/open-webui:main

# Öffne http://localhost:3000
# Erstelle Admin-Account

Schritt 4: RAG mit Firmendokumenten (10 Min)

Upload von Dokumenten:

  1. OpenWebUI öffnen → "Workspace" → "Documents"
  2. PDFs, DOCX, TXT hochladen (z.B. Produktkatalog, FAQ, Prozesse)
  3. Automatische Vektorisierung mit Sentence-Transformers
  4. Bei Chat-Prompt: "@document Name" für Kontext

Alternativ: Vector-DB (ChromaDB) manuell:

# RAG-Implementierung für Eigenen Chatbot

from llama_index import VectorStoreIndex, SimpleDirectoryReader
from llama_index.llms import Ollama

# 1. Dokumente laden
documents = SimpleDirectoryReader('/path/to/company-docs').load_data()

# 2. Index erstellen (Vektorisierung)
llm = Ollama(model="llama3.1:8b", base_url="http://localhost:11434")
index = VectorStoreIndex.from_documents(documents)

# 3. Query Engine
query_engine = index.as_query_engine(llm=llm)

# 4. Anfrage mit Firmenkontext
response = query_engine.query("Wie ist unser Rückgabeprozess?")
print(response)

Schritt 5: Multi-User & SSO (10 Min)

User-Management in OpenWebUI:

  • Admin-Panel → "Admin Settings" → "Users"
  • Neue User anlegen ODER LDAP/OIDC anbinden

LDAP-Integration (Active Directory):

# docker-compose.yml für OpenWebUI mit LDAP

version: '3.8'
services:
  openwebui:
    image: ghcr.io/open-webui/open-webui:main
    ports:
      - "3000:8080"
    environment:
      OLLAMA_BASE_URL: http://ollama:11434
      ENABLE_LDAP: "true"
      LDAP_SERVER_URL: "ldap://dc.company.local:389"
      LDAP_BIND_DN: "CN=svcaccount,OU=Services,DC=company,DC=local"
      LDAP_BIND_PASSWORD: "SuperSecret123"
      LDAP_USER_SEARCH_BASE: "OU=Users,DC=company,DC=local"
      LDAP_USER_SEARCH_FILTER: "(sAMAccountName={username})"
    volumes:
      - openwebui:/app/backend/data
    restart: always

  ollama:
    image: ollama/ollama:latest
    volumes:
      - ollama:/root/.ollama
    restart: always

volumes:
  openwebui:
  ollama:

ROI-Vergleich: ChatGPT vs Eigener Chatbot

AspektChatGPT Plus (50 User)Eigener ChatbotDifferenz
Setup-Kosten€0€1.200 (Server) ODER €540/Jahr (Cloud)+€1.200
Laufende Kosten€3.000/Jahr€60/Jahr (Strom) ODER €540/Jahr (Cloud)-€2.940/Jahr
Firmendaten-RAG❌ Nein✅ JaStrategisch
DSGVO⚠️ US-Server✅ Self-Hosted DECompliance
Custom-Modelle❌ Nein✅ Ja (Fine-Tuning)Innovation
ROI (3 Jahre)-€9.000-€1.260 (Self-Hosted)€7.740 gespart

Break-Even: Nach 5 Monaten (Self-Hosted) / Sofort (Cloud wenn <€250/Mt)


DSGVO & Datenschutz

Compliance-Vorteile

1. Datenresidenz:

  • ✅ Alle Daten bleiben auf Ihrem Server (in DE)
  • ✅ Kein Cloud-Transfer
  • ✅ Volle Kontrolle über Speicherort

2. Kein AVV nötig:

  • Bei Self-Hosted: Keine Auftragsverarbeitung
  • Bei Cloud (Hetzner etc.): AVV mit deutschem Provider

3. Betroffenenrechte:

# Automatische DSGVO-Funktionen

# Löschung aller Nutzerdaten
docker exec openwebui python manage.py delete_user max.mustermann@firma.de

# Export aller Daten (Art. 20 DSGVO)
docker exec openwebui python manage.py export_user_data max.mustermann@firma.de > user_data.json

FAQ: Die 6 wichtigsten Fragen

1. Wie gut ist Ollama vs ChatGPT?
Llama 3.1 (8B): ~85-90% von GPT-4-Qualität. Für interne Nutzung meist ausreichend. Mixtral (8x7B): ~92-95%.

2. Brauche ich eine GPU?
Nein! CPU-Inferenz funktioniert (langsamer). GPU empfohlen ab 20+ User (5× schneller).

3. Wie skaliere ich auf 100+ User?
Kubernetes + Load Balancer. Oder mehrere Ollama-Instanzen hinter OpenWebUI.

4. Kann ich auch Azure OpenAI anbinden?
Ja! OpenWebUI unterstützt OpenAI-API. In Settings → "Connections" → Azure OpenAI URL eingeben.

5. Wie sichere ich den Zugriff?
HTTPS (Let's Encrypt) + SSO (LDAP/OIDC) + VPN (nur intern erreichbar). Tutorial: OpenWebUI Security Docs

6. Was ist der größte Vorteil?
Firmendaten-RAG! ChatGPT kennt Ihre Prozesse nicht. Eigener Chatbot mit RAG schon.


🚀 Nächste Schritte

Variante 1: Self-Hosted (volle Kontrolle)

Kosten: €1.200 (Server) + €60/Jahr
Setup-Zeit: 1-2 Tage
Schwierigkeit: Mittel (IT-Kenntnisse nötig)

Variante 2: Managed Cloud (schneller)

Kosten: Setup €2.500 + €45/Mt
Setup-Zeit: 1 Tag
Inklusive: Einrichtung, LDAP, HTTPS, Backup

Kontakt: kontakt@ki-mittelstand.eu


DIY-Investition: €1.260 (3 Jahre Self-Hosted)
ChatGPT-Kosten: €9.000 (3 Jahre)
Ersparnis: €7.740
Plus: Firmendaten-RAG, DSGVO-Konformität, volle Kontrolle

Letzte Aktualisierung: 6. Oktober 2025

📖 Verwandte Artikel

Weitere interessante Beiträge zu ähnlichen Themen