Interne Wissensassistenten mit Rollenrechten im KMU-Betrieb

Juni 3, 2026

Viele Unternehmen starten mit einem AI-Chatbot für die Website und merken erst später, dass der eigentliche Hebel intern liegt: im Support, im Verkauf und in der technischen Vorqualifikation. Ein interner Wissensassistent kann Tickets klassifizieren, Standardfragen beantworten, Dokumente zusammenfassen und passende Quellen liefern. Der Unterschied zu einem öffentlichen Chatbot ist entscheidend: Nicht nur die Antwortqualität zählt, sondern auch Rollenrechte, Datenzugriff und Nachvollziehbarkeit.

Wofür sich interne Assistenten wirklich eignen

Ein interner Assistent ist dann sinnvoll, wenn Mitarbeitende wiederkehrende Fragen mit hohem Suchaufwand beantworten müssen. Typische Beispiele sind Produktinformationen, Prozessfragen, technische Handbücher, Onboarding-Unterlagen oder Support-Playbooks. Cytracon sieht in Projekten oft denselben Musterverlauf: Zuerst werden E-Mails, PDFs und Wiki-Seiten manuell durchsucht, später muss dieselbe Antwort mehrfach in leicht anderer Form formuliert werden. Genau dort spart ein gut angebundener Assistent Zeit.

Ein realistischer Use Case ist ein B2B-Support-Team mit 8 bis 20 Personen. Der Assistent beantwortet intern Fragen wie: Welche SLA gilt für diesen Kunden?, Welches Modul ist betroffen? oder Welche Rückfragen braucht der Vertrieb vor einem Offer? Statt frei zu halluzinieren, greift er auf freigegebene Dokumente zu und verweist auf die Quelle.

Rollenrechte statt Einheitswissen

Der grösste Fehler bei internen AI-Assistenten ist ein zu breiter Zugriff. Was für den Vertrieb nützlich ist, darf für den First-Level-Support vielleicht noch sichtbar sein, für externe Partner aber nicht. Darum braucht es ein klares Berechtigungsmodell.

Support: Zugriff auf Tickets, Fehlerbilder, bekannte Lösungen, Eskalationspfade.
Vertrieb: Zugriff auf Produktpositionierung, Referenzen, Preislogik und Freigabestufen.
Technik: Zugriff auf Runbooks, Systemdokumentation, Change-Historie und Monitoring-Hinweise.

Die technische Regel ist einfach: Der Assistent darf nur aus Quellen antworten, die der eingeloggten Rolle auch wirklich offenstehen. Das reduziert Datenschutzrisiken und verhindert, dass sensible Inhalte versehentlich in einer Standardantwort landen.

Woran Qualität messbar wird

Ein interner Assistent ist kein Prestige-Feature, sondern ein Betriebswerkzeug. Deshalb sollte er mit klaren Kennzahlen eingeführt werden. Drei Metriken reichen für den Start oft schon aus:

Antwortabdeckung: In wie vielen Fällen liefert der Assistent eine verwertbare Antwort mit Quelle?
Eskalationsquote: Wie oft muss ein Mensch nachbearbeiten oder korrigieren?
Bearbeitungszeit pro Anfrage: Wie stark sinkt die Zeit vom Suchstart bis zur finalen Antwort?

Ein guter Richtwert für den Anfang: Wenn ein Support-Team bisher durchschnittlich 6 bis 8 Minuten braucht, um eine interne Standardfrage zu klären, sind 2 bis 3 Minuten nach Einführung des Assistenten ein realistischer Zielkorridor. Noch wichtiger als reine Geschwindigkeit ist jedoch die Quote falscher oder unvollständiger Antworten. Ein Assistent, der schnell, aber unzuverlässig ist, erzeugt Mehrarbeit statt Entlastung.

Vorher und nachher im Alltag

Vorher: Ein Mitarbeiter sucht in drei Systemen, schreibt eine Kollegin an, wartet auf Rückmeldung und baut die Antwort selbst zusammen. Die Quelle ist unklar, die Version möglicherweise veraltet.

Nachher: Der Assistent zeigt in Sekunden eine Antwort, nennt die verwendete Quelle und markiert unsichere Stellen. Falls die Information nicht sauber abgedeckt ist, wird direkt an die richtige Person oder den richtigen Prozess eskaliert.

Der Mehrwert entsteht also nicht nur durch Generierung, sondern durch Orchestrierung: finden, prüfen, verlinken, eskalieren. Das ist der eigentliche Business-Case hinter RAG, Embeddings und Prompt Engineering im operativen Umfeld.

Checkliste vor dem Go-live

Bevor ein interner Wissensassistent produktiv geht, sollten diese Punkte geklärt sein:

Welche Inhalte sind freigegeben, welche gesperrt?
Wer ist für Aktualität und Freigabe der Wissensbasis verantwortlich?
Welche Antworttypen müssen zwingend mit Quellen belegt werden?
Wann wird an Menschen übergeben, zum Beispiel bei rechtlichen, finanziellen oder kundenspezifischen Spezialfällen?
Wie werden veraltete Dokumente re-indexiert oder entfernt?
Wie werden Logs, Kosten und Antwortqualität laufend überwacht?

Gerade der letzte Punkt wird oft unterschätzt. Ein Assistent mit veralteten Inhalten bleibt nicht nur ungenau, er wird mit der Zeit auch unbrauchbar. Deshalb braucht es einen klaren Content-Lifecycle: neue Dokumente einspielen, Änderungen prüfen, alte Versionen aus dem Index entfernen und wiederkehrende Fehlantworten gezielt nachschärfen.

Was KMU anders machen sollten

Für KMU ist nicht die grösste Modellfamilie entscheidend, sondern ein sauberer Prozess. Oft ist ein kleinerer, günstigerer LLM-Workflow mit guter Datenpflege und klaren Rollenrechten wirtschaftlich sinnvoller als ein komplexes Setup mit unnötig hoher Latenz. Wer Support, Verkauf oder Technik entlasten will, sollte zuerst die häufigsten 20 Fragen identifizieren und dort beginnen.

Cytracon setzt in solchen Projekten typischerweise auf einen pragmatischen Start: ein klar begrenzter Anwendungsfall, kontrollierte Quellen, messbare Qualität und eine saubere Eskalation an Menschen. So wird aus einem AI-Projekt kein Experiment, sondern ein belastbares Arbeitsmittel.

Wenn Sie einen internen Wissensassistenten für Support, Verkauf oder Technik planen und dabei Zugriff, Qualität und Betrieb sauber aufsetzen möchten, sprechen Sie mit uns über den passenden Einstieg: Kontakt aufnehmen.