DSGVO LLM Unternehmen: Was beim Einsatz von Sprachmodellen wirklich gilt

Kurz gesagt

Jede Eingabe personenbezogener Daten in ein externes LLM ist eine Datenübermittlung — ohne AVV (Auftragsverarbeitungsvertrag) und Rechtsgrundlage ist sie rechtswidrig.

Die drei kritischen Pflichten im DSGVO-LLM-Kontext sind: Rechtsgrundlage klären, AVV abschließen und Verarbeitungstätigkeiten dokumentieren.

Data Residency ist kein Marketing-Argument: Wer nicht weiß, wo Prompts und Antworten gespeichert werden, hat keine Kontrolle über Drittlandübermittlungen.

Microsoft Copilot (M365) ist datenschutzrechtlich anders zu bewerten als die Consumer-Version von ChatGPT — der Unterschied liegt im Vertragswerk, nicht in der Technologie.

Eine interne LLM-Nutzungsrichtlinie mit klaren Verbotskategorien ist das wichtigste sofort umsetzbare Instrument — noch vor jeder technischen Lösung.

Warum DSGVO und LLMs eine unterschätzte Kombination sind

Wenn ein Mitarbeiter einen Kundennamen, eine Vertragsdetail oder eine Gehaltsangabe in ein Sprachmodell eingibt, ist das datenschutzrechtlich kein Bagatellfall. Es handelt sich um eine Verarbeitung personenbezogener Daten durch einen Dritten — mit allen Konsequenzen, die die DSGVO daran knüpft. Trotzdem zeigen Befragungen aus 2025 und 2026 immer wieder dasselbe Muster: Mitarbeiter nutzen KI-Tools im Berufsalltag, die IT-Abteilung duldet es, und die Rechtsabteilung erfährt es als letztes.

Das Problem ist nicht die Technologie — Sprachmodelle sind in vielen Anwendungsfällen legitim und nützlich. Das Problem ist das fehlende Fundament: kein AVV, keine Nutzungsrichtlinie, keine Dokumentation im Verzeichnis der Verarbeitungstätigkeiten (VVT). Für Unternehmen im deutschen Mittelstand, die unter DSGVO und in manchen Fällen auch unter branchenspezifischen Regularien operieren, ist das ein strukturelles Compliance-Risiko — nicht nur ein theoretisches.

DSGVO LLM Unternehmen: die vier zentralen Compliance-Bausteine — Rechtsgrundlage, AVV, Data Residency, VVT — Abb. 1: Die vier DSGVO-Compliance-Bausteine beim LLM-Einsatz — Rechtsgrundlage, AVV, Data Residency und Verarbeitungsverzeichnis.

Die drei Kernpflichten: Rechtsgrundlage, AVV und Dokumentation

Wer externe Sprachmodelle im Unternehmenskontext nutzt, muss drei Fragen rechtssicher beantworten können. Diese Fragen sind nicht optional — sie stehen im Zentrum jeder DSGVO-Prüfung durch eine Aufsichtsbehörde.

1. Welche Rechtsgrundlage gilt? Für die Verarbeitung personenbezogener Daten durch ein externes Modell kommen in der Praxis drei Grundlagen in Frage: berechtigtes Interesse (Art. 6 Abs. 1 lit. f DSGVO), Einwilligung (Art. 6 Abs. 1 lit. a) oder Vertragserfüllung (Art. 6 Abs. 1 lit. b). Berechtigtes Interesse ist am häufigsten anwendbar, erfordert aber eine dokumentierte Interessenabwägung — insbesondere wenn Kundendaten betroffen sind.

2. Liegt ein AVV vor? Wenn ein LLM-Anbieter im Auftrag des Unternehmens Daten verarbeitet, ist ein Auftragsverarbeitungsvertrag nach Art. 28 DSGVO zwingend erforderlich. OpenAI bietet einen DPA (Data Processing Agreement) für Enterprise-Kunden an; Microsoft schließt ihn im Rahmen des Microsoft Customer Agreement ab. Wer dagegen die Consumer-Variante von ChatGPT nutzt, ohne separaten Vertrag, hat keinen AVV — und damit keine rechtskonforme Auftragsverarbeitung.

3. Ist die Verarbeitung im VVT erfasst? Das Verzeichnis der Verarbeitungstätigkeiten nach Art. 30 DSGVO muss jeden Verarbeitungsvorgang mit Zweck, Kategorien betroffener Personen, Empfängern und Speicherfristen enthalten. Der LLM-Einsatz ist ein eigenständiger Vorgang, der separat dokumentiert werden muss — inklusive der Angabe, welcher Anbieter als Auftragsverarbeiter fungiert und wo die Daten verarbeitet werden.

Data Residency: Wo landen Ihre Prompts wirklich?

Data Residency bezeichnet den physischen und rechtlichen Speicherort von Daten. Bei LLMs ist das nicht trivial: Ein Prompt, den ein Mitarbeiter in München eingibt, kann von einem Rechenzentrum in den USA verarbeitet, in einer Sicherheitskopie in Irland gespeichert und für Sicherheitsaudit-Zwecke bis zu 30 Tage gehalten werden — je nach Anbieter und Produktversion. Drittlandübermittlungen nach Art. 44 ff. DSGVO erfordern entweder Angemessenheitsbeschlüsse (z. B. für US-Anbieter unter dem EU-US Data Privacy Framework), Standarddatenschutzklauseln (SCC) oder Binding Corporate Rules.

Microsoft Copilot for Microsoft 365 verarbeitet Daten im Rahmen des EU Data Boundary — das bedeutet, Verarbeitungs- und Speicherort liegen grundsätzlich in der EU oder im EWR. Das ist ein wesentlicher datenschutzrechtlicher Unterschied zu OpenAIs Consumer-Produkten, bei denen Daten standardmäßig in US-Rechenzentren verarbeitet werden. Unternehmen, die diese Unterscheidung nicht kennen, schließen faktisch identische Technologien unter völlig unterschiedlichen Rahmenbedingungen ab.

Eine pragmatische Anforderung lautet deshalb: Bevor ein LLM-Tool im Unternehmen freigegeben wird, muss der Datenschutzbeauftragte (oder ein externer DSB) die Data-Residency-Angaben des Anbieters schriftlich bestätigt haben — und diese Angaben müssen im VVT dokumentiert sein.

Nutzungsrichtlinie: Das wichtigste sofort umsetzbare Instrument

Selbst wenn alle vertraglichen Grundlagen vorhanden sind, bleibt das größte Risiko das unbewusste Fehlverhalten von Mitarbeitern. Eine interne LLM-Nutzungsrichtlinie definiert klar, welche Datenkategorien niemals in ein externes Sprachmodell eingegeben werden dürfen. Typische Verbotskategorien sind: personenbezogene Daten von Kunden oder Mitarbeitern ohne expliziten Prozessbeschluss, vertrauliche Geschäftsinformationen (Strategiepläne, M&A-Informationen), Gesundheits- und Finanzdaten sowie Zugangsdaten und Passwörter.

Die Richtlinie muss nicht lang sein — zwei DIN-A4-Seiten mit konkreten Beispielen und einer klaren Eskalationskette sind effektiver als ein 40-seitiges Dokument, das niemand liest. Entscheidend ist, dass sie kommuniziert, unterschrieben und in der Onboarding-Dokumentation verankert wird.

DSGVO LLM Unternehmen: dreistufiger Compliance-Prozess von der Rechtsprüfung über den AVV bis zur internen Nutzungsrichtlinie — Abb. 2: Dreistufiger LLM-Compliance-Prozess — von der Rechtsprüfung über das Vertragswerk bis zur internen Nutzungsrichtlinie.

Unternehmen, die diese drei Ebenen — Rechtsgrundlage, Vertragswerk und interne Richtlinie — strukturiert adressieren, sind nicht nur DSGVO-konform. Sie schaffen auch die Voraussetzung dafür, LLMs dauerhaft produktiv einzusetzen, ohne bei jeder Aufsichtsbehördenanfrage in Erklärungsnöte zu geraten. Datenschutzkonforme KI-Nutzung ist kein Bremsklotz — sie ist die Grundlage für nachhaltiges Vertrauen von Kunden, Mitarbeitern und Partnern.

Häufige Anschlussfragen

Ist die Nutzung von ChatGPT im Büro grundsätzlich verboten? expand_more

Nein — aber sie ist ohne die richtigen Voraussetzungen rechtswidrig, sobald personenbezogene Daten im Spiel sind. Wer ChatGPT Enterprise mit aktivem DPA und dokumentierter Rechtsgrundlage einsetzt, handelt regelkonform. Wer die kostenlose Consumerversion für Kundendaten nutzt, nicht.

Muss ich meinen Datenschutzbeauftragten einbinden, bevor wir ein LLM einführen? expand_more

Ja, in jedem Fall — unabhängig davon, ob ein interner oder externer DSB bestellt ist. Bei systematischer Verarbeitung sensibler Daten kann zudem eine Datenschutz-Folgenabschätzung (DSFA) nach Art. 35 DSGVO erforderlich sein, bevor der Betrieb aufgenommen wird.

Was passiert, wenn ein Mitarbeiter versehentlich Kundendaten eingibt? expand_more

Es handelt sich um einen meldepflichtigen Datenschutzvorfall, wenn die Daten beim Anbieter ohne ausreichende Vertragsgrundlage verarbeitet wurden. Unternehmen haben nach Art. 33 DSGVO 72 Stunden Zeit, um Vorfälle mit hohem Risiko für Betroffene der zuständigen Aufsichtsbehörde zu melden. Eine interne Nutzungsrichtlinie mit klaren Verboten kann das Risiko solcher Vorfälle erheblich reduzieren.

Wie unterscheidet sich ein internes, selbst gehostetes LLM von einem externen Dienst? expand_more

Bei einem selbst gehosteten Modell (z. B. Llama auf unternehmenseigener Infrastruktur) entfällt die Auftragsverarbeitungsbeziehung zu einem externen Anbieter — Daten verlassen nicht die eigene Infrastruktur. Allerdings bleiben interne Dokumentations- und Sicherheitspflichten bestehen. Für Hochrisiko-Anwendungen kann auch hier eine DSFA erforderlich sein. Der Aufwand für Betrieb und Sicherheit liegt dabei vollständig beim Unternehmen selbst.

Kurz gesagt

Warum DSGVO und LLMs eine unterschätzte Kombination sind

Die drei Kernpflichten: Rechtsgrundlage, AVV und Dokumentation

Data Residency: Wo landen Ihre Prompts wirklich?

Nutzungsrichtlinie: Das wichtigste sofort umsetzbare Instrument

Häufige Anschlussfragen

Passende Insights

KI-Governance: Rollen- und Verantwortlichen-Matrix für den Alltag

RAG für interne Dokumente: Checkliste vor dem Go-live

EU AI Act Mittelstand Pflichten 2026: Was jetzt gilt und wo Übergangsfristen enden

KI datenschutzkonform einführen