Trainingsdaten

Veröffentlicht5. Juli 2026

Aktualisiert5. Juli 2026

VonIngo Weltz

Trainingsdaten sind die Beispiele, aus denen eine künstliche Intelligenz lernt. So wie ein Kind durch viele Beobachtungen begreift, wie ein Hund aussieht, erkennt eine KI Muster, indem man ihr große Mengen an Beispielen vorlegt.

Woraus eine KI lernt

Diese Daten können fast alles sein: Texte, Fotos, Tonaufnahmen, Tabellen mit Zahlen. Eine KI, die Katzen auf Bildern erkennen soll, bekommt tausende Fotos gezeigt – viele mit Katze, viele ohne, oft mit dem Hinweis, was worauf zu sehen ist. Aus diesen Beispielen leitet sie selbstständig ab, welche Merkmale eine Katze ausmachen. Genau das ist das „Training“.

Für Trainingsdaten gilt ein eiserner Grundsatz: „Garbage in, garbage out“ – schlechte Daten, schlechtes Ergebnis. Eine KI kann nur so gut werden wie das Material, aus dem sie lernt. Sind die Beispiele einseitig, lückenhaft oder fehlerhaft, übernimmt das Modell diese Schwächen.

Wenn die Daten verzerren

Ein oft genanntes Beispiel: Ein Bewerbungs-Filter wird mit den Einstellungsdaten der Vergangenheit trainiert. Wurden früher überwiegend Männer eingestellt, lernt die KI dieses Muster als „richtig“ und benachteiligt Frauen – nicht aus Absicht, sondern weil die Trainingsdaten diese Verzerrung enthielten. Solche Effekte nennt man Bias.

Für jeden, der KI einsetzt, ist das die wichtigste Erkenntnis: Eine KI ist kein neutrales Orakel. Sie ist ein Spiegel ihrer Trainingsdaten. Wer verstehen will, warum ein KI-System so entscheidet, wie es entscheidet, muss zuerst fragen, mit welchem Material es gefüttert wurde.

Wie können wir dir helfen?

A

B

C

D

E

F

G

H

I

J

K

L

M

N

O

P

Q

R

S

T

U

V

W

X

Y

Z

Trainingsdaten

Woraus eine KI lernt

Wenn die Daten verzerren

Deine Mitarbeiter

Mehr

Rechtliches