Trainings Phrasen / Utterances

-> zum BOTwiki

 
Utterances sind Trainingsphrasen, mit denen ein AI Agent erkennt, was Nutzende meinen, indem er die im System hinterlegten Beispiele mit der Live-Anfrage vergleicht. Dieses Konzept stammt aus der klassischen, intentbasierten Dialogarchitektur und war über viele Jahre ein zentrales Element bei der Entwicklung von Chatbots und virtuellen Assistenten.

In modernen agentischen Systemen, die auf Large Language Models basieren, verliert das manuelle Pflegen von Utterances zunehmend an Bedeutung. Diese Systeme verstehen Freitext kontextbasiert und können mit sprachlicher Variation umgehen, ohne vorab auf konkrete Beispielformulierungen trainiert worden zu sein. Wer jedoch mit intentbasierten NLU-Modellen arbeitet oder bestehende Systeme dieser Art betreut, findet im Folgenden die wesentlichen Grundlagen.

Jede Utterance ist eine konkrete Beispielformulierung, die einem bestimmten Intent zugeordnet wird. Aus vielen solcher Beispiele lernt das NLU-Modell, sprachliche Variationen einer Anfrage zu erkennen. Je breiter und realistischer die Utterances, desto stabiler die Klassifikation in der Produktion.

 

Was eine Utterance ist und wie sie wirkt

Eine Utterance ist eine kurze, in natürlicher Sprache formulierte Beispieleingabe. Für den Intent „Termin_buchen“ sind das etwa: „Ich bräuchte einen Termin“, „Können Sie mir einen Termin geben?“ oder „Ich möchte nächste Woche kommen“.

Aus diesen Beispielen leitet das NLU-Modell sprachliche Muster ab. Es erkennt anschließend auch Formulierungen, die nicht wörtlich im Training enthalten waren. Utterances sind damit das Trainingsmaterial, das über die Erkennungsqualität entscheidet.

 

Anforderungen an gute Utterances

Pro Intent sollten mehrere Utterances hinterlegt sein, die unterschiedliche Formulierungen abdecken. Wichtig sind dabei: 

  • Sprachliche Varianten: kurze und lange Formulierungen, mit und ohne Höflichkeitsfloskeln.
  • Synonyme: „Termin“, „Verabredung“, „Sprechstunde“.
  • Realistische Eingaben aus Sicht der Zielgruppe, keine künstlich konstruierten Sätze.
  • Abdeckung typischer Tippfehler, Umgangssprache und Dialekte, sofern in der Praxis vorkommen.

 Ebenso wichtig ist die Abgrenzung. Utterances unterschiedlicher Intents dürfen sich semantisch nicht zu stark überschneiden. Sonst sinkt der Confidence Score, weil das Modell nicht mehr eindeutig entscheiden kann.

 

Häufig gestellte Fragen (FAQ)

Utterances sind Trainingsphrasen, mit denen ein AI Agent lernt, einen Intent zu erkennen. Jede Utterance ist eine konkrete Beispieleingabe, etwa „Ich bräuchte einen Termin“ für den Intent „Termin_buchen“. Aus vielen solcher Beispiele leitet das NLU-Modell sprachliche Muster ab und erkennt damit auch Varianten, die nicht wörtlich trainiert wurden.

Pro Intent sind in der Regel zehn bis dreissig Utterances ein guter Startwert. Entscheidend ist nicht die reine Menge, sondern die sprachliche Vielfalt. Kurze und lange Formulierungen, Synonyme und realistische Tippfehler erhöhen die Erkennungsstabilität stärker als zusätzliche ähnliche Sätze.

Der Confidence Score zeigt, wie sicher das Modell einen Intent zugeordnet hat. Gut formulierte Utterances erhöhen den Score, weil das Modell klare Muster lernt. Überlappen sich Utterances verschiedener Intents, sinkt der Score und das System weicht häufiger auf einen Fallback aus.

> Zurück zum BOTwiki