Neu

Leitplanken 2.0

Sorgen Sie dafür, dass Agenten in großem Maßstab markenkonform und regelkonform bleiben

Mit vorgefertigten Schutzmaßnahmen und benutzerdefinierten Regeln, die in Echtzeit mit minimaler zusätzlicher Latenz ausgeführt werden, macht Guardrails 2.0 es einfach, zu steuern, wie sich Agenten in der Produktion verhalten.

Verfügbar für alle ElevenAgents-Nutzer

Minimale Auswirkung auf die Latenz

AIUC-1 zertifiziert

Neu

Leitplanken 2.0

Sorgen Sie dafür, dass Agenten in großem Maßstab markenkonform und regelkonform bleiben

Mit vorgefertigten Schutzmaßnahmen und benutzerdefinierten Regeln, die in Echtzeit mit minimaler zusätzlicher Latenz ausgeführt werden, macht Guardrails 2.0 es einfach, zu steuern, wie sich Agenten in der Produktion verhalten.

Verfügbar für alle ElevenAgents-Nutzer

Minimale Auswirkung auf die Latenz

AIUC-1 zertifiziert

Neu

Leitplanken 2.0

Sorgen Sie dafür, dass Agenten in großem Maßstab markenkonform und regelkonform bleiben

Mit vorgefertigten Schutzmaßnahmen und benutzerdefinierten Regeln, die in Echtzeit mit minimaler zusätzlicher Latenz ausgeführt werden, macht Guardrails 2.0 es einfach, zu steuern, wie sich Agenten in der Produktion verhalten.

Verfügbar für alle ElevenAgents-Nutzer

Minimale Auswirkung auf die Latenz

AIUC-1 zertifiziert

Vertraut von über 7.500.000 Unternehmen und Kreativen

Vertraut von über 7.500.000 Unternehmen und Kreativen

Vertraut von über 7.500.000 Unternehmen und Kreativen

Sicherheit auf Enterprise-Niveau, extrem geringe Latenz

Da Sprachagenten immer komplexere Workflows mit höherer Tragweite übernehmen, kann eine einzige unbeabsichtigte Antwort das Vertrauen der Nutzer untergraben, Compliance-Risiken verursachen oder kostspielige Eskalationen auslösen. Guardrails 2.0 sorgt dafür, dass das niemals passiert.

Guardrails in Aktion ansehen

Antwort in Echtzeit mit minimaler Latenz

Prüfungen werden parallel zur Antwortgenerierung ausgeführt

Validiert jede Agentenantwort anhand Ihrer Richtlinien

Sicherheit auf Enterprise-Niveau, extrem geringe Latenz

Da Sprachagenten immer komplexere Workflows mit höherer Tragweite übernehmen, kann eine einzige unbeabsichtigte Antwort das Vertrauen der Nutzer untergraben, Compliance-Risiken verursachen oder kostspielige Eskalationen auslösen. Guardrails 2.0 sorgt dafür, dass das niemals passiert.

Guardrails in Aktion ansehen

Antwort in Echtzeit mit minimaler Latenz

Prüfungen werden parallel zur Antwortgenerierung ausgeführt

Validiert jede Agentenantwort anhand Ihrer Richtlinien

Sicherheit auf Enterprise-Niveau, extrem geringe Latenz

Da Sprachagenten immer komplexere Workflows mit höherer Tragweite übernehmen, kann eine einzige unbeabsichtigte Antwort das Vertrauen der Nutzer untergraben, Compliance-Risiken verursachen oder kostspielige Eskalationen auslösen. Guardrails 2.0 sorgt dafür, dass das niemals passiert.

Guardrails in Aktion ansehen

Antwort in Echtzeit mit minimaler Latenz

Prüfungen werden parallel zur Antwortgenerierung ausgeführt

Validiert jede Agentenantwort anhand Ihrer Richtlinien

Zwei Schutzschichten

Proaktive Anleitung

Guardrails verstärken die Systemanweisung mit zusätzlichen Anweisungen, die Agenten in ihrer Rolle verankert halten, insbesondere bei längeren oder komplexeren Anrufen, bei denen ein Abdriften am wahrscheinlichsten ist.

Echtzeit-Durchsetzung

Separate Prüfungen werden bei jeder Antwort ausgeführt, bevor sie den Nutzer erreicht. Wenn ein Verstoß erkannt wird, wird die Antwort blockiert und das System führt die von Ihnen festgelegte Aktion aus: beenden, erneut versuchen oder eskalieren.

Zwei Schutzschichten

Proaktive Anleitung

Guardrails verstärken die Systemanweisung mit zusätzlichen Anweisungen, die Agenten in ihrer Rolle verankert halten, insbesondere bei längeren oder komplexeren Anrufen, bei denen ein Abdriften am wahrscheinlichsten ist.

Echtzeit-Durchsetzung

Separate Prüfungen werden bei jeder Antwort ausgeführt, bevor sie den Nutzer erreicht. Wenn ein Verstoß erkannt wird, wird die Antwort blockiert und das System führt die von Ihnen festgelegte Aktion aus: beenden, erneut versuchen oder eskalieren.

Zwei Schutzschichten

Proaktive Anleitung

Guardrails verstärken die Systemanweisung mit zusätzlichen Anweisungen, die Agenten in ihrer Rolle verankert halten, insbesondere bei längeren oder komplexeren Anrufen, bei denen ein Abdriften am wahrscheinlichsten ist.

Echtzeit-Durchsetzung

Separate Prüfungen werden bei jeder Antwort ausgeführt, bevor sie den Nutzer erreicht. Wenn ein Verstoß erkannt wird, wird die Antwort blockiert und das System führt die von Ihnen festgelegte Aktion aus: beenden, erneut versuchen oder eskalieren.

Du entscheidest, was als Nächstes passiert

Wenn eine benutzerdefinierte Guardrail ausgelöst wird, entscheiden Sie über das Ergebnis.

Benutzerdefiniert

Leitplanke

ausgelöst

Anruf beenden

Das Gespräch wird sofort beendet und der Anruf wird getrennt

Fallback bereitstellen

Der Agent antwortet mit einer vordefinierten Nachricht, wiederholt es, beendet es oder setzt es fort

An Menschen weiterleiten

Der Anruf wird zur manuellen Bearbeitung an einen menschlichen Mitarbeiter weitergeleitet

Jede Auslösung wird in Ihrem Analytics-Dashboard protokolliert, mit Details dazu, welcher Guardrail ausgelöst wurde und warum.

Du entscheidest, was als Nächstes passiert

Wenn eine benutzerdefinierte Guardrail ausgelöst wird, entscheiden Sie über das Ergebnis.

Benutzerdefiniert

Leitplanke

ausgelöst

Anruf beenden

Das Gespräch wird sofort beendet und der Anruf wird getrennt

Fallback bereitstellen

Der Agent antwortet mit einer vordefinierten Nachricht, wiederholt es, beendet es oder setzt es fort

An Menschen weiterleiten

Der Anruf wird zur manuellen Bearbeitung an einen menschlichen Mitarbeiter weitergeleitet

Jede Auslösung wird in Ihrem Analytics-Dashboard protokolliert, mit Details dazu, welcher Guardrail ausgelöst wurde und warum.

Du entscheidest, was als Nächstes passiert

Benutzerdefiniert

Leitplanke

ausgelöst

Anruf beenden

Das Gespräch wird sofort beendet und der Anruf wird getrennt

Fallback bereitstellen

Der Agent antwortet mit einer vordefinierten Nachricht, wiederholt es, beendet es oder setzt es fort

An Menschen weiterleiten

Der Anruf wird zur manuellen Bearbeitung an einen menschlichen Mitarbeiter weitergeleitet

Jede Auslösung wird in Ihrem Analytics-Dashboard protokolliert, mit Details dazu, welcher Guardrail ausgelöst wurde und warum.

Vorgefertigte Schutzmechanismen und benutzerdefinierte Steuerung

Vorgefertigte Leitplanken

Benutzerdefinierte Leitplanken

Fokus

Halten Sie Agenten in langen, komplexen Interaktionen beim Thema. Erkennt Abweichungen vom beabsichtigten Thema, der Rolle oder dem Ton des Agenten und bekräftigt die ursprüngliche Absicht.

Inhalt

Stellen Sie angemessene Antworten sicher. Verhindert unzulässige Inhalte in Agentenantworten vor der Auslieferung, einschließlich sexuell explizitem oder gewalttätigem Material.

Manipulation

Schützt vor böswilligen Akteuren und Prompt-Injection. Blockiert Versuche, Systemanweisungen zu umgehen, einschließlich Überschreibungen und adversarischer Angriffe.

Vorgefertigte Schutzmechanismen und benutzerdefinierte Steuerung

Vorgefertigte Leitplanken

Benutzerdefinierte Leitplanken

Fokus

Halten Sie Agenten in langen, komplexen Interaktionen beim Thema. Erkennt Abweichungen vom beabsichtigten Thema, der Rolle oder dem Ton des Agenten und bekräftigt die ursprüngliche Absicht.

Inhalt

Stellen Sie angemessene Antworten sicher. Verhindert unzulässige Inhalte in Agentenantworten vor der Auslieferung, einschließlich sexuell explizitem oder gewalttätigem Material.

Manipulation

Schützt vor böswilligen Akteuren und Prompt-Injection. Blockiert Versuche, Systemanweisungen zu umgehen, einschließlich Überschreibungen und adversarischer Angriffe.

Vorgefertigte Schutzmechanismen und benutzerdefinierte Steuerung

Vorgefertigte Leitplanken

Benutzerdefinierte Leitplanken

Fokus

Halten Sie Agenten in langen, komplexen Interaktionen beim Thema. Erkennt Abweichungen vom beabsichtigten Thema, der Rolle oder dem Ton des Agenten und bekräftigt die ursprüngliche Absicht.

Inhalt

Stellen Sie angemessene Antworten sicher. Verhindert unzulässige Inhalte in Agentenantworten vor der Auslieferung, einschließlich sexuell explizitem oder gewalttätigem Material.

Manipulation

Schützt vor böswilligen Akteuren und Prompt-Injection. Blockiert Versuche, Systemanweisungen zu umgehen, einschließlich Überschreibungen und adversarischer Angriffe.

Sensible Informationen automatisch schwärzen

Vor der Schwärzung

Nachdem ein Anruf beendet wurde, erkennen und schwärzen Sie automatisch ausgewählte sensible Informationen in Ihren Transkripten, Aufzeichnungen und Webhook-Payloads.

Nach der Schwärzung

Erkannte Entitäten werden im Text durch typisierte Platzhalter ersetzt und in der Audiodatei weggepiept, wobei der Gesprächskontext für die Überprüfung und zukünftige Analyse erhalten bleibt.

Sensible Informationen automatisch schwärzen

Vor der Schwärzung

Nachdem ein Anruf beendet wurde, erkennen und schwärzen Sie automatisch ausgewählte sensible Informationen in Ihren Transkripten, Aufzeichnungen und Webhook-Payloads.

Nach der Schwärzung

Erkannte Entitäten werden im Text durch typisierte Platzhalter ersetzt und in der Audiodatei weggepiept, wobei der Gesprächskontext für die Überprüfung und zukünftige Analyse erhalten bleibt.

Sensible Informationen automatisch schwärzen

Vor der Schwärzung

Nachdem ein Anruf beendet wurde, erkennen und schwärzen Sie automatisch ausgewählte sensible Informationen in Ihren Transkripten, Aufzeichnungen und Webhook-Payloads.

Nach der Schwärzung

Erkannte Entitäten werden im Text durch typisierte Platzhalter ersetzt und in der Audiodatei weggepiept, wobei der Gesprächskontext für die Überprüfung und zukünftige Analyse erhalten bleibt.

Teil eines umfassenderen Sicherheitsfundaments

Guardrails 2.0 unterstützt Enterprise-Implementierungen von ElevenAgents sowie Sicherheitsmaßnahmen vor dem Produktivgang, Monitoring nach der Bereitstellung und Zugriff auf die ersten Versicherungspolicen der Branche, abgesichert durch die AIUC-1-Zertifizierung.

Teil eines umfassenderen Sicherheitsfundaments

Guardrails 2.0 unterstützt Enterprise-Implementierungen von ElevenAgents sowie Sicherheitsmaßnahmen vor dem Produktivgang, Monitoring nach der Bereitstellung und Zugriff auf die ersten Versicherungspolicen der Branche, abgesichert durch die AIUC-1-Zertifizierung.

Teil eines umfassenderen Sicherheitsfundaments

Guardrails 2.0 unterstützt Enterprise-Implementierungen von ElevenAgents sowie Sicherheitsmaßnahmen vor dem Produktivgang, Monitoring nach der Bereitstellung und Zugriff auf die ersten Versicherungspolicen der Branche, abgesichert durch die AIUC-1-Zertifizierung.

Häufig gestellte Fragen

Verursachen Guardrails zusätzliche Latenz?

Minimal. Guardrails laufen parallel zur Antwortgenerierung und sind in der Regel abgeschlossen, bevor die vollständige Antwort zur Auslieferung bereit ist. In den meisten Fällen bemerken Nutzer überhaupt keine Verzögerung.

Sind Guardrails standardmäßig aktiviert?+

Vorgefertigte Guardrails sind derzeit standardmäßig deaktiviert, daher hat ein Upgrade keine Auswirkungen auf bestehende Agenten. Wir empfehlen, sie für jede Produktionsbereitstellung zu aktivieren (insbesondere Focus). In Kürze werden Guardrails für neue Agenten standardmäßig aktiviert sein. Sie können jeden einzelnen Guardrail jederzeit im Sicherheit-Tab Ihres Agenten ein- oder ausschalten.

Kosten sie Geld?+

Vorgefertigte Guardrails (Fokus, Inhalt, Manipulation) sind ohne zusätzliche Kosten enthalten. Benutzerdefinierte Guardrails werden nutzungsbasiert abgerechnet, und die Kosten werden wie andere LLM-Kosten weitergegeben. Sie können außerdem auswählen, welches Modell Ihre Regeln bewertet.

Was ist der Unterschied zwischen einem benutzerdefinierten Guardrail und einer Regel im System-Prompt?+

Dein System-Prompt steuert das Verhalten deines Agents, indem er ihm sagt, was er tun soll und wie er antworten soll. Ein benutzerdefinierter Guardrail bewertet jede Antwort des Agents nach ihrer Generierung unabhängig anhand deiner Regel und blockiert Verstöße, bevor sie den Nutzer erreichen. Betrachte deinen System-Prompt als Anweisungen und Guardrails als Durchsetzung.

Für deine wichtigsten Richtlinien empfehlen wir, beides zu verwenden: Der System-Prompt und der Focus Guardrail prägen das Verhalten, und der benutzerdefinierte Guardrail fängt alles ab, was durchrutscht, besonders in langen Gesprächen, in denen Modelle eher vom Kurs abweichen.

Was passiert mit dem Nutzer, wenn ein Guardrail ausgelöst wird?+

Das hängt vom Guardrail-Typ und davon ab, wie Sie ihn konfiguriert haben. Bei benutzerdefinierten Guardrails wählen Sie die Ausstiegsstrategie: das Gespräch beenden, an einen anderen Agenten übergeben oder an einen Menschen eskalieren. Bei vorgefertigten Guardrails (Focus, Content, Manipulation) wird das Gespräch derzeit beendet, wenn sie ausgelöst werden. Konfigurierbare Ausstiegsstrategien dafür sind bald verfügbar. In allen Fällen können Nutzer sofort ein neues Gespräch beginnen. Der Guardrail blockiert eine bestimmte Antwort, nicht den Nutzer.

Woran erkenne ich, welcher Guardrail ausgelöst wurde?+

Jeder Auslöser wird in Ihren Gesprächsanalysen protokolliert. Sie sehen, welche Guardrail ausgelöst wurde, warum und in welchem Gesprächskontext. Verwenden Sie dies, um Fehlalarme zu überprüfen und Ihre Regeln im Laufe der Zeit zu verfeinern.

Kann ich Guardrails in regulierten Branchen wie dem Gesundheitswesen oder dem Finanzwesen verwenden?+

Ja. Guardrails sind speziell für Einsätze mit hohen Anforderungen entwickelt worden. Mit Custom Guardrails können Sie domänenspezifische Richtlinien in natürlicher Sprache definieren, zum Beispiel „keine medizinischen Diagnosen stellen“ oder „keine bestimmten Investitionen empfehlen“. Diese Regeln werden in jeder Unterhaltung unabhängig durchgesetzt und helfen dabei, das Compliance-Risiko zu verringern, ohne dass eine eigene Infrastruktur erforderlich ist.

Guardrails 2.0 unterstützt außerdem die Ausrichtung auf die AIUC-1-Compliance sowie den Zugang zu den ersten KI-Versicherungspolicen der Branche. Dadurch fällt es Sicherheits- und Rechtsteams leichter, Produktionsbereitstellungen mitzutragen. Auch wenn Guardrails das Risiko erheblich senken, entfalten sie ihre beste Wirkung als Teil einer umfassenderen Compliance-Strategie und nicht als eigenständige Lösung.

Werden sensible Daten in Konversationsprotokollen gespeichert?+

Standardmäßig enthalten Konversationsprotokolle Transkript- und Audiodaten, um Analysen, Qualitätssicherung und die Verbesserung von Agents zu unterstützen. Wenn Sie die Offenlegung von Daten einschränken möchten, entfernt Conversation History Redaction automatisch ausgewählte sensible Informationen (z. B. Namen, Kreditkartennummern oder andere personenbezogene Daten) aus Transkripten, Aufzeichnungen und Webhook-Payloads, bevor diese gespeichert werden. Text wird durch typisierte Platzhalter ersetzt und das Audio wird gepiepst. Sie legen genau fest, welche Entitätstypen geschwärzt werden. Conversation History Redaction ist für Unternehmenskunden verfügbar.

Sollte ich Guardrails UND eine Härtung des System-Prompts verwenden?+

Ja, und das ist die empfohlene Konfiguration. Die Härtung des System-Prompts lenkt den Agenten zu den richtigen Antworten. Guardrails setzen Ihre Regeln unabhängig als Sicherheitsnetz durch, sodass selbst dann, wenn das Modell in einem langen Gespräch abdriftet, Verstöße vor der Auslieferung erkannt werden. Zusammen schaffen sie eine Verteidigung in der Tiefe.

Kann ich sie ausschalten?+

Ja. Jede Schutzmaßnahme kann einzeln ein- oder ausgeschaltet werden. Für die meisten Produktionsbereitstellungen empfehlen wir, alle Schutzmaßnahmen aktiviert zu lassen (insbesondere Focus). In manchen Fällen kann eine bestimmte Schutzmaßnahme mit dem vorgesehenen Anwendungsfall Ihres Agenten kollidieren. Wenn Sie sich nicht sicher sind, testen Sie es, bevor Sie sie deaktivieren.

Häufig gestellte Fragen

Verursachen Guardrails zusätzliche Latenz?

Minimal. Guardrails laufen parallel zur Antwortgenerierung und sind in der Regel abgeschlossen, bevor die vollständige Antwort zur Auslieferung bereit ist. In den meisten Fällen bemerken Nutzer überhaupt keine Verzögerung.

Sind Guardrails standardmäßig aktiviert?+

Vorgefertigte Guardrails sind derzeit standardmäßig deaktiviert, daher hat ein Upgrade keine Auswirkungen auf bestehende Agenten. Wir empfehlen, sie für jede Produktionsbereitstellung zu aktivieren (insbesondere Focus). In Kürze werden Guardrails für neue Agenten standardmäßig aktiviert sein. Sie können jeden einzelnen Guardrail jederzeit im Sicherheit-Tab Ihres Agenten ein- oder ausschalten.

Kosten sie Geld?+

Vorgefertigte Guardrails (Fokus, Inhalt, Manipulation) sind ohne zusätzliche Kosten enthalten. Benutzerdefinierte Guardrails werden nutzungsbasiert abgerechnet, und die Kosten werden wie andere LLM-Kosten weitergegeben. Sie können außerdem auswählen, welches Modell Ihre Regeln bewertet.

Was ist der Unterschied zwischen einem benutzerdefinierten Guardrail und einer Regel im System-Prompt?+

Dein System-Prompt steuert das Verhalten deines Agents, indem er ihm sagt, was er tun soll und wie er antworten soll. Ein benutzerdefinierter Guardrail bewertet jede Antwort des Agents nach ihrer Generierung unabhängig anhand deiner Regel und blockiert Verstöße, bevor sie den Nutzer erreichen. Betrachte deinen System-Prompt als Anweisungen und Guardrails als Durchsetzung.

Für deine wichtigsten Richtlinien empfehlen wir, beides zu verwenden: Der System-Prompt und der Focus Guardrail prägen das Verhalten, und der benutzerdefinierte Guardrail fängt alles ab, was durchrutscht, besonders in langen Gesprächen, in denen Modelle eher vom Kurs abweichen.

Was passiert mit dem Nutzer, wenn ein Guardrail ausgelöst wird?+

Das hängt vom Guardrail-Typ und davon ab, wie Sie ihn konfiguriert haben. Bei benutzerdefinierten Guardrails wählen Sie die Ausstiegsstrategie: das Gespräch beenden, an einen anderen Agenten übergeben oder an einen Menschen eskalieren. Bei vorgefertigten Guardrails (Focus, Content, Manipulation) wird das Gespräch derzeit beendet, wenn sie ausgelöst werden. Konfigurierbare Ausstiegsstrategien dafür sind bald verfügbar. In allen Fällen können Nutzer sofort ein neues Gespräch beginnen. Der Guardrail blockiert eine bestimmte Antwort, nicht den Nutzer.

Woran erkenne ich, welcher Guardrail ausgelöst wurde?+

Jeder Auslöser wird in Ihren Gesprächsanalysen protokolliert. Sie sehen, welche Guardrail ausgelöst wurde, warum und in welchem Gesprächskontext. Verwenden Sie dies, um Fehlalarme zu überprüfen und Ihre Regeln im Laufe der Zeit zu verfeinern.

Kann ich Guardrails in regulierten Branchen wie dem Gesundheitswesen oder dem Finanzwesen verwenden?+

Ja. Guardrails sind speziell für Einsätze mit hohen Anforderungen entwickelt worden. Mit Custom Guardrails können Sie domänenspezifische Richtlinien in natürlicher Sprache definieren, zum Beispiel „keine medizinischen Diagnosen stellen“ oder „keine bestimmten Investitionen empfehlen“. Diese Regeln werden in jeder Unterhaltung unabhängig durchgesetzt und helfen dabei, das Compliance-Risiko zu verringern, ohne dass eine eigene Infrastruktur erforderlich ist.

Guardrails 2.0 unterstützt außerdem die Ausrichtung auf die AIUC-1-Compliance sowie den Zugang zu den ersten KI-Versicherungspolicen der Branche. Dadurch fällt es Sicherheits- und Rechtsteams leichter, Produktionsbereitstellungen mitzutragen. Auch wenn Guardrails das Risiko erheblich senken, entfalten sie ihre beste Wirkung als Teil einer umfassenderen Compliance-Strategie und nicht als eigenständige Lösung.

Werden sensible Daten in Konversationsprotokollen gespeichert?+

Standardmäßig enthalten Konversationsprotokolle Transkript- und Audiodaten, um Analysen, Qualitätssicherung und die Verbesserung von Agents zu unterstützen. Wenn Sie die Offenlegung von Daten einschränken möchten, entfernt Conversation History Redaction automatisch ausgewählte sensible Informationen (z. B. Namen, Kreditkartennummern oder andere personenbezogene Daten) aus Transkripten, Aufzeichnungen und Webhook-Payloads, bevor diese gespeichert werden. Text wird durch typisierte Platzhalter ersetzt und das Audio wird gepiepst. Sie legen genau fest, welche Entitätstypen geschwärzt werden. Conversation History Redaction ist für Unternehmenskunden verfügbar.

Sollte ich Guardrails UND eine Härtung des System-Prompts verwenden?+

Ja, und das ist die empfohlene Konfiguration. Die Härtung des System-Prompts lenkt den Agenten zu den richtigen Antworten. Guardrails setzen Ihre Regeln unabhängig als Sicherheitsnetz durch, sodass selbst dann, wenn das Modell in einem langen Gespräch abdriftet, Verstöße vor der Auslieferung erkannt werden. Zusammen schaffen sie eine Verteidigung in der Tiefe.

Kann ich sie ausschalten?+

Ja. Jede Schutzmaßnahme kann einzeln ein- oder ausgeschaltet werden. Für die meisten Produktionsbereitstellungen empfehlen wir, alle Schutzmaßnahmen aktiviert zu lassen (insbesondere Focus). In manchen Fällen kann eine bestimmte Schutzmaßnahme mit dem vorgesehenen Anwendungsfall Ihres Agenten kollidieren. Wenn Sie sich nicht sicher sind, testen Sie es, bevor Sie sie deaktivieren.

Häufig gestellte Fragen

Verursachen Guardrails zusätzliche Latenz?

Minimal. Guardrails laufen parallel zur Antwortgenerierung und sind in der Regel abgeschlossen, bevor die vollständige Antwort zur Auslieferung bereit ist. In den meisten Fällen bemerken Nutzer überhaupt keine Verzögerung.

Sind Guardrails standardmäßig aktiviert?+

Vorgefertigte Guardrails sind derzeit standardmäßig deaktiviert, daher hat ein Upgrade keine Auswirkungen auf bestehende Agenten. Wir empfehlen, sie für jede Produktionsbereitstellung zu aktivieren (insbesondere Focus). In Kürze werden Guardrails für neue Agenten standardmäßig aktiviert sein. Sie können jeden einzelnen Guardrail jederzeit im Sicherheit-Tab Ihres Agenten ein- oder ausschalten.

Kosten sie Geld?+

Vorgefertigte Guardrails (Fokus, Inhalt, Manipulation) sind ohne zusätzliche Kosten enthalten. Benutzerdefinierte Guardrails werden nutzungsbasiert abgerechnet, und die Kosten werden wie andere LLM-Kosten weitergegeben. Sie können außerdem auswählen, welches Modell Ihre Regeln bewertet.

Was ist der Unterschied zwischen einem benutzerdefinierten Guardrail und einer Regel im System-Prompt?+

Dein System-Prompt steuert das Verhalten deines Agents, indem er ihm sagt, was er tun soll und wie er antworten soll. Ein benutzerdefinierter Guardrail bewertet jede Antwort des Agents nach ihrer Generierung unabhängig anhand deiner Regel und blockiert Verstöße, bevor sie den Nutzer erreichen. Betrachte deinen System-Prompt als Anweisungen und Guardrails als Durchsetzung.

Für deine wichtigsten Richtlinien empfehlen wir, beides zu verwenden: Der System-Prompt und der Focus Guardrail prägen das Verhalten, und der benutzerdefinierte Guardrail fängt alles ab, was durchrutscht, besonders in langen Gesprächen, in denen Modelle eher vom Kurs abweichen.

Was passiert mit dem Nutzer, wenn ein Guardrail ausgelöst wird?+

Das hängt vom Guardrail-Typ und davon ab, wie Sie ihn konfiguriert haben. Bei benutzerdefinierten Guardrails wählen Sie die Ausstiegsstrategie: das Gespräch beenden, an einen anderen Agenten übergeben oder an einen Menschen eskalieren. Bei vorgefertigten Guardrails (Focus, Content, Manipulation) wird das Gespräch derzeit beendet, wenn sie ausgelöst werden. Konfigurierbare Ausstiegsstrategien dafür sind bald verfügbar. In allen Fällen können Nutzer sofort ein neues Gespräch beginnen. Der Guardrail blockiert eine bestimmte Antwort, nicht den Nutzer.

Woran erkenne ich, welcher Guardrail ausgelöst wurde?+

Jeder Auslöser wird in Ihren Gesprächsanalysen protokolliert. Sie sehen, welche Guardrail ausgelöst wurde, warum und in welchem Gesprächskontext. Verwenden Sie dies, um Fehlalarme zu überprüfen und Ihre Regeln im Laufe der Zeit zu verfeinern.

Kann ich Guardrails in regulierten Branchen wie dem Gesundheitswesen oder dem Finanzwesen verwenden?+

Ja. Guardrails sind speziell für Einsätze mit hohen Anforderungen entwickelt worden. Mit Custom Guardrails können Sie domänenspezifische Richtlinien in natürlicher Sprache definieren, zum Beispiel „keine medizinischen Diagnosen stellen“ oder „keine bestimmten Investitionen empfehlen“. Diese Regeln werden in jeder Unterhaltung unabhängig durchgesetzt und helfen dabei, das Compliance-Risiko zu verringern, ohne dass eine eigene Infrastruktur erforderlich ist.

Guardrails 2.0 unterstützt außerdem die Ausrichtung auf die AIUC-1-Compliance sowie den Zugang zu den ersten KI-Versicherungspolicen der Branche. Dadurch fällt es Sicherheits- und Rechtsteams leichter, Produktionsbereitstellungen mitzutragen. Auch wenn Guardrails das Risiko erheblich senken, entfalten sie ihre beste Wirkung als Teil einer umfassenderen Compliance-Strategie und nicht als eigenständige Lösung.

Werden sensible Daten in Konversationsprotokollen gespeichert?+

Standardmäßig enthalten Konversationsprotokolle Transkript- und Audiodaten, um Analysen, Qualitätssicherung und die Verbesserung von Agents zu unterstützen. Wenn Sie die Offenlegung von Daten einschränken möchten, entfernt Conversation History Redaction automatisch ausgewählte sensible Informationen (z. B. Namen, Kreditkartennummern oder andere personenbezogene Daten) aus Transkripten, Aufzeichnungen und Webhook-Payloads, bevor diese gespeichert werden. Text wird durch typisierte Platzhalter ersetzt und das Audio wird gepiepst. Sie legen genau fest, welche Entitätstypen geschwärzt werden. Conversation History Redaction ist für Unternehmenskunden verfügbar.

Sollte ich Guardrails UND eine Härtung des System-Prompts verwenden?+

Ja, und das ist die empfohlene Konfiguration. Die Härtung des System-Prompts lenkt den Agenten zu den richtigen Antworten. Guardrails setzen Ihre Regeln unabhängig als Sicherheitsnetz durch, sodass selbst dann, wenn das Modell in einem langen Gespräch abdriftet, Verstöße vor der Auslieferung erkannt werden. Zusammen schaffen sie eine Verteidigung in der Tiefe.

Kann ich sie ausschalten?+

Ja. Jede Schutzmaßnahme kann einzeln ein- oder ausgeschaltet werden. Für die meisten Produktionsbereitstellungen empfehlen wir, alle Schutzmaßnahmen aktiviert zu lassen (insbesondere Focus). In manchen Fällen kann eine bestimmte Schutzmaßnahme mit dem vorgesehenen Anwendungsfall Ihres Agenten kollidieren. Wenn Sie sich nicht sicher sind, testen Sie es, bevor Sie sie deaktivieren.

Bereit, sicherere und zuverlässigere Agenten einzusetzen?

Testen Sie Guardrails noch heute in nur wenigen Minuten und gewinnen Sie unternehmensweite Kontrolle über Ihre KI-Agenten.

Bereit, sicherere und zuverlässigere Agenten einzusetzen?

Testen Sie Guardrails noch heute in nur wenigen Minuten und gewinnen Sie unternehmensweite Kontrolle über Ihre KI-Agenten.