Neu
Leitplanken 2.0
Sorgen Sie dafür, dass Agenten in großem Maßstab markenkonform und regelkonform bleiben
Mit vorgefertigten Schutzmaßnahmen und benutzerdefinierten Regeln, die in Echtzeit mit minimaler zusätzlicher Latenz ausgeführt werden, macht Guardrails 2.0 es einfach, zu steuern, wie sich Agenten in der Produktion verhalten.
Verfügbar für alle ElevenAgents-Nutzer
Minimale Auswirkung auf die Latenz
AIUC-1 zertifiziert
Neu
Leitplanken 2.0
Sorgen Sie dafür, dass Agenten in großem Maßstab markenkonform und regelkonform bleiben
Mit vorgefertigten Schutzmaßnahmen und benutzerdefinierten Regeln, die in Echtzeit mit minimaler zusätzlicher Latenz ausgeführt werden, macht Guardrails 2.0 es einfach, zu steuern, wie sich Agenten in der Produktion verhalten.
Verfügbar für alle ElevenAgents-Nutzer
Minimale Auswirkung auf die Latenz
AIUC-1 zertifiziert
Neu
Leitplanken 2.0
Sorgen Sie dafür, dass Agenten in großem Maßstab markenkonform und regelkonform bleiben
Mit vorgefertigten Schutzmaßnahmen und benutzerdefinierten Regeln, die in Echtzeit mit minimaler zusätzlicher Latenz ausgeführt werden, macht Guardrails 2.0 es einfach, zu steuern, wie sich Agenten in der Produktion verhalten.
Verfügbar für alle ElevenAgents-Nutzer
Minimale Auswirkung auf die Latenz
AIUC-1 zertifiziert
Vertraut von über 7.500.000 Unternehmen und Kreativen
Vertraut von über 7.500.000 Unternehmen und Kreativen
Vertraut von über 7.500.000 Unternehmen und Kreativen
Sicherheit auf Enterprise-Niveau, extrem geringe Latenz
Da Sprachagenten immer komplexere Workflows mit höherer Tragweite übernehmen, kann eine einzige unbeabsichtigte Antwort das Vertrauen der Nutzer untergraben, Compliance-Risiken verursachen oder kostspielige Eskalationen auslösen. Guardrails 2.0 sorgt dafür, dass das niemals passiert.
Antwort in Echtzeit mit minimaler Latenz
Prüfungen werden parallel zur Antwortgenerierung ausgeführt
Validiert jede Agentenantwort anhand Ihrer Richtlinien
Sicherheit auf Enterprise-Niveau, extrem geringe Latenz
Da Sprachagenten immer komplexere Workflows mit höherer Tragweite übernehmen, kann eine einzige unbeabsichtigte Antwort das Vertrauen der Nutzer untergraben, Compliance-Risiken verursachen oder kostspielige Eskalationen auslösen. Guardrails 2.0 sorgt dafür, dass das niemals passiert.
Antwort in Echtzeit mit minimaler Latenz
Prüfungen werden parallel zur Antwortgenerierung ausgeführt
Validiert jede Agentenantwort anhand Ihrer Richtlinien
Sicherheit auf Enterprise-Niveau, extrem geringe Latenz
Da Sprachagenten immer komplexere Workflows mit höherer Tragweite übernehmen, kann eine einzige unbeabsichtigte Antwort das Vertrauen der Nutzer untergraben, Compliance-Risiken verursachen oder kostspielige Eskalationen auslösen. Guardrails 2.0 sorgt dafür, dass das niemals passiert.
Antwort in Echtzeit mit minimaler Latenz
Prüfungen werden parallel zur Antwortgenerierung ausgeführt
Validiert jede Agentenantwort anhand Ihrer Richtlinien
Zwei Schutzschichten
Guardrails verstärken die Systemanweisung mit zusätzlichen Anweisungen, die Agenten in ihrer Rolle verankert halten, insbesondere bei längeren oder komplexeren Anrufen, bei denen ein Abdriften am wahrscheinlichsten ist.

Separate Prüfungen werden bei jeder Antwort ausgeführt, bevor sie den Nutzer erreicht. Wenn ein Verstoß erkannt wird, wird die Antwort blockiert und das System führt die von Ihnen festgelegte Aktion aus: beenden, erneut versuchen oder eskalieren.

Zwei Schutzschichten
Guardrails verstärken die Systemanweisung mit zusätzlichen Anweisungen, die Agenten in ihrer Rolle verankert halten, insbesondere bei längeren oder komplexeren Anrufen, bei denen ein Abdriften am wahrscheinlichsten ist.

Separate Prüfungen werden bei jeder Antwort ausgeführt, bevor sie den Nutzer erreicht. Wenn ein Verstoß erkannt wird, wird die Antwort blockiert und das System führt die von Ihnen festgelegte Aktion aus: beenden, erneut versuchen oder eskalieren.

Zwei Schutzschichten
Guardrails verstärken die Systemanweisung mit zusätzlichen Anweisungen, die Agenten in ihrer Rolle verankert halten, insbesondere bei längeren oder komplexeren Anrufen, bei denen ein Abdriften am wahrscheinlichsten ist.

Separate Prüfungen werden bei jeder Antwort ausgeführt, bevor sie den Nutzer erreicht. Wenn ein Verstoß erkannt wird, wird die Antwort blockiert und das System führt die von Ihnen festgelegte Aktion aus: beenden, erneut versuchen oder eskalieren.

Du entscheidest, was als Nächstes passiert
Wenn eine benutzerdefinierte Guardrail ausgelöst wird, entscheiden Sie über das Ergebnis.
Benutzerdefiniert
Leitplanke
ausgelöst
Anruf beenden
Das Gespräch wird sofort beendet und der Anruf wird getrennt
Fallback bereitstellen
Der Agent antwortet mit einer vordefinierten Nachricht, wiederholt es, beendet es oder setzt es fort
An Menschen weiterleiten
Der Anruf wird zur manuellen Bearbeitung an einen menschlichen Mitarbeiter weitergeleitet
Jede Auslösung wird in Ihrem Analytics-Dashboard protokolliert, mit Details dazu, welcher Guardrail ausgelöst wurde und warum.
Du entscheidest, was als Nächstes passiert
Wenn eine benutzerdefinierte Guardrail ausgelöst wird, entscheiden Sie über das Ergebnis.
Benutzerdefiniert
Leitplanke
ausgelöst
Anruf beenden
Das Gespräch wird sofort beendet und der Anruf wird getrennt
Fallback bereitstellen
Der Agent antwortet mit einer vordefinierten Nachricht, wiederholt es, beendet es oder setzt es fort
An Menschen weiterleiten
Der Anruf wird zur manuellen Bearbeitung an einen menschlichen Mitarbeiter weitergeleitet
Jede Auslösung wird in Ihrem Analytics-Dashboard protokolliert, mit Details dazu, welcher Guardrail ausgelöst wurde und warum.
Du entscheidest, was als Nächstes passiert
Benutzerdefiniert
Leitplanke
ausgelöst
Anruf beenden
Das Gespräch wird sofort beendet und der Anruf wird getrennt
Fallback bereitstellen
Der Agent antwortet mit einer vordefinierten Nachricht, wiederholt es, beendet es oder setzt es fort
An Menschen weiterleiten
Der Anruf wird zur manuellen Bearbeitung an einen menschlichen Mitarbeiter weitergeleitet
Jede Auslösung wird in Ihrem Analytics-Dashboard protokolliert, mit Details dazu, welcher Guardrail ausgelöst wurde und warum.
Vorgefertigte Schutzmechanismen und benutzerdefinierte Steuerung
Vorgefertigte Leitplanken
Benutzerdefinierte Leitplanken
Halten Sie Agenten in langen, komplexen Interaktionen beim Thema. Erkennt Abweichungen vom beabsichtigten Thema, der Rolle oder dem Ton des Agenten und bekräftigt die ursprüngliche Absicht.
Stellen Sie angemessene Antworten sicher. Verhindert unzulässige Inhalte in Agentenantworten vor der Auslieferung, einschließlich sexuell explizitem oder gewalttätigem Material.
Schützt vor böswilligen Akteuren und Prompt-Injection. Blockiert Versuche, Systemanweisungen zu umgehen, einschließlich Überschreibungen und adversarischer Angriffe.
Vorgefertigte Schutzmechanismen und benutzerdefinierte Steuerung
Vorgefertigte Leitplanken
Benutzerdefinierte Leitplanken
Halten Sie Agenten in langen, komplexen Interaktionen beim Thema. Erkennt Abweichungen vom beabsichtigten Thema, der Rolle oder dem Ton des Agenten und bekräftigt die ursprüngliche Absicht.
Stellen Sie angemessene Antworten sicher. Verhindert unzulässige Inhalte in Agentenantworten vor der Auslieferung, einschließlich sexuell explizitem oder gewalttätigem Material.
Schützt vor böswilligen Akteuren und Prompt-Injection. Blockiert Versuche, Systemanweisungen zu umgehen, einschließlich Überschreibungen und adversarischer Angriffe.
Vorgefertigte Schutzmechanismen und benutzerdefinierte Steuerung
Vorgefertigte Leitplanken
Benutzerdefinierte Leitplanken
Halten Sie Agenten in langen, komplexen Interaktionen beim Thema. Erkennt Abweichungen vom beabsichtigten Thema, der Rolle oder dem Ton des Agenten und bekräftigt die ursprüngliche Absicht.
Stellen Sie angemessene Antworten sicher. Verhindert unzulässige Inhalte in Agentenantworten vor der Auslieferung, einschließlich sexuell explizitem oder gewalttätigem Material.
Schützt vor böswilligen Akteuren und Prompt-Injection. Blockiert Versuche, Systemanweisungen zu umgehen, einschließlich Überschreibungen und adversarischer Angriffe.
Sensible Informationen automatisch schwärzen
Nachdem ein Anruf beendet wurde, erkennen und schwärzen Sie automatisch ausgewählte sensible Informationen in Ihren Transkripten, Aufzeichnungen und Webhook-Payloads.

Erkannte Entitäten werden im Text durch typisierte Platzhalter ersetzt und in der Audiodatei weggepiept, wobei der Gesprächskontext für die Überprüfung und zukünftige Analyse erhalten bleibt.

Sensible Informationen automatisch schwärzen
Nachdem ein Anruf beendet wurde, erkennen und schwärzen Sie automatisch ausgewählte sensible Informationen in Ihren Transkripten, Aufzeichnungen und Webhook-Payloads.

Erkannte Entitäten werden im Text durch typisierte Platzhalter ersetzt und in der Audiodatei weggepiept, wobei der Gesprächskontext für die Überprüfung und zukünftige Analyse erhalten bleibt.

Sensible Informationen automatisch schwärzen
Nachdem ein Anruf beendet wurde, erkennen und schwärzen Sie automatisch ausgewählte sensible Informationen in Ihren Transkripten, Aufzeichnungen und Webhook-Payloads.

Erkannte Entitäten werden im Text durch typisierte Platzhalter ersetzt und in der Audiodatei weggepiept, wobei der Gesprächskontext für die Überprüfung und zukünftige Analyse erhalten bleibt.


Teil eines umfassenderen Sicherheitsfundaments
Guardrails 2.0 unterstützt Enterprise-Implementierungen von ElevenAgents sowie Sicherheitsmaßnahmen vor dem Produktivgang, Monitoring nach der Bereitstellung und Zugriff auf die ersten Versicherungspolicen der Branche, abgesichert durch die AIUC-1-Zertifizierung.

Teil eines umfassenderen Sicherheitsfundaments
Guardrails 2.0 unterstützt Enterprise-Implementierungen von ElevenAgents sowie Sicherheitsmaßnahmen vor dem Produktivgang, Monitoring nach der Bereitstellung und Zugriff auf die ersten Versicherungspolicen der Branche, abgesichert durch die AIUC-1-Zertifizierung.

Teil eines umfassenderen Sicherheitsfundaments
Guardrails 2.0 unterstützt Enterprise-Implementierungen von ElevenAgents sowie Sicherheitsmaßnahmen vor dem Produktivgang, Monitoring nach der Bereitstellung und Zugriff auf die ersten Versicherungspolicen der Branche, abgesichert durch die AIUC-1-Zertifizierung.
Häufig gestellte Fragen
Minimal. Guardrails laufen parallel zur Antwortgenerierung und sind in der Regel abgeschlossen, bevor die vollständige Antwort zur Auslieferung bereit ist. In den meisten Fällen bemerken Nutzer überhaupt keine Verzögerung.
Vorgefertigte Guardrails sind derzeit standardmäßig deaktiviert, daher hat ein Upgrade keine Auswirkungen auf bestehende Agenten. Wir empfehlen, sie für jede Produktionsbereitstellung zu aktivieren (insbesondere Focus). In Kürze werden Guardrails für neue Agenten standardmäßig aktiviert sein. Sie können jeden einzelnen Guardrail jederzeit im Sicherheit-Tab Ihres Agenten ein- oder ausschalten.
Vorgefertigte Guardrails (Fokus, Inhalt, Manipulation) sind ohne zusätzliche Kosten enthalten. Benutzerdefinierte Guardrails werden nutzungsbasiert abgerechnet, und die Kosten werden wie andere LLM-Kosten weitergegeben. Sie können außerdem auswählen, welches Modell Ihre Regeln bewertet.
Dein System-Prompt steuert das Verhalten deines Agents, indem er ihm sagt, was er tun soll und wie er antworten soll. Ein benutzerdefinierter Guardrail bewertet jede Antwort des Agents nach ihrer Generierung unabhängig anhand deiner Regel und blockiert Verstöße, bevor sie den Nutzer erreichen. Betrachte deinen System-Prompt als Anweisungen und Guardrails als Durchsetzung.
Für deine wichtigsten Richtlinien empfehlen wir, beides zu verwenden: Der System-Prompt und der Focus Guardrail prägen das Verhalten, und der benutzerdefinierte Guardrail fängt alles ab, was durchrutscht, besonders in langen Gesprächen, in denen Modelle eher vom Kurs abweichen.
Das hängt vom Guardrail-Typ und davon ab, wie Sie ihn konfiguriert haben. Bei benutzerdefinierten Guardrails wählen Sie die Ausstiegsstrategie: das Gespräch beenden, an einen anderen Agenten übergeben oder an einen Menschen eskalieren. Bei vorgefertigten Guardrails (Focus, Content, Manipulation) wird das Gespräch derzeit beendet, wenn sie ausgelöst werden. Konfigurierbare Ausstiegsstrategien dafür sind bald verfügbar. In allen Fällen können Nutzer sofort ein neues Gespräch beginnen. Der Guardrail blockiert eine bestimmte Antwort, nicht den Nutzer.
Jeder Auslöser wird in Ihren Gesprächsanalysen protokolliert. Sie sehen, welche Guardrail ausgelöst wurde, warum und in welchem Gesprächskontext. Verwenden Sie dies, um Fehlalarme zu überprüfen und Ihre Regeln im Laufe der Zeit zu verfeinern.
Ja. Guardrails sind speziell für Einsätze mit hohen Anforderungen entwickelt worden. Mit Custom Guardrails können Sie domänenspezifische Richtlinien in natürlicher Sprache definieren, zum Beispiel „keine medizinischen Diagnosen stellen“ oder „keine bestimmten Investitionen empfehlen“. Diese Regeln werden in jeder Unterhaltung unabhängig durchgesetzt und helfen dabei, das Compliance-Risiko zu verringern, ohne dass eine eigene Infrastruktur erforderlich ist.
Guardrails 2.0 unterstützt außerdem die Ausrichtung auf die AIUC-1-Compliance sowie den Zugang zu den ersten KI-Versicherungspolicen der Branche. Dadurch fällt es Sicherheits- und Rechtsteams leichter, Produktionsbereitstellungen mitzutragen. Auch wenn Guardrails das Risiko erheblich senken, entfalten sie ihre beste Wirkung als Teil einer umfassenderen Compliance-Strategie und nicht als eigenständige Lösung.
Standardmäßig enthalten Konversationsprotokolle Transkript- und Audiodaten, um Analysen, Qualitätssicherung und die Verbesserung von Agents zu unterstützen. Wenn Sie die Offenlegung von Daten einschränken möchten, entfernt Conversation History Redaction automatisch ausgewählte sensible Informationen (z. B. Namen, Kreditkartennummern oder andere personenbezogene Daten) aus Transkripten, Aufzeichnungen und Webhook-Payloads, bevor diese gespeichert werden. Text wird durch typisierte Platzhalter ersetzt und das Audio wird gepiepst. Sie legen genau fest, welche Entitätstypen geschwärzt werden. Conversation History Redaction ist für Unternehmenskunden verfügbar.
Ja, und das ist die empfohlene Konfiguration. Die Härtung des System-Prompts lenkt den Agenten zu den richtigen Antworten. Guardrails setzen Ihre Regeln unabhängig als Sicherheitsnetz durch, sodass selbst dann, wenn das Modell in einem langen Gespräch abdriftet, Verstöße vor der Auslieferung erkannt werden. Zusammen schaffen sie eine Verteidigung in der Tiefe.
Ja. Jede Schutzmaßnahme kann einzeln ein- oder ausgeschaltet werden. Für die meisten Produktionsbereitstellungen empfehlen wir, alle Schutzmaßnahmen aktiviert zu lassen (insbesondere Focus). In manchen Fällen kann eine bestimmte Schutzmaßnahme mit dem vorgesehenen Anwendungsfall Ihres Agenten kollidieren. Wenn Sie sich nicht sicher sind, testen Sie es, bevor Sie sie deaktivieren.
Häufig gestellte Fragen
Minimal. Guardrails laufen parallel zur Antwortgenerierung und sind in der Regel abgeschlossen, bevor die vollständige Antwort zur Auslieferung bereit ist. In den meisten Fällen bemerken Nutzer überhaupt keine Verzögerung.
Vorgefertigte Guardrails sind derzeit standardmäßig deaktiviert, daher hat ein Upgrade keine Auswirkungen auf bestehende Agenten. Wir empfehlen, sie für jede Produktionsbereitstellung zu aktivieren (insbesondere Focus). In Kürze werden Guardrails für neue Agenten standardmäßig aktiviert sein. Sie können jeden einzelnen Guardrail jederzeit im Sicherheit-Tab Ihres Agenten ein- oder ausschalten.
Vorgefertigte Guardrails (Fokus, Inhalt, Manipulation) sind ohne zusätzliche Kosten enthalten. Benutzerdefinierte Guardrails werden nutzungsbasiert abgerechnet, und die Kosten werden wie andere LLM-Kosten weitergegeben. Sie können außerdem auswählen, welches Modell Ihre Regeln bewertet.
Dein System-Prompt steuert das Verhalten deines Agents, indem er ihm sagt, was er tun soll und wie er antworten soll. Ein benutzerdefinierter Guardrail bewertet jede Antwort des Agents nach ihrer Generierung unabhängig anhand deiner Regel und blockiert Verstöße, bevor sie den Nutzer erreichen. Betrachte deinen System-Prompt als Anweisungen und Guardrails als Durchsetzung.
Für deine wichtigsten Richtlinien empfehlen wir, beides zu verwenden: Der System-Prompt und der Focus Guardrail prägen das Verhalten, und der benutzerdefinierte Guardrail fängt alles ab, was durchrutscht, besonders in langen Gesprächen, in denen Modelle eher vom Kurs abweichen.
Das hängt vom Guardrail-Typ und davon ab, wie Sie ihn konfiguriert haben. Bei benutzerdefinierten Guardrails wählen Sie die Ausstiegsstrategie: das Gespräch beenden, an einen anderen Agenten übergeben oder an einen Menschen eskalieren. Bei vorgefertigten Guardrails (Focus, Content, Manipulation) wird das Gespräch derzeit beendet, wenn sie ausgelöst werden. Konfigurierbare Ausstiegsstrategien dafür sind bald verfügbar. In allen Fällen können Nutzer sofort ein neues Gespräch beginnen. Der Guardrail blockiert eine bestimmte Antwort, nicht den Nutzer.
Jeder Auslöser wird in Ihren Gesprächsanalysen protokolliert. Sie sehen, welche Guardrail ausgelöst wurde, warum und in welchem Gesprächskontext. Verwenden Sie dies, um Fehlalarme zu überprüfen und Ihre Regeln im Laufe der Zeit zu verfeinern.
Ja. Guardrails sind speziell für Einsätze mit hohen Anforderungen entwickelt worden. Mit Custom Guardrails können Sie domänenspezifische Richtlinien in natürlicher Sprache definieren, zum Beispiel „keine medizinischen Diagnosen stellen“ oder „keine bestimmten Investitionen empfehlen“. Diese Regeln werden in jeder Unterhaltung unabhängig durchgesetzt und helfen dabei, das Compliance-Risiko zu verringern, ohne dass eine eigene Infrastruktur erforderlich ist.
Guardrails 2.0 unterstützt außerdem die Ausrichtung auf die AIUC-1-Compliance sowie den Zugang zu den ersten KI-Versicherungspolicen der Branche. Dadurch fällt es Sicherheits- und Rechtsteams leichter, Produktionsbereitstellungen mitzutragen. Auch wenn Guardrails das Risiko erheblich senken, entfalten sie ihre beste Wirkung als Teil einer umfassenderen Compliance-Strategie und nicht als eigenständige Lösung.
Standardmäßig enthalten Konversationsprotokolle Transkript- und Audiodaten, um Analysen, Qualitätssicherung und die Verbesserung von Agents zu unterstützen. Wenn Sie die Offenlegung von Daten einschränken möchten, entfernt Conversation History Redaction automatisch ausgewählte sensible Informationen (z. B. Namen, Kreditkartennummern oder andere personenbezogene Daten) aus Transkripten, Aufzeichnungen und Webhook-Payloads, bevor diese gespeichert werden. Text wird durch typisierte Platzhalter ersetzt und das Audio wird gepiepst. Sie legen genau fest, welche Entitätstypen geschwärzt werden. Conversation History Redaction ist für Unternehmenskunden verfügbar.
Ja, und das ist die empfohlene Konfiguration. Die Härtung des System-Prompts lenkt den Agenten zu den richtigen Antworten. Guardrails setzen Ihre Regeln unabhängig als Sicherheitsnetz durch, sodass selbst dann, wenn das Modell in einem langen Gespräch abdriftet, Verstöße vor der Auslieferung erkannt werden. Zusammen schaffen sie eine Verteidigung in der Tiefe.
Ja. Jede Schutzmaßnahme kann einzeln ein- oder ausgeschaltet werden. Für die meisten Produktionsbereitstellungen empfehlen wir, alle Schutzmaßnahmen aktiviert zu lassen (insbesondere Focus). In manchen Fällen kann eine bestimmte Schutzmaßnahme mit dem vorgesehenen Anwendungsfall Ihres Agenten kollidieren. Wenn Sie sich nicht sicher sind, testen Sie es, bevor Sie sie deaktivieren.
Häufig gestellte Fragen
Minimal. Guardrails laufen parallel zur Antwortgenerierung und sind in der Regel abgeschlossen, bevor die vollständige Antwort zur Auslieferung bereit ist. In den meisten Fällen bemerken Nutzer überhaupt keine Verzögerung.
Vorgefertigte Guardrails sind derzeit standardmäßig deaktiviert, daher hat ein Upgrade keine Auswirkungen auf bestehende Agenten. Wir empfehlen, sie für jede Produktionsbereitstellung zu aktivieren (insbesondere Focus). In Kürze werden Guardrails für neue Agenten standardmäßig aktiviert sein. Sie können jeden einzelnen Guardrail jederzeit im Sicherheit-Tab Ihres Agenten ein- oder ausschalten.
Vorgefertigte Guardrails (Fokus, Inhalt, Manipulation) sind ohne zusätzliche Kosten enthalten. Benutzerdefinierte Guardrails werden nutzungsbasiert abgerechnet, und die Kosten werden wie andere LLM-Kosten weitergegeben. Sie können außerdem auswählen, welches Modell Ihre Regeln bewertet.
Dein System-Prompt steuert das Verhalten deines Agents, indem er ihm sagt, was er tun soll und wie er antworten soll. Ein benutzerdefinierter Guardrail bewertet jede Antwort des Agents nach ihrer Generierung unabhängig anhand deiner Regel und blockiert Verstöße, bevor sie den Nutzer erreichen. Betrachte deinen System-Prompt als Anweisungen und Guardrails als Durchsetzung.
Für deine wichtigsten Richtlinien empfehlen wir, beides zu verwenden: Der System-Prompt und der Focus Guardrail prägen das Verhalten, und der benutzerdefinierte Guardrail fängt alles ab, was durchrutscht, besonders in langen Gesprächen, in denen Modelle eher vom Kurs abweichen.
Das hängt vom Guardrail-Typ und davon ab, wie Sie ihn konfiguriert haben. Bei benutzerdefinierten Guardrails wählen Sie die Ausstiegsstrategie: das Gespräch beenden, an einen anderen Agenten übergeben oder an einen Menschen eskalieren. Bei vorgefertigten Guardrails (Focus, Content, Manipulation) wird das Gespräch derzeit beendet, wenn sie ausgelöst werden. Konfigurierbare Ausstiegsstrategien dafür sind bald verfügbar. In allen Fällen können Nutzer sofort ein neues Gespräch beginnen. Der Guardrail blockiert eine bestimmte Antwort, nicht den Nutzer.
Jeder Auslöser wird in Ihren Gesprächsanalysen protokolliert. Sie sehen, welche Guardrail ausgelöst wurde, warum und in welchem Gesprächskontext. Verwenden Sie dies, um Fehlalarme zu überprüfen und Ihre Regeln im Laufe der Zeit zu verfeinern.
Ja. Guardrails sind speziell für Einsätze mit hohen Anforderungen entwickelt worden. Mit Custom Guardrails können Sie domänenspezifische Richtlinien in natürlicher Sprache definieren, zum Beispiel „keine medizinischen Diagnosen stellen“ oder „keine bestimmten Investitionen empfehlen“. Diese Regeln werden in jeder Unterhaltung unabhängig durchgesetzt und helfen dabei, das Compliance-Risiko zu verringern, ohne dass eine eigene Infrastruktur erforderlich ist.
Guardrails 2.0 unterstützt außerdem die Ausrichtung auf die AIUC-1-Compliance sowie den Zugang zu den ersten KI-Versicherungspolicen der Branche. Dadurch fällt es Sicherheits- und Rechtsteams leichter, Produktionsbereitstellungen mitzutragen. Auch wenn Guardrails das Risiko erheblich senken, entfalten sie ihre beste Wirkung als Teil einer umfassenderen Compliance-Strategie und nicht als eigenständige Lösung.
Standardmäßig enthalten Konversationsprotokolle Transkript- und Audiodaten, um Analysen, Qualitätssicherung und die Verbesserung von Agents zu unterstützen. Wenn Sie die Offenlegung von Daten einschränken möchten, entfernt Conversation History Redaction automatisch ausgewählte sensible Informationen (z. B. Namen, Kreditkartennummern oder andere personenbezogene Daten) aus Transkripten, Aufzeichnungen und Webhook-Payloads, bevor diese gespeichert werden. Text wird durch typisierte Platzhalter ersetzt und das Audio wird gepiepst. Sie legen genau fest, welche Entitätstypen geschwärzt werden. Conversation History Redaction ist für Unternehmenskunden verfügbar.
Ja, und das ist die empfohlene Konfiguration. Die Härtung des System-Prompts lenkt den Agenten zu den richtigen Antworten. Guardrails setzen Ihre Regeln unabhängig als Sicherheitsnetz durch, sodass selbst dann, wenn das Modell in einem langen Gespräch abdriftet, Verstöße vor der Auslieferung erkannt werden. Zusammen schaffen sie eine Verteidigung in der Tiefe.
Ja. Jede Schutzmaßnahme kann einzeln ein- oder ausgeschaltet werden. Für die meisten Produktionsbereitstellungen empfehlen wir, alle Schutzmaßnahmen aktiviert zu lassen (insbesondere Focus). In manchen Fällen kann eine bestimmte Schutzmaßnahme mit dem vorgesehenen Anwendungsfall Ihres Agenten kollidieren. Wenn Sie sich nicht sicher sind, testen Sie es, bevor Sie sie deaktivieren.
Bereit, sicherere und zuverlässigere Agenten einzusetzen?
Testen Sie Guardrails noch heute in nur wenigen Minuten und gewinnen Sie unternehmensweite Kontrolle über Ihre KI-Agenten.
Bereit, sicherere und zuverlässigere Agenten einzusetzen?
Testen Sie Guardrails noch heute in nur wenigen Minuten und gewinnen Sie unternehmensweite Kontrolle über Ihre KI-Agenten.