SpeechIVR

Dokumentation für Modulversion 1.7.3 ab STARFACE 9.0.0.0

Produktbeschreibung

Mit einer sprachgesteuerten IVR müssen Anrufer nicht länger Tasteneingaben vornehmen. Eine Eingabe kann bequem per Spracheingabe vorgenommen werden.

Anwendungsbeispiel

Anrufer, können "Hands free", zum beispiel beim Nutzen einer Freisprecheinrichtung im Auto, die Hotline bedienen und sich so beispielsweise per Sprachbefehl zum Support verbinden lassen.

Technische Voraussetzungen

ab STARFACE 9.0.0.0
Für dieses Modul stehen legacy Versionen ab STARFACE 8.0.0.5 zur Verfügung.
Server mit Docker, mind. 4 Core, 8GB Ram, 12GB HDD.
OpenAi API-Key
uneingeschränkt Cloud-ready.

Vorbereitung der IT-Umgebung:

Docker installieren

Per SSH Shell auf dem Server anmelden.
Docker Key Hinzufügen mit folgendem Befehl.

sudo apt-get update
sudo apt-get install ca-certificates curl
sudo install -m 0755 -d /etc/apt/keyrings
sudo curl -fsSL https://download.docker.com/linux/debian/gpg -o /etc/apt/keyrings/docker.asc
sudo chmod a+r /etc/apt/keyrings/docker.asc

Docker Repository zu den APT Quellen hinzufügen.

echo \
  "deb [arch=$(dpkg --print-architecture) signed-by=/etc/apt/keyrings/docker.asc] https://download.docker.com/linux/debian \
  $(. /etc/os-release && echo "$VERSION_CODENAME") stable" | \
  sudo tee /etc/apt/sources.list.d/docker.list > /dev/null
sudo apt-get update

Docker Installieren.

sudo apt-get install docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin

Installation verifizieren mit Hello-World Programm.

sudo docker run hello-world

Kaldi Container starten

Mit dem folgenden Befehl wird der Voice-To-Text Dienst gestartet.

docker run -d \
    --name kaldi-de \
    -p 2700:2700 \
    --restart no \
    alphacep/kaldi-de:latest

STARFACE-Konfiguration

Es muss vorab keine Konfiguration in der STARFACE vorgenommen werden.

Modulkonfiguration

Allgemein

Name:
- Wähle hier den Namen der Modulinstanz. Dieser Name sollte möglichst beschreibend vergeben werden, ein guter Ausgangspunkt ist der Name des Moduls. Sollen mehrere Instanzen des selben Moduls aktiv sein, muss für jede Instanz ein einmaliger Name vergeben werden.
Beschreibung:
- Dieses Feld bietet Raum für eine detailliertere Dokumentation der Instanz. Hier kann beispielsweise dokumentiert werden, auf welche Nutzer/Gruppen das Modul zugreift.
Logdatei:
- Jedes Modul informiert in den Leveln "ERROR, WARN, INFO, DEBUG, TRACE" in den jeweils verschiedenen Abstufungen über Prozesse, die im Modulbetrieb ablaufen. Falls ein Fehler auftritt hat man hier die Möglichkeit, die Logdatei zu speichern. Standardeinstellung ist das Level "INFO".

Das Log aktualisiert sich nicht automatisch, sondern nur, wenn die entsprechende Schaltfläche betätigt wird.

Rufnummern

Hier füge durch + eine oder mehrere Rufnummern hinzu, auf die das Modul reagieren soll. Es sind interne oder externe Rufnummern möglich.

Ansagen

Hier können die beiden IVR Ansagen im WAV-Audioformat hochgeladen werden, die den Anrufer durch die IVR leiten.

Die „Erstansage“ wird abgespielt, wenn der Anrufer sich zuerst verbindet. In der Regel ist dies eine Erläuterung zur IVR, die dem Kunden Beispiele zu den Schlüsselworten gibt. Wird bei der Spracheingabe des Anrufers kein Schlüsselwort erkannt, wird die zweite Ansage, „Erneuter Versuch“ abgespielt und der Anrufer hat erneut die Möglichkeit ein Schlüsselwort zu nennen. Wenn der Anrufer die unter „Versuche“ konfigurierte Anzahl an Versuchen überschritten hat, wird er zur DTMF Eingabe weitergeleitet.

Umleitungen

Konfiguriere bei "Umleitungen" die Schlüsselwörter, auf die das Modul reagiert. Auch das entsprechende Weiterleitungsziel wird hier definiert.

KI-Analyse mit OpenAi

Aktiviere die Checkbox, um Spracheingaben des Anrufers mit Hilfe eines LLM (Large Language Model, ugs. "KI") von OpenAi zu analysieren.
Unter dem Punkt "Zusätzliche Informationen für die KI" kann dem LLM Kontext gegeben werden.
Funktionsweise
- Das Modul stellt dem LLM eine Schlagwortliste sowie ein vorgefertigtes Prompt bereit. Die KI gibt daraus nur ein einziges, bestpassendes Schlagwort an das Modul zurück.
Erweiterungen
- Falls spezielle Anforderungen bestehen (z. B. die Trennung nach Abteilungen innerhalb eines Unternehmens), müssen diese Informationen zusätzlich im Prompt angegeben werden, da sie nicht standardmäßig berücksichtigt sind.

Die KI arbeitet zuverlässig, kann aber in Einzelfällen abweichende Ergebnisse liefern. Die vorgeschlagenen Schlagworte sollten immer auf Plausibilität geprüft werden.

DTMF

Kann kein gültiges Schlüsselwort aus der Spracheingabe erkannt werden, erhält der Anrufer die Möglichkeit, seine Auswahl manuell über eine Mehrfrequenzwahleingabe (DTMF) zu treffen.
Unter dem Menüpunkt Weiterleitungen können folgende Elemente konfiguriert werden:
- Eingabe: Eine numerische Taste (z. B. 1, 2, 3), die vom Anrufer gedrückt werden kann
- Weiterleitung: Die zugehörige Zielrufnummer oder Abteilung, an die die Verbindung erfolgt

*Zusätzlich kann eine Ansage bereitgestellt werden, die den weiteren Ablauf für den Anrufer erläutert. Hierfür stehen zwei Optionen zur Verfügung: Hochladen einer Audiodatei im WAV-Format Verwendung einer automatisch generierten Text-to-Speech-Ansage durch eine KI-Stimme

KI

Wähle bei STT-Engine aus, welches KI-Modell für die Spracherkennung verwendet werden soll.
Wähle bei TTS-Engine aus, welches KI-Modell für die Text-To-Speech Funktion verwendet werden soll.

OpenAi

Füge den OpenAi API-Schlüssel ein.
Wähle aus dem Dropdown Menü die gewünschte Stimme aus.

Whisper Local

Erfordert STARFACE Cloud.
Wähle die gewünschte Stimme aus.

Kaldi

Lokal gehostet
Trage die Serveradresse und den Port ein, under der die Kaldi Instanz im Netzwerk erreichbar ist.

CoquiTTS

Konfiguriere hier die SSH Verbindung zu dem Server, auf dem die CoquiTTS Instanz läuft oder installiert werden soll.
Das Zielverzeichnis muss bereits existieren und als absoluter Pfad angegeben werden.
Der Fingerprint wird nach dem ersten Modulstart im Modullog angezeigt.

Bekannte Probleme

Bei diesem Modul liegen keine bekannten Probleme vor.
Problem entdeckt? Schicke eine E-Mail an support@o-byte.com, um Fehler zu melden!

Versionshinweis

1.7.4
- Fix: Typos in der GUI korrigiert.
- Neu: Optionen für KI-generierte Ansagen hinzugefügt
- Neu: OpenAI und Whisper Local als Optionen für die Spracherkennung hinzugefügt
- Neu: KI-Analyse mit OpenAI zur Entscheidungsfindung für die Weiterleitungsauswahl hinzugefügt (optional)

Download

Bitte achte beim Download auf die Kompatibilität zur STARFACE Version!

Mit Klick auf den Downloadlink einer Modulversion öffnen sich ein Fenster mit Installationshinweisen und ein Pop-up-Fenster.

Modul testen:

Wir stellen unser Modul 14 Tage kostenfrei zum Testen zur Verfügung.
Nach dem Kauf oder Update: Mit E-Mail-Adresse verifizieren. Für die Inbetriebnahme/das Update ist kein Lizenzschlüssel nötig.
Wir stellen das Modul als .sfm Datei zur Verfügung.

zum Download