KI Agent / KI-Transkription braucht ewig

Wir testen gerade den KI-Agenten mit der KI-Transkription in unserer kleinen Steuerkanzlei.

Ich habe einen kurzen Testanruf (33 Sekunden) um 10:54 gemacht. Im Pascom Client habe ich erst gegen 11:40 eine Transkription bzw. Labeleintrag des KI-Agenten erhalten. Auch mit ausgeschaltetem KI-Agent und nur der KI-Transkription dauerte es circa 30 Minuten bis wir den Text zur Voice-Nachricht hatten.

Eine derart lange Zeitspanne zwischen Anruf und vollständigem Eintrag im Journal ist jedenfalls für uns im Geschäftsablauf nicht tragbar. Es gibt oft Fälle, in denen man gerne kurz nach dem nicht mehr rechtzeitig angenommenen Anruf zurückrufen möchte. Da wäre es natürlich sinnvoll, wenn der Client bereits transkribiert hat, um was es geht. So ist die Funktion für uns sinnlos.

Wir nutzen die Pascom Cloud mit dem neuesten Windows Client (v119.R4716 mit RDP-Flag) in einer Windows Server 2019 Terminalserver Umgebung (AMD 5950X). Wo findet die Transkription statt, lokal auf unserem Server oder bei Pascom?

Gibt es Möglichkeiten den Prozess zu beschleunigen? Vielen Dank für die Unterstützung!

Ich schließe mich an. Teilweise dauert das Transkribieren 3-10 Minuten. Das ist definitiv zu lange. Ich arbeite parallel mit Yeastar zusamen. Hier geht es quasi in Echtzeit. Für sehr wenig Geld. Ein Interaktiver KI Bot wird nun auch demnächst ausgerollt. Auch wenn ich den Ansatz gut finde, dass man bei Pascom nicht sofort auf alles raufspringt und alles etwas gesitteter und bedachter implementiert, denke ich schon, dass das KI und Transkriptionsthema etwas zu träge ist.

1 Like

also ich finde, das die KI nicht überall einzug halten sollte, gerade weil die Antworten nur so ca 30% richtig sind und jeder schreit ganz laut KI :frowning: erstmal soll doch das eigene Zeugs LAUFEN :slight_smile:
aber das Transkribieren sollte wirklich etwas schneller gehen ;(

Heute morgen bei Anruf “Transkriptionsfehler”. Die Audiodatei ist aber einwandfrei mit einer 14 Sekunden Nachricht:

Auch bei unserer Anlage dauert es ewig bis etwas verfügbar ist. Teilweise ist auch nach 5 Minuten noch nichts da.

Ich finde man muss es folgendermaßen sehen: Die KI-Transkription wurde allen kostenfrei zur Verfügung gestellt - in den meisten Fällen reicht auch ein Zeitfenster von 15 Minuten aus (es hatte ja auch einen Grund wieso die Mailbox besprochen wurde - nämlich es war niemand erreichbar).

Ich könnte mir vorstellen, dass pascom (gegen Gebühr) eine sofortige Transkription ins Lizenzmodell mit aufnimmt.

1 Like

Auch ich habe die Erfahrung gemacht, dass das entweder gar nicht oder extrem langsam funktioniert.

Die Idee via KI Anrufe und Grundinformationen abzufragen und das ganze in Text umzuwandeln ist super.

Funktionieren tut es aber so gut wie nie bei meinen Tests.

Häufig steht da nur “Transkription läuft …”

Aber in vielen Fällen passiert danach nie wieder etwas.

Noch ein Manko: Aktuell werden AB Sprachaufnahmen via Mail, aber ohne Transkribierung, versendet. Da wäre der geschriebene Text super, weil durchsuchbar.

Was wünsche ich mir:
Anrufe zuverlässig und schnell via KI Agent annehmen, die relevanten Infos aus dem gesprochen Text heraus nehmen (z.B. Name, Kundennr, Grund, etc) und das ganze via Mail oder API an ein Ticketsystem wie z.B. Zammad übergeben.

Das muss nicht in Echtzeit laufen, aber nach 15 Min sollte es erledigt sein.

Aktuell ist das Feature, obwohl es stark beworben wird, quasi nicht brauchbar.

Maik

Abgesehen davon, dass die Transkription bei der KI-Mailbox im Moment noch recht lange dauert, vermissen die Kunden, bei denen wir das testhalber eingerichtet haben, ein Feature: die Zusendung der Nachricht incl. Transkription als eMail (so, wie das die normale Mailbox konnte).

Viele unserer Kunden möchten das nachhalten und lassen auch Anfragen / Rückrufe etc. von externen Dienstleistern bearbeiten - da fehlt die eMail.

Ich kann verstehen, dass PASCOM die Kunden zur Nutzung des Clients bringen möchte - hier ist das aber völlig kontraproduktiv. Damit gehen -uns zumindest- PASCOM-Kunden verloren, die dann andere Lösungen einsetzen.

1 Like

Gut zu hören, dass es nicht nur mir so geht. Wäre super wenn sich das Pascom Team zur Thematik äußern könnte, vielleicht ist ja bereits etwas in Planung? Ansonsten sind wir zufrieden, lediglich das nicht sofortige Transkribieren ist zumindestens für uns in 2026 nicht mehr zeitgemäß.

Irgendwie leider kein Kommentar von Pascom.

Welche andere Lösungen unterstützen KI Anrufbeantworter und können die Daten per Email, und/oder API weitergeben?

Hi,
an der Verarbeitungsdauer wird gearbeitet, die sollte in den kommenden Wochen/Monaten wesentlich kürzer ausfallen (natürlich erstmal unverbindlich).
Persönlich kenne ich nur einen Fall in dem die Transkriptionen gar nicht funktionierten, ansonsten sind mir hier keine Fälle bekannt, nur die Thematik das diese zu lange dauern (was sich bald bessern sollte).
Grüße, Steve

Du könntest statt dem integrierten AB auf einen Voiceagent bei einer der gängigen Plattformen umleiten. Die können in der Regel Mail-Weiterleitung und auch API-Aufrufe.

Oder aber Du automatisierst die E-Mail-Verarbeitung selbst, sprich DU überwachst das Postfach mit einem Tool, extrahierst den Anhang, lässt ihn selbst transkribieren und machst damit anschließend, was auch immer Du willst.

Gibt auch dafür Plattformen, die sich teilweise sogar selbst hosten lassen und DSGVO-konform sind.

Egal, was es am Ende wird. Es muss Dir klar sein, dass insbesondere das Transkribieren immer Geld kosten wird. Und daher kann ich auch gut verstehen, wenn Pascom das Weiterleiten der Transkription per E-Mail oder den Abruf mittels API derzeit nicht umsetzen will.

Ich wüsste, wie ich es umsetzen würde und könnte das auch. Ist allerdings kostenpflichtig sowohl einmalig als auch laufend. Die Minutenpreise hängen u.a. von der Qualität der Transkribierung ab.

Sehr günstige Modelle liegen zwischen 0,5 und 1 cent pro Minute bei ca. 80% Genauigkeit. Für eine Qualität von 95% liegt man eher bei 10 bis 20 cent / Minute.

Gibt Anbieter, die beispielsweise 5 Stunden pro Monat anbieten für 15 EUR bei einer Genauigkeit > 90% und auf deutsche Sprache trainiert sind.

Das ist erfreulich. Ein Haupt-Problem ist nämlich, dass ich mir in der Zwischenzeit die Nachricht nichtmal anhören kann und erst warten muss, bis die Transkription fertig ist. Wenn Anhören des Audiofiles und Transkription voneinander getrennt wären, wäre es ein wenig entspannter, weil man zur Not auf die Audiodatei direkt zurück greifen kann.

1 Like

Hallo @noses,

ist der Abspiel-Button in der Zeit vorhanden oder wird dieser gar nicht angezeigt?

Bei der laufenden Transkription funktioniert das Abspielen bei mir.

Bei der Architektur dieses Features haben wir auch darauf geachtet, dass die Audio-Datei auch von Beginn an zur Verfügung steht.

Oder habe ich dich hier falsch verstanden?

Besten Gruß
Sebastian

Auch bei mir - heute getestet - ist der Play-Button da und während der (ja, zugegeben nicht der schnellsten Transcription) vorhanden, aktiv und tut das, was er soll :slight_smile:

Es ist eher missverständlich von mir ausgedrückt gewesen und hat vermutlich weniger mit der Transkription zu tun als damit, dass ein Klick auf “Play” manchmal kein Audio wieder gibt. Ich kann das noch nicht zuverlässig reproduzieren, manchmal ist es einfach so, dass einfach nix passiert bei Klick auf “Play”.