Wer also im Support-Center oder Call-Center arbeitet, wird sich sicher sehr darüber freuen, dass man bald überflüssig sein wird und viel mehr Zeit hat als sowieso schon.
Dann kann man sich in dieser tollen goldigen Welt den ganzen Tag/Nacht voll entfalten und tolle neue digitale Sozialkontakte finden. Wenn man sich ganz doll anpasst.
Jetzt
Das KI-Modell verarbeitet die Tonspur und gibt sie für die anderen Zuhörer in deren gewählter Zielsprache als hörbares Audio aus.
Die Warteliste für all diese tollen Segnungen der Technik bei Videokonferenzen ist aber groß.
Das System verarbeitet über 40 Sprachen, darunter sämtliche 24 offiziellen EU-Sprachen sowie Vietnamesisch, Arabisch und Thai.
Unter der Haube arbeitet die Architektur aktuell aber noch mit einer klassischen Verarbeitungskette. Das Audiosignal wird in Text umgewandelt, übersetzt und anschließend per Text-to-Speech wieder synthetisiert.