Virtuelle 3D-Avatare aus dem Salzkammergut

Wiener Forschungszentrum modelliert österreichische Dialekte

Wien (OTS) - Im Projekt AVDS am FTW Forschungszentrum Telekommunikation Wien werden künstliche Stimmen erzeugt, die es ermöglichen, virtuelle 3D Avatare in österreichischen Dialekten sprechen zu lassen. Insgesamt werden zwei österreichische Dialekte modelliert: Eine mittelbairische Varietät aus dem Salzkammergut sowie eine südbairische Varietät aus Tirol oder der Steiermark.

AVDS - Adaptive Audio-Visuelle Sprachsynthese von Dialekten

Im Projekt "AVDS" (Adaptive Audio-Visuelle Sprachsynthese von Dialekten) werden aus einem beliebigen Text mittels adaptiver audio-visueller Sprachsynthese akustische und visuelle Signale für verschiedene österreichische Dialekte erzeugt. Diese Signale werden dann verwendet, um virtuelle 3D-Avatare in diesen Dialekten sprechen zu lassen. Der erste österreichische Dialekt, der modelliert wird, ist eine mittelbairische Varietät, die im Salzkammergut gesprochen wird. Als zweiter Dialekt wird eine südbairische Varietät aus Tirol oder der Steiermark modelliert werden. Audio-visuelle Synthese kann in der Kommunikationstechnologie und in Computerspielen eingesetzt werden.

Fortsetzung von "Computer sprechen Wienerisch"

"Computer sprechen Wienerisch" war das erfolgreiche FTW Projekt, in dem Sprachsynthesizer für Wiener Soziolekte und Dialekte entwickelt wurden und für das sich berühmte SchauspielerInnen und ModeratorInnen wie Hanno Pöschl, Helma Gautier oder Stephan Pokorny für die Aufnahmen zur Verfügung stellten. Die "Wiener Stimme" ist mittlerweile als Vorlesefunktion auf der Homepage der Stadt Wien (www.wien.gv.at) zu hören. Das Projekt "AVDS" (Adaptive Audio-Visuelle Sprachsynthese von Dialekten) stellt nun das Folgeprojekt mit Erweiterung dar: Neben der Modellierung mittelbairischer und südbairischer Varietäten werden die erzeugten Dialekt-Signale 3D Avatare in Mundart sprechen lassen.

Technische Herausforderung: Verbesserung der audio-visuellen Synthese

In der audio-visuellen Sprachsynthese wird ein Sprach- und Videosignal einer sprechenden Person generiert. In den meisten früheren Ansätzen wurden das akustische und das visuelle Signal separat modelliert, obwohl beide Signale das Resultat ein und desselben Artikulationsprozesses sind und deshalb gemeinsam modelliert werden sollten. "Die Verwendung von visueller Information könnte darüber hinaus auch zu einer besseren akustischen Synthese führen" erklärt Dr. Michael Pucher, Projektleiter am FTW. "Durch den Einsatz von adaptiven Methoden in der audio-visuellen Synthese wollen wir bessere Modelle erreichen, die weniger Trainingsdaten brauchen. Die Basis der Adaption bildet ein Modell welches die Gemeinsamkeiten der österreichischen Dialekte beschreibt."

Projektförderung vom FWF

Im Jänner 2011 fiel am FTW der Startschuss für das vom FWF geförderte Forschungsprojekt AVDS - Adaptive Audio-Visuelle Sprachsynthese von Dialekten. Projektleiter Dr. Michael Pucher und seinem Team wurde eine Fördersumme von Euro 300.000,- für die Projektdauer von 3 Jahren zugesprochen.

Das FTW ist ein national führendes und international anerkanntes Zentrum zur Erforschung und Entwicklung von Technologien für die Kommunikationssysteme der Zukunft. Wichtigstes Ziel des FTW ist die Stärkung der Innovationskraft und der Wettbewerbsfähigkeit der Partner sowie des Technologiestandortes Wien durch die Bündelung und den weiteren Ausbau vorhandenen Wissens. Die Initiative wird als K1-Zentrum im Rahmen des österreichischen Kompetenzzentrenprogramms COMET von Bund und Land Wien gefördert und weiter ausgebaut.

Weblinks:
FTW - Forschungszentrum Telekommunikation Wien GmbH: www.ftw.at
ARI - Institut für Schallforschung: http://www.kfs.oeaw.ac.at/
FWF - Fonds zur Förderung der wissenschaftlichen Forschung:
http://www.fwf.ac.at/
Projektseite AVDS: https://portal.ftw.at/projects/avds

FTW Bildergalerie:
http://www.ftw.at/presse-mediacenter/mediacenter/galerie

Rückfragen & Kontakt:

Mag. Christina Philippi
Public Relations
philippi@ftw.at
Tel.: +43 1 505 28 30 15

APA-OTS-ORIGINALTEXT PRESSEAUSSENDUNG UNTER AUSSCHLIESSLICHER INHALTLICHER VERANTWORTUNG DES AUSSENDERS - WWW.IT-PRESS.AT | NEF0007