Audio Inpainting

Forscher des Instituts für Schallforschung haben in Zusammenarbeit mit Nathanael Perraudin vom Swiss Data Science Center ein Verfahren entwickelt, mit dem Audiosignale, wie zum Beispiel Musik, effizient und automatisch nach lokalen, klanglichen Ähnlichkeiten und Wiederholungen durchsucht werden können. Solche Ähnlichkeiten können zum Beispiel dafür verwendet werden, verlorene Teile eines Musikstücks durch andere, ähnliche Segmente zu ersetzen und so den Datenverlust für Hörer unmerklich zu überdecken. Das Verfahren und seine Anwendung für die zuvor beschriebene Audiorestauration wurde kürzlich in der führenden Fachzeitschrift IEEE/ACM Transactions on Audio, Speech and Language Processing vorgestellt (Links: Artikel / Webpage). 


Gestern fand die Science Experts 2018, eine Forschungsparkourveranstaltung des BMBWF, in der Aula der Wissenschaften statt. Rund 1.200 Kinder aus Wiener Brennpunktschulen waren eingeladen, um sich einmal völlig der Wissenschaft zu widmen. Das ISF war aktiv mit Ihrem Stand "Lärm und Schall" vor Ort. Bundesminister Heinz Faßmann hat die neue Generation an Forscherinnen und Forschern vor Ort willkommen geheißen. Der ISF-Stand erregte sowohl die Aufmerksamkeit der Kinder als auch die des Ministers.

Science Experts - Credit: BMBWF / Martin Lüsser


Full-Time Tenure-Track Junior Group-Leader Position (f/m)

in Acoustic Phonetics

The Acoustics Research Institute (ARI) of the Austrian Academy of Sciences (OeAW) invites applications for a full-time (40h) tenure-track junior group-leader position (m/f) open for researchers in Acoustic Phonetics.

ARI is an interdisciplinary research institution of the OeAW. ARI undertakes fundamental research in psychoacoustics, experimental audiology, acoustic phonetics, computational acoustics, mathematics, and signal processing. A close interaction between ARI's working groups allows innovative research approaches based on the synergy from multidisciplinarity and creates concepts that stimulate the individual research fields. ARI currently employs a staff of approximately 45 people. As part of the OeAW, ARI is focused towards high-impact research comparable to Max-Planck or CNRS institutes.

Acoustic Phonetics at ARI

The research group Acoustic Phonetics has been an important part of the multi-disciplinary research focus of ARI for more than 20 years now. The group is especially renowned for its research on Austrian German, varieties of German and other languages, and its contributions to forensic speech science. The group is an essential part of the inter-disciplinary research environment of the ARI and to the integration of basic phonetic research with signal and speech processing.

While the specific research direction (and the exact group name) is free to be decided by the new group leader within the broad field of phonetics and speech sciences, it should also take account of the existing strengths of this group including the phonetic and phonological description of languages and language varieties as well as their computational modelling, and speaker identification for forensics.

The aims of the group Acoustic Phonetics and its leader are:

  • Having a long-term research perspective in acoustic phonetics by building on the current research foci, as well as developing new ones.
  • Closely collaborating with the other working groups of ARI in interdisciplinary projects.
  • Striving for innovative scientific research expanding ARI's multidisciplinary research portfolio.
  • Aiming to acquire research grants, in order to fund a significant proportion of the group's research with external project funding.

The following resources will be available:

  • Access to all laboratory facilities of ARI.
  • The current working group (one PostDoc, 4 PhD students), partly financed by ongoing third-party funds.
  • One additional PostDoc position to be filled and assigned by the group leader (financed for the first two years).
  • Travelling and additional infrastructure (according to applicant's proposal) in consultation with ARI's director.

Details of Position

The position of group leader of Acoustic Phonetics at ARI can be compared to a tenurable Professorship of Phonetics and Speech Science  (of which there is none in Austria) but with fewer administrative and no strict teaching duties, in order to allow the successful applicant to focus on research. It is a tenure-track position. The salary will be EUR 46254,60 per year (before taxes) according to OeAW's collective agreements. In exceptional cases a higher starting salary is possible. The first contracts will be for up to five years. In the fourth year, the candidate is supposed to apply for an evaluation by the OeAW according to the OeAW evaluation rules. With a positive evaluation decision, the approval by the OeAW's President and Vice President, as well as ARI's director, the position will be tenured.

Main duties and key responsibilities of the successful applicant will be:

  • Scientific research and publications on highest international level.
  • Planning the scientific focus and output of the research group within the multidisciplinary environment of ARI.
  • Managing the research group as an internationally renowned scientific group.
  • Determining, obtaining, and managing the resources to sustain the research program in the long term, to keep or build up the size of the research group (e.g., third-party funding for the new PostDoc starting with year 3).
  • Supervising PhD and master students.
  • Supporting the director of ARI in all organizational issues as part of ARI's steering committee.
  • Being an active member or representative in corresponding networks and societies.
  • Participating in events aimed at introducing the scientific work of the group to the general public, e.g. Long Night of Research or Noise Awareness Day.


Successful applicants must have:

  • A PhD (or equivalent degree) and research experience commensurate with a habilitation. (If not existing a habilitation should be acquired at an Austrian university within the next two years.)
  • Experience at acquiring project funding.
  • An excellent scientific profile in phonetics and speech sciences.
  • A high potential to attract substantial additional funding.
  • Demonstrated research independence, maturity and willingness to work hard.
  • A very competitive and promising track-record appropriate to the applicants' career stage, including significant publications.
  • Knowledge of German or readiness to learn German expected: B2 after two years; C2 after five.

Applicants will be ranked higher if they:

  • Have shown experience with the current main research topics of the work group.
  • Have already shown multi-disciplinary approaches.
  • Have shown experience in leading a research group and being involved in administrative and organizational duties.

The OeAW is an equal opportunity employer. In cases of having the same level of qualification females or members of an under-represented social group are ranked higher.

The application process is divided into 2 stages:

Applicants are required to submit in the first stage (STAGE 1):

  • A letter (no more than 5 pages) outlining their interest in the position, their relevant experience and their fit to this call, the institute and interaction with the other working groups of ARI.
  • Curriculum Vitae (5 pages)
  • A list of all publications.
  • Three letters of recommendation.

Short-listed candidates will be required to submit in the second stage (STAGE 2):

  • A short description of previous research activities.
  • A research plan (up to 15 pages) for the group providing the following details:
    • Planning of the research focus (a detailed description for the first five years and a long-term perspective beyond the five years).
    • A strategy on the integration into the multi-disciplinary research environment of ARI, including the interaction with other groups, as well as a statement about how the existing research directions will be incorporated.
    • A plan for the acquisition of financial resources to support the group.
    • Optional: additional infrastructure required, and a plan for its financial support.
  • A list of the ten most important publications with short summaries explaining their relevance for the application at ARI, including bibliometric data.

Selection Process

The following selection criteria will be applied:

  • Excellence of the candidate:
  • Excellent scientific track record according to academic age and internationally exceptional quality and leadership potential. Integration in the international scientific community and above-average performance (including successful third party funding).
    • Fit into the multidisciplinary research of ARI.

  • Quality of the visions for the group, as well as the methods and approaches:
    • Clear vision for the proposed research area and the group’s impact.
    • Comprehensive research methodology appropriate for the proposed work.
    • Potential to collaborate with at least two of the other working groups at ARI.
    • Potential of extending ARI's research portfolio and keeping the existing ‘renown’ areas of research.
    • Scientific relevance and potential to extend ARI's international scientific standing.

  • Financial planning and management ability:
    • Human and financial resources in accordance with proposed project content.
    • Feasibility of proposed funding.

This process can be terminated at any stage if no outstanding application is available.

The appointment to this position is planned between October 2018 and May 2019.


Submit applications before 15th April 2018 to Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein!.

Notifications for second stage will be done before the 15th of May 2018, and second stage applications are invited until 15th of July 2018.

More information on the Acoustic Phonetics group:

More information on the Austrian Academy of Sciences:

If you have questions with respect to the position do not hesitate to contact Peter Balazs via email (Diese E-Mail-Adresse ist vor Spambots geschützt! Zur Anzeige muss JavaScript eingeschaltet sein!).


Die Forschungsgruppen Mathematik und Signalverarbeitung in der Akustik und Psychoakustik und experimentelle Audiologie haben gemeinsam eine Klasse von invertierbaren Filterbänken entwickelt. Der Fokus lag dabei an der Anpassung der Frequenzauflösung an das menschliche Gehör. Durch die Kombination perzeptiver, also an die Wahrnehmung angelehnter, Frequenzskalen mit den Prinzipien der Frametheorie, erlaubt die sogenannte AUDlet Filterbank die effiziente Analyse. Darüberhinaus bietet diese spezielle Kombination die artefaktfreie Synthese von Audiosignalen unter Zuhilfenahme einer Darstellung, die jener unseres auditorischen Systems ähnelt. Die Forschungsergebnisse wurden kürzlich in der Fachzeitschrift Applied Sciences veröffentlicht.

Necciari, T.; Holighaus, N.; Balazs, P.; Průša, Z.; Majdak, P.; Derrien, O. Audlet Filter Banks: A Versatile Analysis/Synthesis Framework Using Auditory Frequency Scales. Appl. Sci. 2018, 8, 96.


Im Rahmen ihrer Forschung zu Sprachsynthese beziehungsweise Audiorestauration mit künstlichen neuralen Netzwerken am Institut für Schallforschung (ISF) haben sich Michael Pucher und Nicki Holighaus erfolgreich für einen NVIDIA GPU Grant beworben. Aufgrund der erfolgreichen Bewerbung wurden dem ISF zwei Titan X Pascal GPUs vom Grafikkartenhersteller NVIDIA zur Verfügung gestellt. Sie ermöglichen jetzt ab sofort das hocheffiziente Training und die schnelle Ausführung von am Institut entwickelten Berechnungsmodellen.

Holger Waubke und seine Forschungsgruppe arbeiten seit dem letztem Jahr am Projekt "Railway vibrations from tunnels", das vom ÖAW-Innovationsfonds gefördert wird. Eigentlich geht es in diesem Projekt "nur" um eines der Schwerpunktthemen des Instituts, nämlich um "subtilen Lärm" und dessen Entstehung, Ausbreitung und Vermeidung. Lesen Sie hier nach, warum es dennoch ein außergewöhnliches und innovatives Vorhaben ist. 

Auf Einladung des Instituts für Schallforschung der ÖAW trafen dieser Tage einander internationale Experten aus der Fachgruppe "Aural Assessment by Means of Binaural Algorithms" (AABBA) zu ihrer jährlichen Generalversammlung. Diese Schallforscher beschäftigen sich insbesondere mit den vielfältigen Zusammenhängen beim räumlichen Hören. Für eine wissenschaftlich angemessene Beschreibung dieses physikalischen Vorgangs müssen nicht nur Ausbreitung und Reflexion von Schallwellen, sondern auch die neuronalen Verbindungen zwischen beiden Ohren, in die Modelle mit einbezogen werden. Solche sogenannten binauralen Modelle bzw. Algorithmen und deren Entwicklungen, Evaluierungen und Anwendungen waren Gegenstand der Diskussion, um die Lokalisation von Schallquellen, Signalwahrnehmung und -verarbeitung besser zu verstehen.


ISF-Forscher lauschen Mäusen

Seit einigen Jahren unterstützen Peter Balazs und Anton Noll das Konrad Lorenz Institut für Vergleichende Verhaltensforschung der Veterinärmedizinischen Universität Wien. Die Biologen Sarah Zala und Dustin Penn wandten sich 2013 an die Schallforscher, weil sie die Lautkommunikation von wildlebenden Mäusen aufnehmen und qualitativ auswerten wollten. Mäuse geben Laute (auch) in für uns unhörbaren Ultraschal-Bereich von sich. Mit dem seit 1986 selbst entwickelten Programm S-TOOLS-Stx, eine unter Windows laufende Anwendung zur Analyse und Verarbeitung von akustischen Signalen und Sprache, konnten die Schallforscher die Mäuseaufnahmen durch Herabsetzung der Tonhöhe und Frequenz für Menschen hörbar machen. Sie ähneln stark dem Vogelgesang.

Die große Herausforderung war es die einzelnen Äußerungen des Mausgesänge im großen aufgenommen Datenmaterial aufzufinden. Oft mussten BiologInnen das Material anhören, die Zeit-Frequenz Analysen anhören und die Segmentierung händisch machen. Oder eine kommerzielle Software verwenden, die nicht immer befriedigende Ergebnisse lieferte. Durch die gemeinsame Entwicklung von "Automatic mouse ultrasound detector (A-MUD)" konnte das nun durch S-TOOLS-Stx durchgeführt werden. Das Programm konnte eine Fehlerrate liefern, die etwa der händischen Segmentierung entspricht, und insbesondere die Rate der falschen Detektion ('false positives') im Vergleich zu der kommerziellen Software deutlich mindern.

Die Methode sowie die Anwendung auf die Fragestellung der Abhängigkeit der Äußerungen vom Geschlecht der Maus veröffentlichten die Forscher kürzlich im renommierten Journal "Plos One". Entgegen bisheriger Annahmen singen beide Mäusegeschlechter bei der Paarung. Und sie stimmen ihre Laute offenbar auf den jeweiligen Zuhörer ab. Während sie gegenüber dem gleichen Geschlecht in relativ tiefer Tonlage kommunizieren, heben Sie bei bzw. vor der Paarung Ihre Stimme und rufen ihr gesamtes Repertoire inklusive musikalischer Silben und Phrasen ab.

  • S. M. Zala, D. Reitschmidt, A. Noll, P. Balazs, D. J. Penn, "Automatic mouse ultrasound detector (A-MUD): A new tool for processing rodent vocalizations", PLOS ONE, DOI (2017)
  • S. M. Zala, D. Reitschmidt, A. Noll, P. Balazs, D. J. Penn, "Sex-Dependent Modulation of Ultrasonic Vocalizations in House Mice (Mus musculus musculus)", PLOS ONE, DOI (2017)

Siehe auch:


Gestern vergab die Österreichische Akademie der Wissenschaften 12 Preise an den wissenschaftlichen Nachwuchs im feierlichen Rahmen. Unter den nominierten Forschern, die am Anfang ihrer Karriere stehen, befand sich der ISF-Mitarbeiter José Luis Romero. Er wurde für sein Paper Sampling theorems for shift-invariant spaces, Gabor frames, and totally positive functions, publiziert in  "Inventionies Mahtematicae", mit dem Best Paper Award ausgezeichnet. 2011 schloss José Luis sein Doktoratsstudium an der Universität Buenos Aires ab. Nach einem Fullbright Stipendium an der Universität Maryland folgten ein Lise Meitner und ein Marie Curie Stipendium an der Fakultät für Mathematik an der Universität Wien. Dort erhielt er noch im selben Jahr eine Postdoc-Stelle. Seit 2016 ist der Mathematiker an der Universität Wien habilitiert und wissenschaftlicher Mitarbeiter am ISF. Wir gratulieren José Luis recht herzlich zu seinem Erfolg.

Peter Balazs eröffnete die 1. Tagung der Österreichischen Gesellschaft für Akustik am Institut für Schallforschung, die unter der Organisationsleitung von Holger Waubke stattfand. 1996 wurde die ÖGA oder auch international "Austrian Acoustics Association" (AAA) als wissenschafltlicher Verein gegründet. Er hat es sich auf die Fahnen geschrieben, das Fachgebiet Akustik in Österreich umfassend zu fördern, die Kommunikation untereinander zu optimieren und JungwissenschaftlerInnen anzusprechen. Zudem vertritt die ÖGA Österreich in den entsprechenden europäischen und internationalen Akustikgremien.

Mit der Tagung soll vor allem der Nachwuchs angesprochen und der Wissensaustausch forciert werden. So war das Program mit seinen

3 Impulsvorträgen sehr informativ und attraktiv gestaltet. Die Teilnehmer kamen von verschiedensten Institutionen wie der AES Austria, der AES Austria Student-Section Graz oder dem ÖAL.