Meetween Publications

Scientific publications and related research outputs resulting from work conducted in the context of the Meetween project.

Conference paper

Journal article

Preprint

Award / press

Other

66 entries

2026 9

Preprint

Do What I Say: A Spoken Prompt Dataset for Instruction-Following

Maike Züfle, Sara Papi, Fabian Retkowski, Szymon Mazurek, Marek Kasztelnik, Alexander Waibel, Luisa Bentivogli, Jan Niehues

Under review

Preprint

Beyond Transcripts: A Renewed Perspective on Audio Chaptering

Fabian Retkowski, Maike Züfle, Thai Binh Nguyen, Jan Niehues, Alexander Waibel

Under review

Preprint

F-Actor: Controllable Conversational Behaviour in Full-Duplex Models

Maike Züfle, Ondrej Klejch, Nicholas Sanders, Jan Niehues, Alexandra Birch, Tsz Kin Lam

Under review

Conference

Voice, Bias, and Coreference: An Interpretability Study of Gender in Speech Translation

Lina Conti, Dennis Fucci, Marco Gaido, Matteo Negri, Guillaume Wisniewski, Luisa Bentivogli

Accepted to LREC 2026

Conference

Using weak supervision for low resource ASR: a phonetic-based transcript selection

Roberto Gretter, Marco Matassoni, Daniele Falavigna, Mohamed Nabih Nawar, Alessio Brutti, Luisa Bentivogli, Mauro Cettolo, Marco Gaido, Matteo Negri, Sara Papi

Accepted to LREC 2026

Preprint

Talk2Ref: A Dataset for Reference Prediction from Scientific Talks

F. Broy, Maike Züfle, Jan Niehues

Accepted to LREC 2026

Preprint

MuSaG: A Multimodal German Sarcasm Dataset with Full-Modal Annotations

A. Scott, Maike Züfle, Jan Niehues

Accepted to LREC 2026

Conference

MCIF: Multimodal Crosslingual Instruction-Following Benchmark from Scientific Talks

Sara Papi, Maike Züfle, Marco Gaido, Beatrice Savoldi, Danni Liu, Ioannis Douros, Luisa Bentivogli, Jan Niehues

ICLR 2026

Preprint

Early-Exit and Instant Confidence Translation Quality Estimation

Vilém Zouhar, Maike Züfle, Beni Egressy, Julius Cheng, Jan Niehues

Accepted to EACL 2026

2025 35

Preprint

Hearing to Translate: The Effectiveness of Speech Modality Integration into LLMs

Sara Papi, Javier Garcia Gilabert, Zachary Hopton, Vilém Zouhar, Carlos Escolano, Gerard I. Gállego, Jorge Iranzo-Sánchez, Ahrii Kim, Dominik Macháček, Patricia Schmidtova, Maike Züfle

Accepted to TACL

Journal

Federating dynamic models using early-exit architectures for automatic speech recognition on heterogeneous clients

Mohamed Nabih Ali, Daniele Falavigna, Alessio Brutti

Progress in Artificial Intelligence (2025)

Preprint

Better Late Than Never: Evaluation of Latency Metrics for Simultaneous Speech-to-Text Translation

Peter Polák, Sara Papi, Luisa Bentivogli, Ondřej Bojar

Under review

Preprint

Cross-Attention is Half Explanation in Speech-to-Text Models

Sara Papi, Dennis Fucci, Marco Gaido, Matteo Negri, Luisa Bentivogli

arXiv preprint

Conference

COMET-poly: Machine Translation Metric Grounded in Other Candidates

Maike Züfle*, Vilém Zouhar*, Tu Anh Dinh, Felipe Maia Polo, Jan Niehues, Mrinmaya Sachan

WMT @ EMNLP 2025

Conference

Are Generative Models Underconfident? Better Quality Estimation with Boosted Model Probability

Tu Anh Dinh, Jan Niehues

EMNLP 2025 Main

Conference

Streaming Non-Autoregressive Model for Accent Conversion and Pronunciation Improvement

Tuan-Nam Nguyen, Ngoc-Quan Pham, Şeymanur Akti, Alexander Waibel

Interspeech 2025

Conference

Towards Better Disentanglement in Non-Autoregressive Zero-Shot Expressive Voice Conversion

Şeymanur Akti, Tuan-Nam Nguyen, Alexander Waibel

Interspeech 2025

Conference

Weight Factorization and Centralization for Continual Learning in Speech Recognition

Enes Yavuz Ugan, Ngoc-Quan Pham, Alexander Waibel

Interspeech 2025

Conference

Assessing the Use of Face Swapping Methods as Face Anonymizers in Videos

Mustafa İzzet Muştu, Hazım Kemal Ekenel

DSP 2025

Preprint

Facial Attribute Based Text Guided Face Anonymization

Mustafa İzzet Muştu, Hazım Kemal Ekenel

arXiv preprint

Conference

Findings of the IWSLT 2025 Evaluation Campaign

Idris Abdulmumin, Victor Agostinelli, Tanel Alumäe, Antonios Anastasopoulos, Luisa Bentivogli, Ondřej Bojar, Claudia Borg, Fethi Bougares, Roldano Cattoni, Mauro Cettolo, Lizhong Chen, William Chen, Raj Dabre, Yannick Estève, Marcello Federico, Mark Fishel, Marco Gaido, Dávid Javorský, Marek Kasztelnik, Fortuné Kponou, Mateusz Krubiński, Tsz Kin Lam, Danni Liu, Evgeny Matusov, Chandresh Kumar Maurya, John P. McCrae, Salima Mdhaffar, Yasmin Moslem, Kenton Murray, Satoshi Nakamura, Matteo Negri, Jan Niehues, Atul Kr. Ojha, John E. Ortega, Sara Papi, Pavel Pecina, Peter Polák, Piotr Połeć, Ashwin Sankar, Beatrice Savoldi, Nivedita Sethiya, Claytone Sikasote, Matthias Sperber, Sebastian Stüker, Katsuhito Sudoh, Brian Thompson, Marco Turchi, Alex Waibel, Patrick Wilken, Rodolfo Zevallos, Vilém Zouhar, Maike Züfle

IWSLT 2025

Conference

Cocktail-Party Audio-Visual Speech Recognition

Thai-Binh Nguyen, Ngoc-Quan Pham, Alexander Waibel

Interspeech 2025

Conference

FAMA: The First Large-Scale Open-Science Speech Foundation Model for Italian and English

Sara Papi*, Marco Gaido*, Luisa Bentivogli, Alessio Brutti, Mauro Cettolo, Roberto Gretter, Marco Matassoni, Mohamed Nabih, Matteo Negri

CLiC-it 2025

Conference

The Warmup Dilemma: How Learning Rate Strategies Impact Speech-to-Text Model Convergence

Marco Gaido*, Sara Papi*, Luisa Bentivogli, Alessio Brutti, Mauro Cettolo, Roberto Gretter, Marco Matassoni, Mohamed Nabih, Matteo Negri

IWSLT 2025

Preprint

Policies and Evaluation for Online Meeting Summarization

Felix Schneider, Marco Turchi, Alex Waibel

arXiv preprint

Conference

Summarizing Speech: A Comprehensive Survey

Fabian Retkowski, Maike Züfle, Andreas Sudmann, Dinah Pfau, Shinji Watanabe, Jan Niehues, Alexander Waibel

EMNLP 2025 Main

Conference

Translation in the Hands of Many: Centering Lay Users in Machine Translation Interactions

Beatrice Savoldi, Alan Ramponi, Matteo Negri, Luisa Bentivogli

EMNLP 2025 Main

Conference

How to Connect Speech Foundation Models and Large Language Models? What Matters and What Does Not

Francesco Verdini, Pierfrancesco Melucci, Stefano Perna, Francesco Cariaggi, et al.

Interspeech 2025

Conference

Different Speech Translation Models Encode and Translate Speaker Gender Differently

Dennis Fucci, Marco Gaido, Matteo Negri, Luisa Bentivogli, André Martins, Giuseppe Attanasio

ACL 2025 Main

Conference

An LLM-as-a-judge Approach for Scalable Gender-Neutral Translation Evaluation

Andrea Piergentili, Beatrice Savoldi, Matteo Negri, Luisa Bentivogli

GITT Workshop @ MT-Summit 2025

Conference

KIT's Offline Speech Translation and Instruction Following Submission for IWSLT 2025

Sai Koneru*, Maike Züfle*, Thai-Binh Nguyen, Seymanur Akti, Jan Niehues, Alexander Waibel

IWSLT 2025

Conference

NUTSHELL: A Dataset for Abstract Generation from Scientific Talks

Maike Züfle, Sara Papi, Beatrice Savoldi, Marco Gaido, Luisa Bentivogli, Jan Niehues

IWSLT 2025

Conference

Contrastive Learning for Task-Independent SpeechLLM-Pretraining

Maike Züfle, Jan Niehues

ACL 2025 Findings

Journal

How “Real” is Your Real-Time Simultaneous Speech-to-Text Translation System?

Sara Papi, Peter Polak, Dominik Macheck, Ondrej Bojar

TACL 2025

Conference

Factorized-VITS: Decoupling Prosody and Text in End-to-End Speech Synthesis without External or Secondary Aligner

Yining Liu, Alexander Waibel

ICASSP 2025

Conference

Prepending or Cross-Attention for Speech-to-Text? An Empirical Comparison

Tsz Kin Lam*, Marco Gaido*, Sara Papi, Luisa Bentivogli, Barry Haddow

NAACL 2025 Main

Conference

A Bayesian Optimization Approach to Machine Translation Reranking

Julius Cheng, Maike Züfle, Vilém Zouhar, Andreas Vlachos

NAACL 2025 Main

Conference

PIER: A Novel Metric for Evaluating What Matters in Code-Switching

Enes Yavuz Ugan, Ngoc-Quan Pham, Leonard Bärmann, Alex Waibel

ICASSP 2025

Conference

MSA-ASR: Efficient Multilingual Speaker Attribution with Frozen ASR Models

Thai-Binh Nguyen, Alexander Waibel

ICASSP 2025

Conference

Continuously Learning New Words in Automatic Speech Recognition

Christian Huber, Alexander Waibel

ICASSP 2025

Conference

Speech Foundation Models and Crowdsourcing for Efficient, High-Quality Data Collection

Beomseok Lee, Marco Gaido, Ioan Calapodescu, Laurent Besacier, Matteo Negri

COLING 2025

Conference

Cross-lingual Evaluation of Multilingual Text Generation

Shamil Chollampatt, Minh Quang Pham, Sathish Reddy Indurthi, Marco Turchi

COLING 2025

Conference

How do Multimodal Foundation Models Encode Text and Speech? An Analysis of Cross-Lingual and Cross-Modal Representations

Hyunji Lee, Danni Liu, Supriti Sinhamahapatra, Jan Niehues

NAACL 2025

Journal

A decade of gender bias in Machine Translation

Beatrice Savoldi, Jasmin Bastings, Luisa Bentivogli, Eva Vanmassenhove

Patterns 2025

2024 22

Conference

Impact of Face Alignment on Face Image Quality

Eren Onaran, Erdi Sarıtaş, Hazım Kemal Ekenel

EAI ROSENET 2024

Other

Talking Heads: Bootstrapping Pre-trained LLMs to Build an End-to-End Speech Foundation Model

Pierfrancesco Melucci, Stefano Perna, Francesco Verdini, Francesco Cariaggi

GenAI Autumn School 2024, Université Paris-Saclay

Conference

Explainability for Speech Models: On the Challenges of Acoustic Feature Selection

Dennis Fucci, Beatrice Savoldi, Marco Gaido, Matteo Negri, Mauro Cettolo, Luisa Bentivogli

CLiC-it 2024

Conference

GFG - Gender-Fair Generation: A CALAMITA Challenge

Simona Frenda, Andrea Piergentili, Beatrice Savoldi, Marco Madeddu, Martina Rosola, Silvia Casola, Chiara Ferrando, Viviana Patti, Matteo Negri, Luisa Bentivogli

CLiC-it 2024

Conference

MAGNET - MAchines GeNErating Translations: A CALAMITA Challenge

Mauro Cettolo, Andrea Piergentili, Sara Papi, Marco Gaido, Matteo Negri, Luisa Bentivogli

CLiC-it 2024

Conference

Findings of the Quality Estimation Shared Task at WMT 2024: Are LLMs Closing the Gap in QE?

Chrysoula Zerva, Frédéric Blain, José GC de Souza, Diptesh Kanojia, Sourabh Deoghare, Nuno M Guerreiro, Giuseppe Attanasio, Ricardo Rei, Constantin Orasan, Matteo Negri, Marco Turchi, Rajen Chatterjee, Pushpak Bhattacharyya, Markus Freitag, André FT Martins

WMT 2024

Award

What the Harm? Quantifying the Tangible Impact of Gender Bias in Machine Translation with a Human-centered Study

Beatrice Savoldi, Sara Papi, Matteo Negri, Ana Guerberof Arenas, Luisa Bentivogli

EMNLP 2024 Social Impact Paper Award

Conference

Optimizing Rare Word Accuracy in Direct Speech Translation with a Retrieval-and-Demonstration Approach

Siqi Li*, Danni Liu*, Jan Niehues

EMNLP 2024 Main

Conference

MOSEL: 950,000 Hours of Speech Data for Open-Source Speech Foundation Model Training on EU Languages

Marco Gaido*, Sara Papi*, Luisa Bentivogli, Alessio Brutti, Mauro Cettolo, Roberto Gretter, Marco Matassoni, Mohamed Nabih, Matteo Negri

EMNLP 2024 Main

Conference

Audio-driven Talking Face Generation with Stabilized Synchronization Loss

Dogucan Yaman, Fevziye Irem Eyiokur, et al.

ECCV 2024

Conference

FBK@IWSLT Test Suites Task: Gender Bias evaluation with MuST-SHE

Beatrice Savoldi, Marco Gaido, Matteo Negri, Luisa Bentivogli

IWSLT 2024

Conference

SimulSeamless: FBK at IWSLT 2024 Simultaneous Speech Translation

Sara Papi, Marco Gaido, Matteo Negri, Luisa Bentivogli

IWSLT 2024

Conference

Recent Highlights in Multilingual and Multimodal Speech Translation

Danni Liu, Jan Niehues

IWSLT 2024

Conference

Blending LLMs into Cascaded Speech Translation: KIT's Offline Speech Translation System for IWSLT 2024

Sai Koneru, Thai Binh Nguyen, Ngoc-Quan Pham, Danni Liu, Zhaolin Li, Alexander Waibel, Jan Niehues

IWSLT 2024

Conference

Findings of the IWSLT 2024 Evaluation Campaign

Ibrahim Said Ahmad, Antonios Anastasopoulos, Ondřej Bojar, Claudia Borg, Marine Carpuat, Roldano Cattoni, Mauro Cettolo, William Chen, Qianqian Dong, Marcello Federico, Barry Haddow, Dávid Javorský, Mateusz Krubiński, Tsz Kin Lam, Xutai Ma, Prashant Mathur, Evgeny Matusov, Chandresh Maurya, John McCrae, Kenton Murray, Satoshi Nakamura, Matteo Negri, Jan Niehues, Xing Niu, Atul Kr. Ojha, John Ortega, Sara Papi, Peter Polák, Adam Pospíšil, Pavel Pecina, Elizabeth Salesky, Nivedita Sethiya, Balaram Sarkar, Jiatong Shi, Claytone Sikasote, Matthias Sperber, Sebastian Stüker, Katsuhito Sudoh, Brian Thompson, Alex Waibel, Shinji Watanabe, Patrick Wilken, Petr Zemánek, Rodolfo Zevallos

IWSLT 2024

Conference

StreamAtt: Direct Streaming Speech-to-Text Translation with Attention-based Audio History Selection

Sara Papi, Marco Gaido, Matteo Negri, Luisa Bentivogli

ACL 2024 Main

Conference

Decoupled Vocabulary Learning Enables Zero-Shot Translation from Unseen Languages

Carlos Mullov, Quan Pham, Alexander Waibel

ACL 2024 Main

Conference

Speech Translation with Speech Foundation Models and Large Language Models: What is There and What is Missing

Marco Gaido, Sara Papi, Matteo Negri, Luisa Bentivogli