arXiv Open Access 2026

RA-QA: A Benchmarking System for Respiratory Audio Question Answering Under Real-World Heterogeneity

Gaia A. Bertolino Yuwei Zhang Tong Xia Domenico Talia Cecilia Mascolo

Lihat Sumber

Abstrak

As conversational multimodal AI tools are increasingly adopted to process patient data for health assessment, robust benchmarks are needed to measure progress and expose failure modes under realistic conditions. Despite the importance of respiratory audio for mobile health screening, respiratory audio question answering remains underexplored, with existing studies evaluated narrowly and lacking real-world heterogeneity across modalities, devices, and question types. We hence introduce the Respiratory-Audio Question-Answering (RA-QA) benchmark, including a standardized data generation pipeline, a comprehensive multimodal QA collection, and a unified evaluation protocol. RA-QA harmonizes public RA datasets into a collection of 9 million format-diverse QA pairs covering diagnostic and contextual attributes. We benchmark classical ML baselines alongside multimodal audio-language models, establishing reproducible reference points and showing how current approaches fail under heterogeneity.

Topik & Kata Kunci

cs.SD cs.LG eess.AS

Penulis (5)

Gaia A. Bertolino

Yuwei Zhang

Tong Xia

Domenico Talia

Cecilia Mascolo

Format Sitasi

APA MLA BibTeX

Bertolino, G.A., Zhang, Y., Xia, T., Talia, D., Mascolo, C. (2026). RA-QA: A Benchmarking System for Respiratory Audio Question Answering Under Real-World Heterogeneity. https://arxiv.org/abs/2602.18452

Akses Cepat

Lihat di Sumber

Informasi Jurnal

Tahun Terbit: 2026
Bahasa: en
Sumber Database: arXiv
Akses: Open Access ✓