arXiv Open Access 2026

DIA-HARM: Dialectal Disparities in Harmful Content Detection Across 50 English Dialects

Jason Lucas Matt Murtagh Ali Al-Lawati Uchendu Uchendu Adaku Uchendu +1 lainnya

Lihat Sumber

Abstrak

Harmful content detectors-particularly disinformation classifiers-are predominantly developed and evaluated on Standard American English (SAE), leaving their robustness to dialectal variation unexplored. We present DIA-HARM, the first benchmark for evaluating disinformation detection robustness across 50 English dialects spanning U.S., British, African, Caribbean, and Asia-Pacific varieties. Using Multi-VALUE's linguistically grounded transformations, we introduce D3 (Dialectal Disinformation Detection), a corpus of 195K samples derived from established disinformation benchmarks. Our evaluation of 16 detection models reveals systematic vulnerabilities: human-written dialectal content degrades detection by 1.4-3.6% F1, while AI-generated content remains stable. Fine-tuned transformers substantially outperform zero-shot LLMs (96.6% vs. 78.3% best-case F1), with some models exhibiting catastrophic failures exceeding 33% degradation on mixed content. Cross-dialectal transfer analysis across 2,450 dialect pairs shows that multilingual models (mDeBERTa: 97.2% average F1) generalize effectively, while monolingual models like RoBERTa and XLM-RoBERTa fail on dialectal inputs. These findings demonstrate that current disinformation detectors may systematically disadvantage hundreds of millions of non-SAE speakers worldwide. We release the DIA-HARM framework, D3 corpus, and evaluation tools: https://github.com/jsl5710/dia-harm

Topik & Kata Kunci

cs.CL

Penulis (6)

Jason Lucas

Matt Murtagh

Ali Al-Lawati

Uchendu Uchendu

Adaku Uchendu

Dongwon Lee

Format Sitasi

APA MLA BibTeX

Lucas, J., Murtagh, M., Al-Lawati, A., Uchendu, U., Uchendu, A., Lee, D. (2026). DIA-HARM: Dialectal Disparities in Harmful Content Detection Across 50 English Dialects. https://arxiv.org/abs/2604.05318

Akses Cepat

Lihat di Sumber

Informasi Jurnal

Tahun Terbit: 2026
Bahasa: en
Sumber Database: arXiv
Akses: Open Access ✓