arXiv Open Access 2025

A Byzantine Fault Tolerance Approach towards AI Safety

John deVadoss Matthias Artzt

Lihat Sumber

Abstrak

Ensuring that an AI system behaves reliably and as intended, especially in the presence of unexpected faults or adversarial conditions, is a complex challenge. Inspired by the field of Byzantine Fault Tolerance (BFT) from distributed computing, we explore a fault tolerance architecture for AI safety. By drawing an analogy between unreliable, corrupt, misbehaving or malicious AI artifacts and Byzantine nodes in a distributed system, we propose an architecture that leverages consensus mechanisms to enhance AI safety and reliability.

Topik & Kata Kunci

cs.DC

Penulis (2)

John deVadoss

Matthias Artzt

Format Sitasi

APA MLA BibTeX

deVadoss, J., Artzt, M. (2025). A Byzantine Fault Tolerance Approach towards AI Safety. https://arxiv.org/abs/2504.14668

Akses Cepat

Lihat di Sumber

Informasi Jurnal

Tahun Terbit: 2025
Bahasa: en
Sumber Database: arXiv
Akses: Open Access ✓