arXiv Open Access 2025

Variable Rate Image Compression via N-Gram Context based Swin-transformer

Priyanka Mudgal

Lihat Sumber

Abstrak

This paper presents an N-gram context-based Swin Transformer for learned image compression. Our method achieves variable-rate compression with a single model. By incorporating N-gram context into the Swin Transformer, we overcome its limitation of neglecting larger regions during high-resolution image reconstruction due to its restricted receptive field. This enhancement expands the regions considered for pixel restoration, thereby improving the quality of high-resolution reconstructions. Our method increases context awareness across neighboring windows, leading to a -5.86\% improvement in BD-Rate over existing variable-rate learned image compression techniques. Additionally, our model improves the quality of regions of interest (ROI) in images, making it particularly beneficial for object-focused applications in fields such as manufacturing and industrial vision systems.

Topik & Kata Kunci

eess.IV cs.CV cs.MM

Penulis (1)

Priyanka Mudgal

Format Sitasi

APA MLA BibTeX

Mudgal, P. (2025). Variable Rate Image Compression via N-Gram Context based Swin-transformer. https://arxiv.org/abs/2510.00058

Akses Cepat

Lihat di Sumber

Informasi Jurnal

Tahun Terbit: 2025
Bahasa: en
Sumber Database: arXiv
Akses: Open Access ✓