arXiv Open Access 2022

Quantum Policy Gradient Algorithm with Optimized Action Decoding

Nico Meyer Daniel D. Scherer Axel Plinge Christopher Mutschler Michael J. Hartmann

Lihat Sumber

Abstrak

Quantum machine learning implemented by variational quantum circuits (VQCs) is considered a promising concept for the noisy intermediate-scale quantum computing era. Focusing on applications in quantum reinforcement learning, we propose a specific action decoding procedure for a quantum policy gradient approach. We introduce a novel quality measure that enables us to optimize the classical post-processing required for action selection, inspired by local and global quantum measurements. The resulting algorithm demonstrates a significant performance improvement in several benchmark environments. With this technique, we successfully execute a full training routine on a 5-qubit hardware device. Our method introduces only negligible classical overhead and has the potential to improve VQC-based algorithms beyond the field of quantum reinforcement learning.

Topik & Kata Kunci

quant-ph cs.LG

Penulis (5)

Nico Meyer

Daniel D. Scherer

Axel Plinge

Christopher Mutschler

Michael J. Hartmann

Format Sitasi

APA MLA BibTeX

Meyer, N., Scherer, D.D., Plinge, A., Mutschler, C., Hartmann, M.J. (2022). Quantum Policy Gradient Algorithm with Optimized Action Decoding. https://arxiv.org/abs/2212.06663

Akses Cepat

Lihat di Sumber

Informasi Jurnal

Tahun Terbit: 2022
Bahasa: en
Sumber Database: arXiv
Akses: Open Access ✓