Apprentissage par renforcement profond pour la préparation d'états quantiques avec de faibles mesures non linéaires PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Apprentissage par renforcement profond pour la préparation de l'état quantique avec des mesures non linéaires faibles

Ricardo Porotti1,2, Antoine Essig3, Benjamin Huard3et une Florian Marquardt1,2

1Institut Max Planck pour la science de la lumière, Erlangen, Allemagne
2Département de physique, Friedrich-Alexander Universität Erlangen-Nürnberg, Allemagne
3Univ Lyon, ENS de Lyon, CNRS, Laboratoire de Physique,F-69342 Lyon, France

Vous trouvez cet article intéressant ou souhaitez en discuter? Scite ou laisse un commentaire sur SciRate.

Abstract

Le contrôle quantique a suscité un intérêt croissant ces dernières années, par exemple pour des tâches telles que l'initialisation et la stabilisation d'état. Les stratégies basées sur les commentaires sont particulièrement puissantes, mais également difficiles à trouver, en raison de l'espace de recherche exponentiellement accru. L'apprentissage par renforcement profond est très prometteur à cet égard. Cela peut fournir de nouvelles réponses à des questions difficiles, telles que la capacité des mesures non linéaires à compenser un contrôle linéaire et contraint. Ici, nous montrons que l'apprentissage par renforcement peut découvrir avec succès de telles stratégies de rétroaction, sans connaissances préalables. Nous illustrons cela pour la préparation d'état dans une cavité soumise à une détection quantique sans démolition du nombre de photons, avec un simple entraînement linéaire comme contrôle. Les états Fock peuvent être produits et stabilisés avec une très haute fidélité. Il est même possible d'atteindre des états de superposition, à condition que les taux de mesure pour différents états de Fock puissent également être contrôlés.

Le contrôle quantique a été d'une grande pertinence ces dernières années, notamment en raison de la diffusion des ordinateurs quantiques. Traiter la rétroaction dans le contrôle quantique (c'est-à-dire utiliser des mesures pour orienter la dynamique) est particulièrement difficile car les choix de contrôle deviennent exponentiellement grands. Le système étudié ici peut être modélisé comme une cavité, qui peut être faiblement mesurée pour obtenir des informations partielles sur chaque niveau d'énergie. Pour préparer et stabiliser des états quantiques dans une telle cavité, nous utilisons l'apprentissage par renforcement (RL). RL est une branche de l'apprentissage automatique qui traite des problèmes de contrôle. Dans un cadre RL, l'algorithme essaie de maximiser une fonction objectif (dans ce cas la fidélité) en interagissant avec le système via un processus d'essais et d'erreurs. Dans ce travail, RL parvient à préparer des superpositions complexes de l'état de Fock dans la cavité, avec un contrôle linéaire très limité. L'agent RL apprend également à stabiliser les états quantiques contre différentes formes de désintégration.

► Données BibTeX

► Références

Navin Khaneja, Timo Reiss, Cindie Kehlet, Thomas Schulte-Herbrüggen et Steffen J. Glaser. "Contrôle optimal de la dynamique de spin couplée : conception de séquences d'impulsions RMN par des algorithmes de montée de gradient". Journal de résonance magnétique 172, 296–305 (2005).
https: / / doi.org/ 10.1016 / j.jmr.2004.11.004

P. de Fouquières, SG Schirmer, SJ Glaser et Ilya Kuprov. "Ingénierie des impulsions d'ascension de gradient de second ordre". Journal de résonance magnétique 212, 412–417 (2011).
https: / / doi.org/ 10.1016 / j.jmr.2011.07.023

AC Doherty et K. Jacobs. "Contrôle par rétroaction des systèmes quantiques utilisant l'estimation d'état continu". Phys. Rev. A 60, 2700–2711 (1999).
https: / / doi.org/ 10.1103 / PhysRevA.60.2700

Pavel Bushev, Daniel Rotter, Alex Wilson, François Dubin, Christoph Becher, Jürgen Eschner, Rainer Blatt, Viktor Steixner, Peter Rabl et Peter Zoller. "Refroidissement par rétroaction d'un seul ion piégé". Phys. Rév. Lett. 96, 043003 (2006).
https: / / doi.org/ 10.1103 / physrevlett.96.043003

Howard M. Wiseman et Gerard J. Milburn. "Mesure et contrôle quantiques". La presse de l'Universite de Cambridge. Cambridge (2009).
https: / / doi.org/ 10.1017 / CBO9780511813948

GG Gillett, RB Dalton, BP Lanyon, MP Almeida, M. Barbieri, GJ Pryde, JL O'Brien, KJ Resch, SD Bartlett et AG White. "Contrôle de rétroaction expérimental des systèmes quantiques utilisant des mesures faibles". Phys. Rév. Lett. 104, 080503 (2010).
https: / / doi.org/ 10.1103 / physrevlett.104.080503

Clément Sayrin, Igor Dotsenko, Xingxing Zhou, Bruno Peaudecerf, Théo Rybarczyk, Sébastien Gleyzes, Pierre Rouchon, Mazyar Mirrahimi, Hadis Amini, Michel Brune, Jean-Michel Raimond et Serge Haroche. "La rétroaction quantique en temps réel prépare et stabilise les états du nombre de photons". Nature 477, 73-77 (2011).
https: / / doi.org/ 10.1038 / nature10376

P. Campagne-Ibarcq, E. Flurin, N. Roch, D. Darson, P. Morfin, M. Mirrahimi, MH Devoret, F. Mallet et B. Huard. "Contrôle persistant d'un qubit supraconducteur par retour de mesure stroboscopique". Phys. Rév. X 3, 021008 (2013).
https: / / doi.org/ 10.1103 / physrevx.3.021008

Nissim Ofek, Andrei Petrenko, Reinier Heeres, Philip Reinhold, Zaki Leghtas, Brian Vlastakis, Yehan Liu, Luigi Frunzio, SM Girvin, L. Jiang, Mazyar Mirrahimi, MH Devoret et RJ Schoelkopf. « Prolonger la durée de vie d'un bit quantique avec correction d'erreur dans les circuits supraconducteurs ». Nature 536, 441–445 (2016).
https: / / doi.org/ 10.1038 / nature18949

Massimiliano Rossi, David Mason, Junxin Chen, Yeghishe Tsaturyan et Albert Schliesser. "Contrôle quantique basé sur la mesure du mouvement mécanique". Nature 563, 53-58 (2018).
https:/​/​doi.org/​10.1038/​s41586-018-0643-8

Shay Hacohen-Gourgy et Leigh S. Martin. "Mesures continues pour le contrôle des circuits quantiques supraconducteurs". Avancées en physique : X 5, 1813626 (2020). arXiv:2009.07297.
https: / / doi.org/ 10.1080 / 23746149.2020.1813626
arXiv: 2009.07297

Alessio Fallani, Matteo AC Rossi, Dario Tamascelli et Marco G. Genoni. "Apprentissage des stratégies de contrôle par rétroaction pour la métrologie quantique". PRX Quantique 3, 020310 (2022).
https: / / doi.org/ 10.1103 / PRXQuantum.3.020310

Richard S. Sutton et Andrew G. Barto. "Apprentissage par renforcement, deuxième édition : une introduction". Presse du MIT. (2018). URL : http:/​/​incompleteideas.net/​book/​the-book.html.
http://​/​incompleteideas.net/​book/​the-book.html

Volodymyr Mnih, Koray Kavukcuoglu, David Silver, Andrei A. Rusu, Joel Veness, Marc G. Bellemare, Alex Graves, Martin Riedmiller, Andreas K. Fidjeland, Georg Ostrovski, Stig Petersen, Charles Beattie, Amir Sadik, Ioannis Antonoglou, Helen King , Dharshan Kumaran, Daan Wierstra, Shane Legg et Demis Hassabis. "Contrôle au niveau humain grâce à l'apprentissage par renforcement profond". Nature 518, 529–533 (2015).
https: / / doi.org/ 10.1038 / nature14236

Tuomas Haarnoja, Sehoon Ha, Aurick Zhou, Jie Tan, George Tucker et Sergey Levine. "Apprendre à marcher via l'apprentissage par renforcement profond" (2019). arXiv:1812.11103.
arXiv: 1812.11103

Thomas Fösel, Petru Tighineanu, Talitha Weiss et Florian Marquardt. "Apprentissage par renforcement avec les réseaux de neurones pour la rétroaction quantique". Phys. Rév. X 8, 031084 (2018).
https: / / doi.org/ 10.1103 / physrevx.8.031084

Chunlin Chen, Daoyi Dong, Han-Xiong Li, Jian Chu et Tzyh-Jong Tarn. "Apprentissage Q probabiliste basé sur la fidélité pour le contrôle des systèmes quantiques". IEEE Transactions on Neural Networks and Learning Systems 25, 920–933 (2014).
https://​/​doi.org/​10.1109/​tnnls.2013.2283574

Moritz August et José Miguel Hernández-Lobato. "Prendre des gradients à travers des expériences: LSTM et optimisation de la politique proximale de la mémoire pour le contrôle quantique de la boîte noire". A Rio Yokota, Michèle Weiland, John Shalf et Sadaf Alam, rédacteurs, High Performance Computing. Pages 591–613. Notes de cours en informatique Cham (2018). Edition internationale Springer.
https:/​/​doi.org/​10.1007/​978-3-030-02465-9_43

Marin Bukov, Alexandre GR Day, Dries Sels, Phillip Weinberg, Anatoli Polkovnikov et Pankaj Mehta. "Apprentissage par renforcement dans différentes phases du contrôle quantique". Phys. Rév. X 8, 031086 (2018). arXiv:1705.00565.
https: / / doi.org/ 10.1103 / physrevx.8.031086
arXiv: 1705.00565

Riccardo Porotti, Dario Tamascelli, Marcello Restelli et Enrico Prati. "Transport cohérent d'états quantiques par apprentissage par renforcement profond". Phys Commun 2, 1–9 (2019).
https: / / doi.org/ 10.1038 / s42005-019-0169-x

Murphy Yuezhen Niu, Sergio Boixo, Vadim N. Smelyanskiy et Hartmut Neven. "Contrôle quantique universel par apprentissage par renforcement profond". npj Quantum Information 5, 1–8 (2019).
https:/​/​doi.org/​10.1038/​s41534-019-0141-3

Zheng An et DL Zhou. "Apprentissage par renforcement profond pour le contrôle de porte quantique". EPL 126, 60002 (2019).
https:/​/​doi.org/​10.1209/​0295-5075/​126/​60002

Han Xu, Junning Li, Liqiang Liu, Yu Wang, Haidong Yuan et Xin Wang. "Contrôle généralisable pour l'estimation des paramètres quantiques par apprentissage par renforcement". npj Quantum Inf 5, 1–8 (2019).
https: / / doi.org/ 10.1038 / s41534-019-0198-z

Juan Miguel Arrazola, Thomas R. Bromley, Josh Izaac, Casey R. Myers, Kamil Brádler et Nathan Killoran. "Méthode d'apprentissage automatique pour la préparation d'états et la synthèse de portes sur des ordinateurs quantiques photoniques". Sci quantique. Technol. 4, 024004 (2019).
https: / / doi.org/ 10.1088 / 2058-9565 / aaf59e

L. O'Driscoll, R. Nichols et PA Knott. "Un algorithme d'apprentissage automatique hybride pour la conception d'expériences quantiques". Mach quantique. Renseignement. 1, 5–15 (2019).
https:/​/​doi.org/​10.1007/​s42484-019-00003-8

Thomas Fosel, Stefan Krastanov, Florian Marquardt et Liang Jiang. "Contrôle efficace de la cavité avec les portes SNAP" (2020). arXiv:2004.14256.
arXiv: 2004.14256

Mogens Dalgaard, Felix Motzoi, Jens Jakob Sørensen et Jacob Sherson. "Optimisation globale de la dynamique quantique avec l'exploration profonde AlphaZero". npj Quantum Inf 6, 6 (2020).
https:/​/​doi.org/​10.1038/​s41534-019-0241-0

Hailan Ma, Daoyi Dong, Steven X. Ding et Chunlin Chen. «Apprentissage par renforcement profond basé sur le curriculum pour le contrôle quantique» (2021). arXiv:2012.15427.
arXiv: 2012.15427

Zheng An, Hai-Jing Song, Qi-Kai He et DL Zhou. "Contrôle optimal quantique des systèmes quantiques dissipatifs multiniveaux avec apprentissage par renforcement". Phys. Rév. A 103, 012404 (2021).
https: / / doi.org/ 10.1103 / physreva.103.012404

Yuval Baum, Mirko Amico, Sean Howell, Michael Hush, Maggie Liuzzi, Pranav Mundada, Thomas Merkh, Andre RR Carvalho et Michael J. Biercuk. "Apprentissage expérimental par renforcement profond pour la conception d'ensembles de portes robustes aux erreurs sur un ordinateur quantique supraconducteur". PRX Quantique 2, 040324 (2021).
https: / / doi.org/ 10.1103 / PRXQuantum.2.040324

Thomas Fosel, Murphy Yuezhen Niu, Florian Marquardt et Li Li. "Optimisation des circuits quantiques avec apprentissage par renforcement profond" (2021). arXiv:2103.07585.
arXiv: 2103.07585

E. Flurin, LS Martin, S. Hacohen-Gourgy et I. Siddiqi. "Utilisation d'un réseau neuronal récurrent pour reconstruire la dynamique quantique d'un qubit supraconducteur à partir d'observations physiques". Examen physique X 10 (2020).
https: / / doi.org/ 10.1103 / physrevx.10.011006

DT Lennon, H. Moon, LC Camenzind, Liuqi Yu, DM Zumbühl, G. a. D. Briggs, MA Osborne, EA Laird et N. Ares. "Mesurer efficacement un appareil quantique à l'aide de l'apprentissage automatique". npj Quantum Information 5, 1–8 (2019).
https:/​/​doi.org/​10.1038/​s41534-019-0193-4

Kyunghoon Jung, MH Abobeih, Jiwon Yun, Gyeonghun Kim, Hyunseok Oh, Ang Henry, TH Taminiau et Dohun Kim. "Détection de spin nucléaire individuelle améliorée par apprentissage en profondeur". npj Quantum Inf 7, 1–9 (2021).
https:/​/​doi.org/​10.1038/​s41534-021-00377-3

V Nguyen. "Apprentissage par renforcement profond pour une mesure efficace des dispositifs quantiques". npj Quantum Information Page 9 (2021).
https: / / doi.org/ 10.1038 / s41534-021-00434-x

Alexander Hentschel et Barry C. Sanders. "Apprentissage automatique pour une mesure quantique précise". Phys. Rév. Lett. 104, 063603 (2010).
https: / / doi.org/ 10.1103 / physrevlett.104.063603

M. Tiersch, EJ Ganahl et HJ Briegel. "Calcul quantique adaptatif dans des environnements changeants utilisant la simulation projective". Sci Rep 5, 12874 (2015).
https: / / doi.org/ 10.1038 / srep12874

Pantita Palittapongarnpim, Peter Wittek, Ehsan Zahedinejad, Shakib Vedaie et Barry C. Sanders. "Apprentissage en contrôle quantique : Optimisation globale en haute dimension pour la dynamique quantique bruitée". Neuroinformatique 268, 116-126 (2017).
https: / / doi.org/ 10.1016 / j.neucom.2016.12.087

Jelena Mackeprang, Durga B. Rao Dasari et Jörg Wrachtrup. "Une approche d'apprentissage par renforcement pour l'ingénierie d'état quantique". Mach quantique. Renseignement. 2, 5 (2020).
https:/​/​doi.org/​10.1007/​s42484-020-00016-8

Christian Sommer, Muhammad Asjad et Claudiu Gènes. « Perspectives d'apprentissage par renforcement pour l'amortissement simultané de plusieurs modes mécaniques ». Sci Rep 10, 2623 (2020).
https: / / doi.org/ 10.1038 / s41598-020-59435-z

Zhikang T. Wang, Yuto Ashida et Masahito Ueda. "Contrôle d'apprentissage par renforcement profond des chariots quantiques". Phys. Rév. Lett. 125, 100401 (2020).
https: / / doi.org/ 10.1103 / PhysRevLett.125.100401

Sangkha Borah, Bijita Sarma, Michael Kewming, Gerard J. Milburn et Jason Twamley. "Contrôle quantique de rétroaction basé sur la mesure avec apprentissage par renforcement profond pour un potentiel non linéaire à double puits". Phys. Rév. Lett. 127, 190403 (2021).
https: / / doi.org/ 10.1103 / PhysRevLett.127.190403

VV Sivak, A. Eickbusch, H. Liu, B. Royer, I. Tsioutsios et MH Devoret. "Contrôle quantique sans modèle avec apprentissage par renforcement". Phys. Rév. X 12, 011059 (2022).
https: / / doi.org/ 10.1103 / PhysRevX.12.011059

Antoine Essig, Quentin Ficheux, Théau Peronnin, Nathanaël Cottet, Raphaël Lescanne, Alain Sarlette, Pierre Rouchon, Zaki Leghtas et Benjamin Huard. "Mesure du nombre de photons multiplexés". Phys. Rév. X 11, 031045 (2021).
https: / / doi.org/ 10.1103 / PhysRevX.11.031045

B. Peaudecerf, C. Sayrin, X. Zhou, T. Rybarczyk, S. Gleyzes, I. Dotsenko, JM Raimond, M. Brune et S. Haroche. "Expériences de rétroaction quantique stabilisant les états de Fock de la lumière dans une cavité". Phys. Rév. A 87, 042320 (2013).
https: / / doi.org/ 10.1103 / physreva.87.042320

X. Zhou, I. Dotsenko, B. Peaudecerf, T. Rybarczyk, C. Sayrin, S. Gleyzes, JM Raimond, M. Brune et S. Haroche. "Champ verrouillé sur un état Fock par rétroaction quantique avec corrections de photon unique". Phys. Rév. Lett. 108, 243602 (2012).
https: / / doi.org/ 10.1103 / physrevlett.108.243602

Jacob C. Curtis, Connor T. Hann, Salvatore S. Elder, Christopher S. Wang, Luigi Frunzio, Liang Jiang et Robert J. Schoelkopf. "Détection résolue en nombre à un seul coup de photons micro-ondes avec atténuation des erreurs". Phys. Rév. A 103, 023705 (2021).
https: / / doi.org/ 10.1103 / physreva.103.023705

Christine Guerlin, Julien Bernu, Samuel Deléglise, Clément Sayrin, Sébastien Gleyzes, Stefan Kuhr, Michel Brune, Jean-Michel Raimond et Serge Haroche. "Effondrement progressif de l'état du champ et comptage quantique des photons sans démolition". Nature 448, 889–893 (2007).
https: / / doi.org/ 10.1038 / nature06057

BR Johnson, MD Reed, AA Houck, DI Schuster, Lev S. Bishop, E. Ginossar, JM Gambetta, L. DiCarlo, L. Frunzio, SM Girvin et RJ Schoelkopf. "Détection quantique sans démolition de photons micro-ondes uniques dans un circuit". Nature Phys 6, 663–667 (2010).
https: / / doi.org/ 10.1038 / nphys1710

B. Peaudecerf, T. Rybarczyk, S. Gerlich, S. Gleyzes, JM Raimond, S. Haroche, I. Dotsenko et M. Brune. "Mesure adaptative de non-démolition quantique d'un nombre de photons". Phys. Rév. Lett. 112, 080401 (2014).
https: / / doi.org/ 10.1103 / physrevlett.112.080401

Crispin Gardiner et Peter Zoller. "Bruit quantique: un manuel de méthodes stochastiques quantiques markoviennes et non markoviennes avec des applications à l'optique quantique". Série Springer en synergie. Springer Verlag. Berlin Heidelberg (2004). Troisième édition. URL : link.springer.com/​book/​9783540223016.
https://​/​link.springer.com/​book/​9783540223016

John Schulman, Filip Wolski, Prafulla Dhariwal, Alec Radford et Oleg Klimov. "Algorithmes d'optimisation de la politique proximale" (2017). arXiv:1707.06347.
arXiv: 1707.06347

John Schulman, Sergey Levine, Philipp Moritz, Michael I. Jordan et Pieter Abbeel. "Optimisation de la politique de région de confiance" (2017). arXiv:1502.05477.
arXiv: 1502.05477

Ashley Hill, Antonin Raffin, Maximilian Ernestus, Adam Gleave, Anssi Kanervisto, René Traoré, Prafulla Dhariwal, Christopher Hesse, Oleg Klimov, Alex Nichol, Matthias Plappert, Alec Radford, John Schulman, Szymon Sidor et Yuhuai Wu. "Bases de référence stables". URL : github.com/​hill-a/​stable-baselines.
https://​/​github.com/​hill-a/​stable-baselines

Weizhou Cai, Yuwei Ma, Weiting Wang, Chang-Ling Zou et Luyan Sun. "Codes de correction d'erreurs quantiques bosoniques dans les circuits quantiques supraconducteurs". Recherche fondamentale 1, 50–67 (2021).
https://​/​doi.org/​10.1016/​j.fmre.2020.12.006

FAM de Oliveira, MS Kim, PL Knight et V. Buek. "Propriétés des états de nombre déplacés". Examen physique A 41, 2645–2652 (1990).
https: / / doi.org/ 10.1103 / physreva.41.2645

Michel Martin Nieto. "États numériques déplacés et comprimés". Lettres de physique A 229, 135–143 (1997). arXiv:quant-ph/​9612050.
https:/​/​doi.org/​10.1016/​s0375-9601(97)00183-7
arXiv: quant-ph / 9612050

Cité par

[1] Anna Dawid, Julian Arnold, Borja Requena, Alexander Gresch, Marcin Płodzień, Kaelan Donatella, Kim A. Nicoli, Paolo Stornati, Rouven Koch, Miriam Büttner, Robert Okuła, Gorka Muñoz-Gil, Rodrigo A. Vargas-Hernández, Alba Cervera-Lierta, Juan Carrasquilla, Vedran Dunjko, Marylou Gabrié, Patrick Huembeli, Evert van Nieuwenburg, Filippo Vicentini, Lei Wang, Sebastian J. Wetzel, Giuseppe Carleo, Eliška Greplová, Roman Krems, Florian Marquardt, Michał Tomza, Maciej Lewenstein, et Alexandre Dauphin, "Applications modernes de l'apprentissage automatique aux sciences quantiques", arXiv: 2204.04198.

[2] Riccardo Porotti, Vittorio Peano et Florian Marquardt, "Gradient Ascent Pulse Engineering with Feedback", arXiv: 2203.04271.

[3] Luigi Giannelli, Pierpaolo Sgroi, Jonathon Brown, Gheorghe Sorin Paraoanu, Mauro Paternostro, Elisabetta Paladino et Giuseppe Falci, "Un tutoriel sur les méthodes de contrôle optimal et d'apprentissage par renforcement pour les technologies quantiques", Lettres de physique A 434, 128054 (2022).

[4] Björn Annby-Andersson, Faraj Bakhshinezhad, Debankur Bhattacharyya, Guilherme De Sousa, Christopher Jarzynski, Peter Samuelsson et Patrick P. Potts, "Quantum Fokker-Planck master equation for Continuous Feedback Control", arXiv: 2110.09159.

[5] Alessio Fallani, Matteo AC Rossi, Dario Tamascelli et Marco G. Genoni, "Apprentissage des stratégies de contrôle de rétroaction pour la métrologie quantique", PRX Quantique 3 2, 020310 (2022).

[6] Paolo Andrea Erdman et Frank Noé, "Conduire des machines thermiques quantiques en boîte noire avec des compromis puissance/efficacité optimaux en utilisant l'apprentissage par renforcement", arXiv: 2204.04785.

[7] David A. Herrera-Martí, "Approche par gradient de politique pour la compilation de circuits quantiques variationnels", arXiv: 2111.10227.

Les citations ci-dessus proviennent de SAO / NASA ADS (dernière mise à jour réussie 2022-07-22 01:21:35). La liste peut être incomplète car tous les éditeurs ne fournissent pas de données de citation appropriées et complètes.

On Le service cité par Crossref aucune donnée sur la citation des œuvres n'a été trouvée (dernière tentative 2022-07-22 01:21:34).

Horodatage:

Plus de Journal quantique