Minimizacija strukturnega tveganja za kvantne linearne klasifikatorje

Minimizacija strukturnega tveganja za kvantne linearne klasifikatorje

Casper Gyurik1, Dyon Vreumingen, kombi1,2,3, in Vedran Dunjko1,4

1LIACS, Univerza Leiden, Niels Bohrweg 1, 2333 CA Leiden, Nizozemska
2QuSoft, Centrum Wiskunde & Informatica (CWI), Science Park 123, 1098 XG Amsterdam, Nizozemska
3Inštitut za fiziko, Univerza v Amsterdamu, Science Park 904, 1098 XH Amsterdam, Nizozemska
4LION, Univerza Leiden, Niels Bohrweg 2, 2333 CA Leiden, Nizozemska

Se vam zdi ta članek zanimiv ali želite razpravljati? Zaslišite ali pustite komentar na SciRate.

Minimalizem

Modeli kvantnega strojnega učenja (QML), ki temeljijo na parametriziranih kvantnih vezjih, so pogosto izpostavljeni kot kandidati za kratkoročno »ubijalsko aplikacijo« kvantnega računalništva. Vendar pa je razumevanje empirične in generalizacijske uspešnosti teh modelov še vedno v povojih. V tem prispevku preučujemo, kako najti ravnotežje med natančnostjo usposabljanja in uspešnostjo posploševanja (imenovano tudi minimalizacija strukturnega tveganja) za dva vidna modela QML, ki sta ju predstavila Havlíček et al. [1] ter Schuld in Killoran [2]. Prvič, z uporabo razmerij do dobro razumljenih klasičnih modelov dokažemo, da dva parametra modela – tj. dimenzija vsote slik in Frobeniusova norma opazovanih, ki jih uporablja model – natančno nadzorujeta kompleksnost modelov in s tem njegovo generalizacijsko zmogljivost. . Drugič, z uporabo idej, ki jih je navdihnila procesna tomografija, dokazujemo, da ti parametri modela natančno nadzorujejo tudi sposobnost modelov, da zajamejo korelacije v nizih primerov za usposabljanje. Če povzamemo, naši rezultati ustvarjajo nove možnosti za zmanjšanje strukturnega tveganja za modele QML.

► BibTeX podatki

► Reference

[1] Vojtěch Havlíček, Antonio D Córcoles, Kristan Temme, Aram W Harrow, Abhinav Kandala, Jerry M Chow in Jay M Gambetta. "Nadzorovano učenje s kvantno izboljšanimi prostori funkcij". Narava 567 (2019). arXiv:1804.11326.
https:/​/​doi.org/​10.1038/​s41586-019-0980-2
arXiv: 1804.11326

[2] Maria Schuld in Nathan Killoran. "Kvantno strojno učenje v značilnih Hilbertovih prostorih". Physical review letters 122 (2019). arXiv:1803.07128.
https: / / doi.org/ 10.1103 / PhysRevLett.122.040504
arXiv: 1803.07128

[3] Frank Arute, Kunal Arya, Ryan Babbush, Dave Bacon, Joseph C Bardin, Rami Barends, Rupak Biswas, Sergio Boixo, Fernando GSL Brandao, David A Buell, et al. "Kvantna premoč z uporabo programabilnega superprevodnega procesorja". Narava 574 (2019). arXiv:1910.11333.
https:/​/​doi.org/​10.1038/​s41586-019-1666-5
arXiv: 1910.11333

[4] John Preskill. "Kvantno računalništvo v dobi NISQ in pozneje". Quantum 2 (2018). arXiv:1801.00862.
https:/​/​doi.org/​10.22331/​q-2018-08-06-79
arXiv: 1801.00862

[5] Marco Cerezo, Andrew Arrasmith, Ryan Babbush, Simon C Benjamin, Suguru Endo, Keisuke Fujii, Jarrod R McClean, Kosuke Mitarai, Xiao Yuan, Lukasz Cincio, et al. "Variacijski kvantni algoritmi". Nature Reviews Physics 3 (2021). arXiv:2012.09265.
https:/​/​doi.org/​10.1038/​s42254-021-00348-9
arXiv: 2012.09265

[6] Jarrod R. McClean, Jonathan Romero, Ryan Babbush in Alán Aspuru-Guzik. “Teorija variacijskih hibridnih kvantno-klasičnih algoritmov”. New Journal of Physics 18 (2016). arXiv:1509.04279.
https:/​/​doi.org/​10.1088/​1367-2630/​18/​2/​023023
arXiv: 1509.04279

[7] Abhinav Kandala, Antonio Mezzacapo, Kristan Temme, Maika Takita, Markus Brink, Jerry M Chow in Jay M Gambetta. "Strojno učinkovit variacijski kvantni lastni reševalec za majhne molekule in kvantne magnete". Narava 549 (2017). arXiv:1704.05018.
https: / / doi.org/ 10.1038 / nature23879
arXiv: 1704.05018

[8] Peter JJ O'Malley, Ryan Babbush, Ian D Kivlichan, Jonathan Romero, Jarrod R McClean, Rami Barends, Julian Kelly, Pedram Roushan, Andrew Tranter, Nan Ding idr. "Skalabilna kvantna simulacija molekulskih energij". Physical Review X 6 (2016). arXiv:1512.06860.
https: / / doi.org/ 10.1103 / PhysRevX.6.031007
arXiv: 1512.06860

[9] Edward Farhi, Jeffrey Goldstone in Sam Gutmann. »Kvantni približni optimizacijski algoritem« (2014). arXiv:1411.4028.
arXiv: 1411.4028

[10] Marcello Benedetti, Erika Lloyd, Stefan Sack in Mattia Fiorentini. “Parametrizirana kvantna vezja kot modeli strojnega učenja”. Kvantna znanost in tehnologija 4 (2019). arXiv:1906.07682.
https:/​/​doi.org/​10.1088/​2058-9565/​ab4eb5
arXiv: 1906.07682

[11] Barbara M Terhal in David P DiVincenzo. "Prilagodljivo kvantno računanje, kvantna vezja s konstantno globino in igre arthur-merlin". Kvantne informacije in računanje 4 (2004). arXiv:quant-ph/​0205133.
https://​/​doi.org/​10.48550/​arXiv.quant-ph/​0205133
arXiv: kvant-ph / 0205133

[12] Michael J Bremner, Richard Jozsa in Dan J Shepherd. "Klasična simulacija komutiranih kvantnih izračunov implicira propad polinomske hierarhije". Proceedings of the Royal Society A: Mathematical, Physical and Engineering Sciences 467 (2011). arXiv:1005.1407.
https: / / doi.org/ 10.1098 / rspa.2010.0301
arXiv: 1005.1407

[13] Edward Grant, Marcello Benedetti, Shuxiang Cao, Andrew Hallam, Joshua Lockhart, Vid Stojevic, Andrew G Green in Simone Severini. “Hierarhični kvantni klasifikatorji”. npj Kvantne informacije 4 (2018). arXiv:1804.03680.
https:/​/​doi.org/​10.1038/​s41534-018-0116-9
arXiv: 1804.03680

[14] Diego Ristè, Marcus P Da Silva, Colm A Ryan, Andrew W Cross, Antonio D Córcoles, John A Smolin, Jay M Gambetta, Jerry M Chow in Blake R Johnson. "Demonstracija kvantne prednosti v strojnem učenju". npj Kvantne informacije 3 (2017). arXiv:1512.06069.
https:/​/​doi.org/​10.1038/​s41534-017-0017-3
arXiv: 1512.06069

[15] Mehryar Mohri, Afshin Rostamizadeh in Ameet Talwalkar. "Temelji strojnega učenja". Tisk MIT. (2018).

[16] Peter L Bartlett. "Vzorčna kompleksnost klasifikacije vzorcev z nevronskimi mrežami: velikost uteži je pomembnejša od velikosti mreže". Transakcije IEEE o informacijski teoriji 44 (1998).
https: / / doi.org/ 10.1109 / 18.661502

[17] Maria Schuld. »Nadzorovani modeli kvantnega strojnega učenja so metode jedra« (2021). arXiv:2101.11020.
arXiv: 2101.11020

[18] Matthias C Caro in Ishaun Datta. “Psevdodimenzija kvantnih vezij”. Kvantna strojna inteligenca 2 (2020). arXiv:2002.01490.
https:/​/​doi.org/​10.1007/​s42484-020-00027-5
arXiv: 2002.01490

[19] Kaifeng Bu, Dax Enshan Koh, Lu Li, Qingxian Luo in Yaobo Zhang. »O statistični kompleksnosti kvantnih vezij« (2021). arXiv:2101.06154.
https: / / doi.org/ 10.1103 / PhysRevA.105.062431
arXiv: 2101.06154

[20] Kaifeng Bu, Dax Enshan Koh, Lu Li, Qingxian Luo in Yaobo Zhang. »Učinki kvantnih virov na statistično kompleksnost kvantnih vezij« (2021). arXiv:2102.03282.
arXiv: 2102.03282

[21] Kaifeng Bu, Dax Enshan Koh, Lu Li, Qingxian Luo in Yaobo Zhang. »Rademacherjeva kompleksnost hrupnih kvantnih vezij« (2021). arXiv:2103.03139.
arXiv: 2103.03139

[22] Amira Abbas, David Sutter, Christa Zoufal, Aurélien Lucchi, Alessio Figalli in Stefan Woerner. "Moč kvantnih nevronskih mrež". Nature Computational Science 1 (2021). arXiv:2011.00027.
https:/​/​doi.org/​10.1038/​s43588-021-00084-1
arXiv: 2011.00027

[23] Yuxuan Du, Zhuozhuo Tu, Xiao Yuan in Dacheng Tao. “Učinkovito merilo za izraznost variacijskih kvantnih algoritmov”. Physical Review Letters 128 (2022). arXiv:2104.09961.
https: / / doi.org/ 10.1103 / PhysRevLett.128.080506
arXiv: 2104.09961

[24] Leonardo Banchi, Jason Pereira in Stefano Pirandola. "Posploševanje v kvantnem strojnem učenju: Stališče kvantnih informacij". PRX Quantum 2 (2021). arXiv:2102.08991.
https: / / doi.org/ 10.1103 / PRXQuantum.2.040321
arXiv: 2102.08991

[25] Hsin-Yuan Huang, Michael Broughton, Masoud Mohseni, Ryan Babbush, Sergio Boixo, Hartmut Neven in Jarrod R McClean. "Moč podatkov v kvantnem strojnem učenju". Nature Communications 12 (2021). arXiv:2011.01938.
https:/​/​doi.org/​10.1038/​s41467-021-22539-9
arXiv: 2011.01938

[26] Yunchao Liu, Srinivasan Arunachalam in Kristan Temme. "Stroga in robustna kvantna pospešitev v nadzorovanem strojnem učenju". Fizika narave 17, 1013–1017 (2021). arXiv:2010.02174.
https: / / doi.org/ 10.1038 / s41567-021-01287-z
arXiv: 2010.02174

[27] Bernhard Schölkopf, Alexander J Smola, Francis Bach idr. “Učenje z jedri: podporni vektorski stroji, regulacija, optimizacija in več”. Tisk MIT. (2002).
https: / / doi.org/ 10.7551 / mitpress / 4175.001.0001

[28] Vladimir N Vapnik in A Ya Chervonenkis. "O enakomerni konvergenci relativnih frekvenc dogodkov do njihovih verjetnosti". V Mere zahtevnosti. Springer (2015).
https:/​/​doi.org/​10.1007/​978-3-319-21852-6_3

[29] Michael J Kearns in Robert E Schapire. “Učinkovito učenje verjetnostnih konceptov brez distribucije”. Journal of Computer and System Sciences 48 (1994).
https:/​/​doi.org/​10.1016/​S0022-0000(05)80062-5

[30] Michael M Wolf. “Matematične osnove nadzorovanega učenja”. https://​/​www-m5.ma.tum.de/​foswiki/​pub/​M5/​Allgemeines/​MA4801_2020S/​ML_notes_main.pdf (2020).
https: / / www-m5.ma.tum.de/ foswiki / pub / M5 / Allgemeines / MA4801_2020S / ML_notes_main.pdf

[31] Dyon van Vreumingen. "Učenje prostora kvantnih funkcij: karakterizacija in možne prednosti". magistrsko delo. Univerza Leiden. (2020).

[32] Jae-Eun Park, Brian Quanz, Steve Wood, Heather Higgins in Ray Harishankar. »Praktično izboljšanje uporabe kvantnega svm: od teorije do prakse« (2020). arXiv:2012.07725.
arXiv: 2012.07725

[33] John Shawe-Taylor, Peter L. Bartlett, Robert C. Williamson in Martin Anthony. »Zmanjšanje strukturnega tveganja v hierarhijah, odvisnih od podatkov«. IEEE Transactions on Information Theory (1998).
https: / / doi.org/ 10.1109 / 18.705570

[34] Martin Anthony in Peter L Bartlett. “Učenje funkcij iz interpolacije”. Kombinatorika, verjetnost in računalništvo 9 (2000).
https: / / doi.org/ 10.1017 / S0963548300004247

[35] Peter L Bartlett in Philip M Long. "Napovedovanje, učenje, enotna konvergenca in dimenzije, občutljive na merilo". Journal of Computer and System Sciences 56 (1998).
https: / / doi.org/ 10.1006 / jcss.1997.1557

[36] Scott Aaronson. "Učljivost kvantnih stanj". Proceedings of the Royal Society A: Mathematical, Physical and Engineering Sciences 463 (2007). arXiv:quant-ph/​0608142.
https: / / doi.org/ 10.1098 / rspa.2007.0113
arXiv: kvant-ph / 0608142

Navedel

[1] Matthias C. Caro, Hsin-Yuan Huang, M. Cerezo, Kunal Sharma, Andrew Sornborger, Lukasz Cincio in Patrick J. Coles, "Posploševanje v kvantnem strojnem učenju iz nekaj podatkov za usposabljanje", Nature Communications 13, 4919 (2022).

[2] Matthias C. Caro, Hsin-Yuan Huang, Nicholas Ezzell, Joe Gibbs, Andrew T. Sornborger, Lukasz Cincio, Patrick J. Coles in Zoë Holmes, “Out-of-distribucijska generalizacija za učenje kvantne dinamike”, arXiv: 2204.10268.

[3] Yuxuan Du, Min-Hsiu Hsieh, Tongliang Liu, Shan You in Dacheng Tao, »Učljivost kvantnih nevronskih mrež«, PRX Quantum 2 4, 040337 (2021).

[4] Joe Gibbs, Zoë Holmes, Matthias C. Caro, Nicholas Ezzell, Hsin-Yuan Huang, Lukasz Cincio, Andrew T. Sornborger in Patrick J. Coles, "Dinamična simulacija prek kvantnega strojnega učenja z dokazljivo generalizacijo", arXiv: 2204.10269.

[5] Sofiene Jerbi, Lukas J. Fiderer, Hendrik Poulsen Nautrup, Jonas M. Kübler, Hans J. Briegel in Vedran Dunjko, »Kvantno strojno učenje onkraj metod jedra«, arXiv: 2110.13162.

[6] Matthias C. Caro, Elies Gil-Fuster, Johannes Jakob Meyer, Jens Eisert in Ryan Sweke, »Od kodiranja odvisne generalizacijske meje za parametrizirana kvantna vezja«, arXiv: 2106.03880.

[7] Supanut Thanasilp, Samson Wang, M. Cerezo in Zoë Holmes, "Eksponentna koncentracija in nezmožnost usposabljanja v metodah kvantnega jedra", arXiv: 2208.11060.

[8] Masahiro Kobayashi, Kohei Nakaji in Naoki Yamamoto, "Overfitting in quantum machine learning and entangling dropout", arXiv: 2205.11446.

[9] Brian Coyle, »Aplikacije strojnega učenja za hrupne kvantne računalnike srednjega obsega«, arXiv: 2205.09414.

[10] Evan Peters in Maria Schuld, "Posploševanje kljub prekomernemu opremljanju modelov kvantnega strojnega učenja", arXiv: 2209.05523.

[11] Marco Fanizza, Yihui Quek in Matteo Rosati, "Učenje kvantnih procesov brez nadzora vnosa", arXiv: 2211.05005.

[12] Dylan Herman, Rudy Raymond, Muyuan Li, Nicolas Robles, Antonio Mezzacapo in Marco Pistoia, »Izraznost variacijskega kvantnega strojnega učenja na Boolovi kocki«, arXiv: 2204.05286.

[13] Yuxuan Du, Min-Hsiu Hsieh, Tongliang Liu, Shan You in Dacheng Tao, »Erratum: Learnability of Quantum Neural Networks [PRX QUANTUM 2, 040337 (2021)]«, PRX Quantum 3 3, 030901 (2022).

[14] Chih-Chieh Chen, Masaru Sogabe, Kodai Shiba, Katsuyoshi Sakamoto in Tomah Sogabe, "Splošne meje dimenzij Vapnik-Chervonenkis za učenje kvantnega vezja", Journal of Physics: Kompleksnost 3 4, 045007 (2022).

[15] Yuxuan Du, Yibo Yang, Dacheng Tao in Min-Hsiu Hsieh, »Demystify Problem-Dependent Power of Quantum Neural Networks on Multi-Class Classification«, arXiv: 2301.01597.

Zgornji citati so iz SAO / NASA ADS (zadnjič posodobljeno 2023-01-15 10:53:14). Seznam je morda nepopoln, saj vsi založniki ne dajejo ustreznih in popolnih podatkov o citiranju.

On Crossref je navedel storitev ni bilo najdenih podatkov o navajanju del (zadnji poskus 2023-01-15 10:53:12).

Časovni žig:

Več od Quantum Journal