Мінімізація структурного ризику для квантових лінійних класифікаторів

Мінімізація структурного ризику для квантових лінійних класифікаторів

Каспер Гюрік1, Dyon Vreumingen, ван1,2,3, і Ведран Дунько1,4

1LIACS, Лейденський університет, Niels Bohrweg 1, 2333 CA Leiden, Нідерланди
2QuSoft, Centrum Wiskunde & Informatica (CWI), Science Park 123, 1098 XG Amsterdam, Нідерланди
3Інститут фізики Амстердамського університету, Науковий парк 904, 1098 XH Амстердам, Нідерланди
4LION, Leiden University, Niels Bohrweg 2, 2333 CA Leiden, Netherlands

Вам цей документ цікавий чи ви хочете обговорити? Скайте або залиште коментар на SciRate.

абстрактний

Моделі квантового машинного навчання (QML), засновані на параметризованих квантових схемах, часто висвітлюються як кандидати на «вбивчу програму» квантових обчислень у найближчій перспективі. Однак розуміння емпіричних і узагальнюючих характеристик цих моделей все ще знаходиться в зародковому стані. У цій статті ми досліджуємо, як балансувати між точністю навчання та продуктивністю узагальнення (також називається мінімізацією структурного ризику) для двох відомих моделей QML, представлених Havlíček та ін. [1], а також Шульд і Кіллоран [2]. По-перше, використовуючи зв’язки з добре зрозумілими класичними моделями, ми доводимо, що два параметри моделі – тобто розмірність суми зображень і норма Фробеніуса спостережуваних, які використовуються моделлю – тісно контролюють складність моделей і, отже, її ефективність узагальнення . По-друге, використовуючи ідеї, натхненні процесною томографією, ми доводимо, що ці параметри моделі також ретельно контролюють здатність моделей фіксувати кореляції в наборах навчальних прикладів. Підводячи підсумок, наші результати дають початок новим варіантам мінімізації структурного ризику для моделей QML.

► Дані BibTeX

► Список літератури

[1] Войтех Гавлічек, Антоніо Д. Корколес, Крістан Темме, Арам В. Харроу, Абхінав Кандала, Джеррі М. Чоу та Джей М. Гамбетта. «Контрольоване навчання з квантово розширеними просторами функцій». Природа 567 (2019). arXiv:1804.11326.
https:/​/​doi.org/​10.1038/​s41586-019-0980-2
arXiv: 1804.11326

[2] Марія Шульд і Натан Кіллоран. «Квантове машинне навчання в функціональних гільбертових просторах». Фізичні оглядові листи 122 (2019). arXiv:1803.07128.
https: / / doi.org/ 10.1103 / PhysRevLett.122.040504
arXiv: 1803.07128

[3] Френк Аруте, Кунал Ар’я, Раян Беббуш, Дейв Бекон, Джозеф С. Бардін, Рамі Барендс, Рупак Бісвас, Серхіо Бойшо, Фернандо Дж. С. Л. Брандао, Девід А. Буелл та ін. «Квантова перевага за допомогою програмованого надпровідного процесора». Природа 574 (2019). arXiv:1910.11333.
https:/​/​doi.org/​10.1038/​s41586-019-1666-5
arXiv: 1910.11333

[4] Джон Прескілл. «Квантові обчислення в епоху NISQ і за її межами». Квант 2 (2018). arXiv:1801.00862.
https:/​/​doi.org/​10.22331/​q-2018-08-06-79
arXiv: 1801.00862

[5] Марко Серезо, Ендрю Аррасміт, Раян Беббуш, Саймон С. Бенджамін, Сугуру Ендо, Кейсуке Фуджі, Джаррод Р. Макклін, Косуке Мітараі, Сяо Юань, Лукаш Сінчіо та ін. “Варіаційні квантові алгоритми”. Nature Reviews Physics 3 (2021). arXiv:2012.09265.
https:/​/​doi.org/​10.1038/​s42254-021-00348-9
arXiv: 2012.09265

[6] Джаррод Р. Макклін, Джонатан Ромеро, Раян Беббуш та Алан Аспуру-Гузік. “Теорія варіаційних гібридних квантово-класичних алгоритмів”. New Journal of Physics 18 (2016). arXiv:1509.04279.
https:/​/​doi.org/​10.1088/​1367-2630/​18/​2/​023023
arXiv: 1509.04279

[7] Абхінав Кандала, Антоніо Меццакапо, Крістан Темме, Майка Такіта, Маркус Брінк, Джеррі М. Чоу та Джей М. Гамбетта. «Апаратно ефективний варіаційний квантовий розв’язувач власних сигналів для малих молекул і квантових магнітів». Природа 549 ​​(2017). arXiv:1704.05018.
https: / / doi.org/ 10.1038 / nature23879
arXiv: 1704.05018

[8] Пітер Дж. Джей О'Меллі, Раян Беббуш, Ян Д. Ківлічан, Джонатан Ромеро, Джаррод Р. Макклін, Рамі Барендс, Джуліан Келлі, Педрам Рушан, Ендрю Трантер, Нан Дін та ін. “Масштабоване квантове моделювання молекулярних енергій”. Physical Review X 6 (2016). arXiv:1512.06860.
https: / / doi.org/ 10.1103 / PhysRevX.6.031007
arXiv: 1512.06860

[9] Едвард Фархі, Джеффрі Голдстоун і Сем Гутман. «Алгоритм квантової наближеної оптимізації» (2014). arXiv:1411.4028.
arXiv: 1411.4028

[10] Марчелло Бенедетті, Еріка Ллойд, Стефан Сак і Маттіа Фіорентіні. «Параметризовані квантові схеми як моделі машинного навчання». Квантова наука і технології 4 (2019). arXiv:1906.07682.
https:/​/​doi.org/​10.1088/​2058-9565/​ab4eb5
arXiv: 1906.07682

[11] Барбара М. Терхал і Девід П. ДіВінченцо. «Адаптивне квантове обчислення, квантові схеми постійної глибини та ігри Артура-Мерліна». Квантова інформація та обчислення 4 (2004). arXiv:quant-ph/​0205133.
https://​/​doi.org/​10.48550/​arXiv.quant-ph/​0205133
arXiv: quant-ph / 0205133

[12] Майкл Бремнер, Річард Джоза та Ден Шеперд. «Класичне моделювання комутуючих квантових обчислень передбачає колапс поліноміальної ієрархії». Праці Королівського товариства A: Математичні, фізичні та інженерні науки 467 (2011). arXiv:1005.1407.
https: / / doi.org/ 10.1098 / rspa.2010.0301
arXiv: 1005.1407

[13] Едвард Грант, Марчелло Бенедетті, Шусян Цао, Ендрю Галлам, Джошуа Локхарт, Від Стоєвіч, Ендрю Дж. Грін і Сімоне Северіні. “Ієрархічні квантові класифікатори”. npj Квантова інформація 4 (2018). arXiv:1804.03680.
https:/​/​doi.org/​10.1038/​s41534-018-0116-9
arXiv: 1804.03680

[14] Дієго Рісте, Маркус П. Да Сілва, Колм А. Райан, Ендрю В. Кросс, Антоніо Д. Корколес, Джон А. Смолін, Джей М. Гамбетта, Джеррі М. Чоу та Блейк Р. Джонсон. «Демонстрація квантової переваги в машинному навчанні». npj Квантова інформація 3 (2017). arXiv:1512.06069.
https:/​/​doi.org/​10.1038/​s41534-017-0017-3
arXiv: 1512.06069

[15] Мехріар Мохрі, Афшин Ростамізаде та Аміт Талвалкар. «Основи машинного навчання». Преса MIT. (2018).

[16] Пітер Л. Бартлетт. «Складність вибірки класифікації шаблонів за допомогою нейронних мереж: розмір ваг важливіший за розмір мережі». Транзакції IEEE з теорії інформації 44 (1998).
https: / / doi.org/ 10.1109 / 18.661502

[17] Марія Шульд. «Моделі керованого квантового машинного навчання є методами ядра» (2021). arXiv:2101.11020.
arXiv: 2101.11020

[18] Маттіас Каро та Ішон Датта. “Псевдорозмірність квантових кіл”. Квантова машина інтелекту 2 (2020). arXiv:2002.01490.
https:/​/​doi.org/​10.1007/​s42484-020-00027-5
arXiv: 2002.01490

[19] Кайфен Бу, Дакс Еньшань Ко, Лу Лі, Цінсянь Луо та Яобо Чжан. «Про статистичну складність квантових схем» (2021). arXiv:2101.06154.
https: / / doi.org/ 10.1103 / PhysRevA.105.062431
arXiv: 2101.06154

[20] Кайфен Бу, Дакс Еньшань Ко, Лу Лі, Цінсянь Луо та Яобо Чжан. «Вплив квантових ресурсів на статистичну складність квантових схем» (2021). arXiv:2102.03282.
arXiv: 2102.03282

[21] Кайфен Бу, Дакс Еньшань Ко, Лу Лі, Цінсянь Луо та Яобо Чжан. «Складність Радемахера зашумлених квантових схем» (2021). arXiv:2103.03139.
arXiv: 2103.03139

[22] Аміра Аббас, Девід Саттер, Кріста Зуфаль, Орельєн Луккі, Алессіо Фігаллі та Стефан Вернер. «Потужність квантових нейронних мереж». Nature Computational Science 1 (2021). arXiv:2011.00027.
https:/​/​doi.org/​10.1038/​s43588-021-00084-1
arXiv: 2011.00027

[23] Юйсюань Ду, Чжуочжуо Ту, Сяо Юань і Дачен Тао. “Ефективна міра експресивності варіаційних квантових алгоритмів”. Physical Review Letters 128 (2022). arXiv:2104.09961.
https: / / doi.org/ 10.1103 / PhysRevLett.128.080506
arXiv: 2104.09961

[24] Леонардо Банчі, Джейсон Перейра та Стефано Пірандола. «Узагальнення в квантовому машинному навчанні: точка зору квантової інформації». PRX Quantum 2 (2021). arXiv:2102.08991.
https: / / doi.org/ 10.1103 / PRXQuantum.2.040321
arXiv: 2102.08991

[25] Сінь-Юань Хуанг, Майкл Бротон, Масуд Мохсені, Раян Беббуш, Серхіо Бойшо, Хартмут Невен і Джаррод МакКлін. «Сила даних у квантовому машинному навчанні». Природні комунікації 12 (2021). arXiv:2011.01938.
https:/​/​doi.org/​10.1038/​s41467-021-22539-9
arXiv: 2011.01938

[26] Юньчао Лю, Шрінівасан Аруначалам і Крістан Темме. «Суворе та надійне квантове прискорення керованого машинного навчання». Nature Physics 17, 1013–1017 (2021). arXiv:2010.02174.
https: / / doi.org/ 10.1038 / s41567-021-01287-z
arXiv: 2010.02174

[27] Бернхард Шелькопф, Олександр Дж. Смола, Френсіс Бах та ін. «Навчання з ядрами: підтримка векторних машин, регулярізація, оптимізація та інше». Преса MIT. (2002).
https://​/​doi.org/​10.7551/​mitpress/​4175.001.0001

[28] Володимир Н Вапник і А Я Червоненкис. “Про рівномірну збіжність відносних частот подій до їх ймовірностей”. В Міри складності. Springer (2015).
https:/​/​doi.org/​10.1007/​978-3-319-21852-6_3

[29] Майкл Джей Кернс і Роберт Е Шапір. «Ефективне вивчення імовірнісних концепцій без розподілу». Журнал комп'ютерних і системних наук 48 (1994).
https:/​/​doi.org/​10.1016/​S0022-0000(05)80062-5

[30] Майкл М Вольф. “Математичні основи контрольованого навчання”. https://​/​www-m5.ma.tum.de/​foswiki/​pub/​M5/​Allgemeines/​MA4801_2020S/​ML_notes_main.pdf (2020).
https://​/​www-m5.ma.tum.de/​foswiki/​pub/​M5/​Allgemeines/​MA4801_2020S/​ML_notes_main.pdf

[31] Дйон ван Вроймінген. «Навчання простору квантових ознак: характеристика та можливі переваги». Магістерська робота. Лейденський університет. (2020).

[32] Дже-Юн Пак, Брайан Кванц, Стів Вуд, Хізер Хіггінс і Рей Харішанкар. «Практичне вдосконалення застосування квантового svm: від теорії до практики» (2020). arXiv:2012.07725.
arXiv: 2012.07725

[33] Джон Шоу-Тейлор, Пітер Л. Бартлетт, Роберт С. Вільямсон і Мартін Ентоні. «Структурна мінімізація ризику в ієрархіях, що залежать від даних». IEEE Transactions on Information Theory (1998).
https: / / doi.org/ 10.1109 / 18.705570

[34] Мартін Ентоні та Пітер Л. Бартлетт. «Навчання функцій з інтерполяції». Комбінаторика, ймовірність і обчислення 9 (2000).
https: / / doi.org/ 10.1017 / S0963548300004247

[35] Пітер Л. Бартлетт і Філіп М. Лонг. «Передбачення, навчання, рівномірна конвергенція та розміри, чутливі до масштабу». Журнал комп'ютерних і системних наук 56 (1998).
https://​/​doi.org/​10.1006/​jcss.1997.1557

[36] Скотт Ааронсон. «Здатність вивчати квантові стани». Праці Королівського товариства A: Математичні, фізичні та інженерні науки 463 (2007). arXiv:quant-ph/​0608142.
https: / / doi.org/ 10.1098 / rspa.2007.0113
arXiv: quant-ph / 0608142

Цитується

[1] Маттіас С. Каро, Син-Юань Хуан, М. Серезо, Кунал Шарма, Ендрю Сорнборгер, Лукаш Сінчіо та Патрік Дж. Коулз, «Узагальнення в квантовому машинному навчанні на основі кількох навчальних даних», Nature Communications 13, 4919 (2022).

[2] Маттіас К. Каро, Син-Юань Хуанг, Ніколас Еззелл, Джо Гіббс, Ендрю Т. Сорнборгер, Лукаш Сінчіо, Патрік Дж. Коулз і Зої Холмс, «Узагальнення поза розподілом для вивчення квантової динаміки», arXiv: 2204.10268.

[3] Yuxuan Du, Min-Hsiu Hsieh, Tongliang Liu, Shan You, and Dacheng Tao, “Learnability of Quantum Neural Networks”, PRX Quantum 2 4, 040337 (2021).

[4] Джо Гіббс, Зої Холмс, Маттіас С. Каро, Ніколас Еззелл, Син-Юань Хуанг, Лукаш Сінчіо, Ендрю Т. Сорнборгер і Патрік Дж. Коулз, «Динамічне моделювання за допомогою квантового машинного навчання з доказовим узагальненням», arXiv: 2204.10269.

[5] Соф’єн Джербі, Лукас Дж. Фідерер, Хендрік Поульсен Наутруп, Йонас М. Кюблер, Ганс Дж. Брігель та Ведран Дунько, «Квантове машинне навчання за межами ядерних методів», arXiv: 2110.13162.

[6] Matthias C. Caro, Elies Gil-Fuster, Johannes Jakob Meyer, Jens Eisert і Ryan Sweke, “Межі узагальнення, залежні від кодування для параметризованих квантових схем”, arXiv: 2106.03880.

[7] Supanut Thanasilp, Samson Wang, M. Cerezo та Zoë Holmes, «Експоненціальна концентрація та неможливість навчання в методах квантового ядра», arXiv: 2208.11060.

[8] Масахіро Кобаясі, Кохеї Накаджі та Наокі Ямамото, «Переобладнання в квантовому машинному навчанні та заплутане відпадання», arXiv: 2205.11446.

[9] Браян Койл, «Програми машинного навчання для шумних квантових комп’ютерів середнього масштабу», arXiv: 2205.09414.

[10] Еван Пітерс і Марія Шульд, «Узагальнення, незважаючи на надмірне оснащення моделей квантового машинного навчання», arXiv: 2209.05523.

[11] Marco Fanizza, Yihui Quek і Matteo Rosati, «Навчання квантових процесів без контролю вхідних даних», arXiv: 2211.05005.

[12] Ділан Герман, Руді Реймонд, Муюан Лі, Ніколас Роблес, Антоніо Меццакапо та Марко Пістоя, «Виразність варіаційного квантового машинного навчання на булевому кубі», arXiv: 2204.05286.

[13] Yuxuan Du, Min-Hsiu Hsieh, Tongliang Liu, Shan You і Dacheng Tao, «Erratum: Learnability of Quantum Neural Networks [PRX QUANTUM 2, 040337 (2021)]», PRX Quantum 3 3, 030901 (2022).

[14] Chih-Chieh Chen, Masaru Sogabe, Kodai Shiba, Katsuyoshi Sakamoto, and Tomah Sogabe, “General Vapnik-Chervonenkis dimension bounds for quantum circuit learning”, Journal of Physics: Complexity 3 4, 045007 (2022).

[15] Yuxuan Du, Yibo Yang, Dacheng Tao та Min-Hsiu Hsieh, «Demystify Problem-Dependent Power of Quantum Neural Networks on Multi-Class Classification», arXiv: 2301.01597.

Вищезазначені цитати від SAO / NASA ADS (останнє оновлення успішно 2023-01-15 10:53:14). Список може бути неповним, оскільки не всі видавці надають відповідні та повні дані про цитування.

On Служба, на яку посилається Crossref даних про цитування робіт не знайдено (остання спроба 2023-01-15 10:53:12).

Часова мітка:

Більше від Квантовий журнал