Оптимизация работы квантовых компьютеров при помощи машинного обучения
Квантовые компьютеры, разработанные для того, чтобы значительно увеличить скорость вычислений, используют законы квантовой механики для исследования экспоненциального вычислительного пространства. Важным шагом, соединяющим теорию с практикой, является тщательная разработка средств для преобразования каждого квантового алгоритма в набор аналоговых управляющих сигналов. Правильный выбор этих элементов управления в конечном итоге определяет точность и скорость каждой операции.
Для систем с отказоустойчивостью квантовые операции не ограничиваются конечным набором вентилей, которые в противном случае были бы необходимы для достижения отказоустойчивости. Следовательно, реализация высокоточного и быстрого квантового логического элемента с одной последовательностью управляющих импульсов (вместо глубокой схемы посредством оптимального синтеза логических элементов) может значительно снизить требования к ресурсам и расширить возможные вычислительные задачи. Замена же стандартного универсального набора вентилей на неограниченный уменьшает необходимую глубину схем для экспериментальной демонстрации превосходства, которое могут дать квантовые мощности.
Проблемы квантовых компьютеров
Одна из самых серьёзных проблем при создании квантовых компьютеров последнего поколения — это их базовая конституэнта, кубит. Под конституэнтой здесь понимается традиционное алгебраическое понятие — конъюнкция, в которую включены все существующие переменные. Кубит же определяется как минимальная единица для хранения информации в устройстве. Кубиты могут взаимодействовать с объектами любого типа, находящимися рядом с ними, однако возникают проблемы с блуждающими фотонами (посторонними электромагнитными полями), фононами (механическими колебаниями квантовой техники) и другими дефектами — к примеру, дефектами чипов, которые могут изменять состояние кубитов непредсказуемым образом.
Проблема усугубляется ещё и тем, что электронные устройства, ответственные за преобразование цифровых сигналов в аналоговые и наоборот, не могут обеспечить достаточную точность преобразования из-за возникающего «белого шума» и других помех. Это приводит к возникновению ошибок стохастического типа и, как следствие, значительно снижает качество квантовых вычислений, существенно ограничивая сферы их применения. Для того чтобы оптимизировать процесс, требуется начать с построения рабочих физических моделей, разработанных под экспериментальные задачи. Одна из наиболее эффективных моделей использует принципы Deep Machine Learning, то есть глубокого машинного обучения. Инновационность этих методов заключается в новых принципах оптимизации, основанных на глубоком обучении с подкреплением.
Почему машинное обучение
Машинное обучение нейросетей с подкреплением полезно тем, что оно является устойчивым к белому шуму и эффективно против неопределенности и стохастической природы основных физических систем. В глубоком обучении программа выполняет ряд последовательных действий, и успешное обучение зависит от баланса между исследованием неизвестного на основе имеющихся знаний. Метод Deep Machine Learning с подкреплением произвёл революцию в неконтролируемом машинном обучении за счет новых алгоритмов, которые обеспечивают масштабируемость, эффективность обработки данных и надежность, что подкрепляется теоретическими гарантиями.
Благодаря расширенным методам оптимизации с использованием глубоких нейронных сетей, они могут решать сложные задачи оптимизации, которые недоступны классическим методикам в тестовых задачах, таких как моделирование движений роботов и искусственного интеллекта в играх. Классический метод Qlearning недавно был применен и к квантовым задачам, однако эти исследования пока не учитывают ошибки утечки информации. Однако методы Deep Machine Learning для нейронных сетей способны решать более сложные проблемы, а также минимизировать утечки информации.
Принципы Deep Machine Learning
Предлагаемая рядом специалистов новая структура подразумевает соединение принципов квантовой динамики с современными методами Deep Machine Learning. Вместо того, чтобы прибегать к экспериментальным рандомизированным выборкам для количественных оценок утечки информации, предлагается оценивать утечки путём регулирования значимости (веса) членов цепочки, что должно свести к минимуму значимые ошибки квантовых вычислений. Это обеспечивает совместную оптимизацию накопленных ошибок утечки и нарушений условий управления. Также такая структура облегчает зависящее от времени управление общими независимыми однокубитными и двухкубитными структурами, что позволяет достичь полной управляемости.
Качество и надежность новой схемы управления квантовыми вычислениями при помощи нейронной сети проверяется путём оценки точности при различных параметрах модели контроля белого шума. Производительность обучения с подкреплением можно также оценить при помощи оптимального синтеза вентилей: последний обеспечивает минимальное количество требуемых вентилей из конечного универсального набора для реализации того же преобразования. Новые решения при помощи нейронных сетей помогают ускорить вычисления на два порядка по сравнению с другими методами, основанными на наиболее известных экспериментальных параметрах сверхпроводящих кубитов (пример: метод базового стохастического градиентного спуска).
Решение проблемы утечки информации при помощи нейронных сетей
Утечки являются одной из самых неприятных проблем, которые имеют квантовые компьютеры, и значительно снижают точность квантовых вычислений. Чаще всего это происходит, когда квантовые состояния кубитов изменяются под влиянием случайного излучения. Из-за таких ошибок не только теряется часть информации, но, что ещё хуже, значительно снижается производительность — вплоть до значений обычных электронных устройств.
Для того чтобы оценить объём потерянной информации, раньше приходилось полностью моделировать вычисления. Однако это сводило к нулю все достоинства квантовых компьютеров, так как их главное преимущество заключается в том, что они могут выполнять такие объёмы вычислений, которые недостижимы для компьютеров с обычной архитектурой. Нейронные сети позволяют решить главную проблему — минимизировать утечки информации при помощи глубокого обучения с подкреплением. Такая методика уже продемонстрировала высокую производительность на любых тестовых задачах. И главное, она устойчива к шумам выборки и может оптимизировать сложнейшие задачи с огромным количеством параметров управления (до нескольких сотен миллионов).
Как работает машинное обучение нейросетей с подкреплением
Траектория управления кодируется в трехслойную нейронную сеть с перекрестными связями, а функция потерь — в параллельную нейронную сеть. Далее обе нейронные сети обучаются в стохастической среде, которая имитирует контроль шума в реальных условиях. После оптимизации сетей тесты численного моделирования демонстрируют уменьшение ошибок квантовых вентилей до 100 раз, и сокращается время отклика вентилей на целый порядок по сравнению с традиционными методами, использующими универсальный набор вентилей.
Конкретный пример: архитектура сверхпроводящих кубитов, которую используют квантовые движки Google, позволяет настраивать нейронную связь кубит-кубит. В первом приближении структура состоит из одночастных и двухчастных членов, представленных операторами рождения и уничтожения бозонов. Машинное обучение позволяет формировать более эффективные связи с распределением весов между элементами с учётом ошибок утечки и общего времени выполнения. Всё это легко оптимизируется с помощью методов Deep Machine Learning для нейронной сети, причём без ущерба для управляемости системы.
Плюсы кодирования PWC применительно к обучению с подкреплением
Использование методов Machine Learning основано на кусочно-постоянном представлении траектории управления (PWC), которое содержит около тысячи временных отрезков для каждой последовательности. Такое кодирование PWC ранее считалось невыгодным по следующим причинам:
• отсутствие аналитической формы выражения градиента может снижать точность оптимизации при тех же вычислительных ресурсах; • PWC может вводить нежелательные высокочастотные компоненты, которые плохи из-за возникновения ошибок утечки.
Эти ограничения в значительной степени устраняются тем, что входные данные для экспериментальных систем с квантовым управлением также являются сигналами PWC с временным шагом, ограниченным частотой дискретизации, а точность контроля амплитуды ограничена неопределенностями передаточной функции. Поэтому аналитическая функция может иметь ошибки дискретизации, не учтённые при первоначальной оптимизации. Конструкция управляющего фильтра может быть легко интегрирована в оптимизацию PWC, чтобы гарантировать желаемые последовательности управляющих импульсов.
Обучение алгоритмов Google
Машинное обучение с подкреплением представляет собой две сети нейронов: одна отображает заданное состояние, содержащее информацию о смоделированном единичном вентиле, а задача, стоящая перед другой сетью — принимать смоделированный вентиль в качестве входных данных для вывода предсказанной ценности, связанной с текущим элементом. Существенное отличие от ранее использовавшихся методов заключается в том, что траектория управления представлена отдельной сетью, то есть независимо от определения потерь управления («ценности»).
Обе сети взаимодействуют с обучающей средой, которая оценивает квантовую динамику при предложенном действии и возвращает обновленный единичный вентиль и соответствующий вес. Обучение каждой сети состоит из множества отдельных шагов, каждый из которых содержит все временные шаги полной траектории. Продолжительность такой выбранной траектории определяется минимумом заранее заданной верхней границы времени выполнения и временем, которое требуется для выполнения условия завершения. После выборки пакета из определённого количества шагов политики и функции ценности нейросетей обновляются для корректного пересчёта весов.
Также устойчивость к ошибкам значительно улучшается за счёт моделирования экспериментально релевантных гауссовских флуктуаций в амплитудах с использованием стохастической среды обучения. И это открытие отличается от недавних результатов, полученных по методам на основе рандомизированной выборки. Выяснилось, что наиболее переспективный подход здесь — включение оптимизации по ошибкам утечки при наличии колебаний управления, что отлично подходит под принципы, на которых основаны сети нейронов.
О перспективах
Технологии Deep Machine Learning для оптимизации квантовых алгоритмов вычисления уже продемонстрировали свою эффективность, обеспечив увеличение вычислительной мощности квантовых схем управления. Однако для полноценной интеграции этих технологий и оптимизации вычислительных способностей квантовых компьютеров понадобятся дополнительные экспериментальные исследования.