Paper: A hybrid learning agent for episodic learning tasks with unknown target distance
Oliver Sefrin · Sabine Wölk
Quantum Machine Intelligence · 2025
Der „hybride Agent für quantenzugängliches Verstärkungslernen“, wie er in (Hamann und Wölk New J Phys 24:033044 2022) definiert ist, bietet nachweislich eine quasi-quadratische Beschleunigung und ist experimentell getestet. Allerdings kann die Standardversion nur auf episodische Lernaufgaben mit fester Episodenlänge angewendet werden. In vielen realen Anwendungen ist die Information über die notwendige Anzahl von Schritten innerhalb einer Episode, um ein definiertes Ziel zu erreichen, nicht im Voraus und insbesondere vor dem erstmaligen Erreichen des Ziels verfügbar. Außerdem haben klassische Agenten in solchen Szenarien den Vorteil, dass sie beobachten können, bei welchem Schritt sie das Ziel erreichen. Wie man am besten mit einer unbekannten Zieldistanz beim klassischen und Quanten-Verstärkungslernen umgeht und ob der hybride Agent in solchen Lernszenarien einen Vorteil bieten kann, ist bisher unbekannt. In dieser Arbeit führen wir einen hybriden Agenten mit einer stochastischen Strategie zur Auswahl der Episodenlänge ein, um die Notwendigkeit des Wissens über die notwendige Episodenlänge zu verringern. Durch Simulationen testen wir die Leistung des angepassten hybriden Agenten im Vergleich zu klassischen Agenten mit und ohne ähnliche Episodenauswahlstrategien. Unsere Simulationen zeigen, dass die von uns entwickelte Strategie zur Auswahl der Episodenlänge bei klassischen Lernagenten in bestimmten Szenarien zu einer Beschleunigung führt und dass unser hybrider Lernagent eine zusätzliche Beschleunigung erfährt.
Quantum Machine Intelligence (2025)
https://doi.org/10.1007/s42484-025-00269-1



