Simulated Annealing
Simulated Annealing (engl. für simuliertes Tempern/ spannungsfrei Machen/ Vergüten) ist ein heuristisches Approximationsverfahren. Es wird zum Auffinden einer Näherungslösung von Optimierungsproblemen eingesetzt, die durch ihre hohe Komplexität das vollständige Ausprobieren aller Möglichkeiten und mathematische Optimierungsverfahren ausschließen.
Grundidee ist die Nachbildung eines Abkühlungsprozesses, etwa beim Glühen in der Metallurgie. Nach dem Erhitzen eines Metalls sorgt die langsame Abkühlung dafür, dass die Atome ausreichend Zeit haben, sich zu ordnen und stabile Kristalle zu bilden. Dadurch wird ein energiearmer Zustand nahe am Optimum erreicht. Übertragen auf das Optimierungsverfahren entspricht die Temperatur einer Wahrscheinlichkeit, mit der sich ein Zwischenergebnis der Optimierung auch verschlechtern darf. Wie viele andere Lokale-Suche-Algorithmen kann das Verfahren dadurch ein lokales Optimum wieder verlassen, um ein besseres zu finden. Vom Metropolis-Algorithmus in Monte-Carlo-Simulationen unterscheidet sich das Verfahren durch das Absenken der Temperatur im Verlauf der Iteration.
Der Algorithmus wird beispielsweise beim Floorplanning im Laufe eines Chipentwurfs oder für die Standort- und Routenplanung verwendet.[1]
Es gibt auch Quantenversionen von Annealing (mit Tunnelung zwischen den Minima), eingeführt in den 1990er Jahren.[2][3]
Motivation
BearbeitenDer Algorithmus des Simulated Annealing ist durch physikalische Überlegungen motiviert.[4] Gesucht sei ein energetisch günstigster Zustand eines Systems, welches mithilfe der Boltzmann-Statistik beschrieben werden kann. Gemäß der Boltzmann-Statistik ist die Wahrscheinlichkeit, einen Mikrozustand mit Energie anzutreffen, gegeben durch die Wahrscheinlichkeitsverteilung
wobei die Boltzmann-Konstante und die Temperatur ist. Die Energie des energetisch günstigsten Zustandes sei . Die obige Proportionalität bleibt bestehen bei Multiplikation mit einem von unabhängigen Faktor:
Da der energetisch günstigste Zustand ist, gilt . Weiterhin ist und . Somit ist der Exponent negativ, und mit abnehmender Temperatur wird sein Betrag größer, wodurch die Wahrscheinlichkeit sinkt, einen angeregten Energiezustand mit mindestens zu finden. Senkt man somit die Temperatur des Systems langsam ab, so wird der energetisch günstigste Zustand mit immer größerer Wahrscheinlichkeit angetroffen.
Problemstellung
BearbeitenGegeben sei der Lösungsraum , eine Fitnessfunktion , die jeder Lösung in einen Wert zuweist, und ein Abbruchkriterium.
Gesucht ist eine approximative Lösung des globalen Minimums von über , also ein mit möglichst kleinem Wert . Sollte ein mit möglichst großem Wert gesucht sein (Maximierungsproblem), kann man dies durch Negieren von einfach auf den vorigen Fall zurückführen.
Außerdem wird ein Umgebungsbegriff benötigt (wobei die Potenzmenge von bezeichnet), um zu gegebenem eine benachbarte Lösung zu erzeugen.
Algorithmus
Bearbeiten- Initialisierung:
- lokale Veränderung:
- wähle zu einen Nachbarn zufällig aus
- Selektion:
- wenn , setze
- anderenfalls setze nur mit Wahrscheinlichkeit .
- Bisher beste Lösung aktualisieren:
- wenn , setze
- Inkrementiere:
- setze
- Abbruch oder weiter:
- wenn die Abbruchbedingung nicht erfüllt ist, gehe zu Schritt 2.
Erläuterungen
BearbeitenDie Wahrscheinlichkeit , dass durch ein schlechteres ersetzt wird, ist umso kleiner, je größer die Verschlechterung ist. Weil eine monoton fallende Folge ist, nimmt die Wahrscheinlichkeit außerdem während eines Programmlaufs immer mehr ab. Das Verfahren verhält sich mit abnehmendem mehr und mehr wie ein Bergsteigeralgorithmus.
Wie ein Nachbar gewählt werden sollte, hängt von dem vorliegenden Problem ab. In der Informatik ist häufig der Wertebereich und wird als Bit-Vektor betrachtet. Ein Nachbar von kann dann z. B. durch das Flippen (Invertieren) von einem oder von wenigen Bits erzeugt werden (siehe Wegener 2005).
Es sind verschiedene Abbruchbedingungen denkbar. Zum Beispiel wird nur eine maximale Anzahl von Durchläufen erlaubt, eine ausreichende Fitness definiert, eine Untergrenze für die Abkühlung festgelegt oder eine Anzahl von Zeitpunkten definiert, über die sich nicht mehr geändert hat.
Graphische Verdeutlichung
BearbeitenDie Idee des simulierten Abkühlens kann man sich graphisch verdeutlichen.[5]
Angenommen, man sucht in einer zweidimensionalen Landschaft den (global) tiefsten Punkt. Die Landschaft selbst besteht aus vielen unterschiedlich tiefen Dellen. Die einfache Suchstrategie (suche den nächsten tiefsten Punkt) entspricht dem Verhalten einer Kugel, welche in dieser Landschaft ausgesetzt wird. Sie rollt zum nächsten lokalen Minimum und bleibt dort. Bei der simulierten Abkühlung wird der Kugel immer wieder ein Stoß versetzt, der mit zunehmender „Abkühlung“ schwächer wird. Dieser ist idealerweise stark genug, um die Kugel aus einer flachen Delle (lokales Minimum) zu entfernen, reicht aber nicht aus, um aus dem globalen Minimum zu fliehen.
Siehe auch
Bearbeiten- Schwellenakzeptanz (threshold accepting)
- Deterministic Annealing
- Stochastisches Tunneln
- Sintflutalgorithmus
- Metropolisalgorithmus
Literatur
Bearbeiten- Ingo Wegener: Simulated Annealing Beats Metropolis in Combinatorial Optimization. In: Lecture Notes in Computer Science. Band 3580. Springer, Berlin/Heidelberg 2005, ISBN 978-3-540-27580-0, S. 589–601, doi:10.1007/11523468 (Für ein einfach zu beschreibendes Problem wird gezeigt, dass unabhängig von der Temperatur die simulierte Abkühlung effizienter ist als der Metropolisalgorithmus.).
Weblinks
Bearbeiten- Interaktives JavaScript zur Demonstration ( vom 13. März 2015 im Internet Archive)
- Interaktive Demonstration zum Ausprobieren
- C#-Implementierung und Anwendung zur Minimierung und auf das Problem des Handelsreisenden
- Simulated Annealing in C++ Optimierungs-Bibliothek cppOpt cppOpt bzw. OptSimulatedAnnealing.h
Einzelnachweise
Bearbeiten- ↑ Bogatzki, A.: Fabrikplanung: Verfahren zur Optimierung von Maschinenaufstellung. Diss. Universität Wuppertal (1998). Roderer 1998. ISBN 978-3-89073-234-3
- ↑ T. Kadowaki, H. Nishimori, Quantum annealing in the transverse Ising model, Phys. Rev. E, Band 58, 1998, S. 5355
- ↑ A. B. Finilla, M. A. Gomez, C. Sebenik, J. D. Doll, Quantum annealing: A new method for minimizing multidimensional functions, Chem. Phys. Lett., Band 219, 1994, S. 343
- ↑ JP Dr. A. Arnold, Universität Stuttgart, Institut für Computerphysik, Skript zur Vorlesung Physik auf dem Computer (PDF; 3,3 MB) S. 181 ff.
- ↑ Google TechTalk Vortrag Eine kurze, aber sehr verständliche Erklärung zum Thema findet man ab Minute 35.