Software: CAD - Tutorial - Optimierung - Probabilistik Sampling-Methode

Aus OptiYummy
Zur Navigation springenZur Suche springen

Statistische Versuchsplanung - Sampling Methode
Software CAD - Tutorial - Optimierung - Probabilistik Sampling OptVerfahren Simulation.gif

"Sample" ist der englische Begriff für eine Stichprobe. Bei der Sampling-Methode der probabilistischen Simulation wird die Stichprobe mit Zufallszahlen "erwürfelt":

  • Es existieren verschiedene Verfahren, wie man durch "Würfeln" Verteilungsdichten über die Streubreite der Parameter nachbilden kann.
  • Man spricht hierbei auch von Monte-Carlo-Verfahren. (Siehe: OptiY-Hilfe > Theoretische Grundlagen > Statistische Versuchsplanung > Sampling Verfahren).
  • Wir werden uns hier auf das Rechenzeit-optimale Verfahren des Latin Hypercube Sampling beschränken.

Wichtig: Es ist "Simulation" als Optimierungsverfahren zu wählen, damit nur eine Stichprobe berechnet wird! Anderenfalls würde jeder Optimierungsschritt aus einer kompletten Stichprobe bestehen (sehr zeitaufwändig!)

Für schnelle Modelle (<1s) wäre es möglich, "erwürfelte" Stichproben (Sampling Methode) direkt statistisch auszuwerten. Allerdings führen selbst einige 1000 Modellrechnungen noch zu hohen statistischen Fehlern:

  • In der Praxis lässt man den statistischen Fehler gegen Null konvergieren, indem man riesige "virtuelle" Stichproben (z.B. 1000000) anhand eines extrem schnellen Ersatzmodells berechnet.
  • Als Ersatzmodell benutzt man meist Polynom-Funktionen der Ordnung O=1..5.
  • Der verbleibende Fehler der probabilistischen Simulation resultiert dann nur aus einer unzureichenden Abbildung der originalen Übertragungsfunktion zwischen Input- und Output-Größen auf das Ersatzmodell.
    Software CAD - Tutorial - Optimierung - Probabilistik Sampling Versuchsplanung konfig.gif

Latin Hypercube Sampling erreicht im Vergleich zum klassischen Monte Carlo Sampling mit bedeutend kleinerem Stichprobenumfang eine "saubere" Verteilungsfunktion:

  • Die gesamte Toleranzbreite eines streuenden Parameters wird dazu in Teilintervalle zerlegt.
  • Jedes Teilintervall wird danach entsprechend der gegebenen Verteilungsfunktion mit Zufallszahlen gefüllt.

Das gewählte Verfahren wird sowohl für die Berechnung der realen Stichprobe, als auch für die anschließenden statistischen Berechnungen anhand der virtuellen Stichprobe benutzt.

1. Reale Stichprobe:

  • Die minimal erforderliche Anzahl der Modellberechnungen M (=Stichprobenumfang) ergibt sich aus der Anzahl n der Streuungen und der gewählten Ordnung O der Polynom-Funktion zu
    M=(n²-n)/2+O*n+1.
  • Mit unseren n=5 Streuungen wären für eine Polynom-Funktion 2.Ordnung nur 21 Modellberechnungen innerhalb des Streubereiches erforderlich. Für Polynome 4. Ordnung erhöht sich diese Anzahl auf 31:
    • Diese minimale Anzahl gilt nur, wenn die Übertragungsfunktion innerhalb des Streubereiches durch die Polynom-Funktion exakt nachgebildet wird.
    • Für praktische Probleme ist keine exakte, sondern nur eine hinreichend genaue Ersatzfunktion realisierbar.
    • Deshalb sollte man zumindest für Toleranzanalysen, welche im Unterschied zu Toleranzoptimierungen auf der Berechnung nur einer Stichprobe basieren, den Stichprobenumfang möglichst groß wählen.
    • Die Polynom-Funktion wird nach einer Ausgleichsrechnung möglichst gut an die berechneten Stützstellen angepasst.
  • Im Beispiel ist ein Stichprobenumfang=100 ein guter Kompromiss zwischen Rechenzeit und Genauigkeit. Außerdem bietet dieser Stichprobenumfang genügend Reserven, um nachträglich auch Polynom-Funktionen höherer Ordnung als Ersatz-Modell zu testen.
  • Zufallsgenerator=Zeitabhängig Initialisiert bedeutet, dass für jede Stichprobe ein anderer Startwert benutzt wird. Insbesondere bei zu kleinen realen Stichproben können sich damit die statistischen Ergebnisse merklich unterscheiden.
  • Adaptives Design ermöglicht eine automatische Ermittlung der erforderlichen Stützstellen für die reale Stichprobe. Diese Funktion werden wir in dieser Übung nicht nutzen.
  • Trainingsdaten=100 % bedeutet, dass alle Stützstellen der realen Stichprobe direkt zur Bildung der Ersatz-Modelle ("Antwortfläche") verwendet werden. Eine Aufteilung der realen Stichprobe in Trainings- und Validierungsdaten hat Bedeutung für die Bewertung der Ersatzmodellgüte im Rahmen der automatischen Ermittlung optimaler Ersatzmodelle. Dafür gibt es dann weitere Parameter.
  • Messdaten könnte man in Form einer Datei als zusätzliche Trainingsdaten einspeisen.

2. Virtuelle Stichprobe: Das auf Basis der realen Stichprobe gebildete Ersatzmodell ("Antwortfläche" in Form einer Polynom-Funktion) wird genutzt, um damit möglichst große Stichproben zu berechnen. Damit tendiert der Fehler der statistischen Berechnungen gegen Null:

  • Approximation der "Antwortfläche" wird für jede Output-Größe individuell konfiguriert (im Beispiel für die fünf Restriktionsgrößen). Wir nutzen für alle drei Größen vorläufig einheitlich eine Polynomfunktion 2.Ordnung.
  • Virtueller Stichprobenumfang=1000000 ist auf einem modernen PC für Analysen ein sinnvoller Wert. Wir reduzieren diesen Wert jedoch um den Faktor 10, da ansonsten die .opy-Datei im Rahmen dieser Übung zu groß wird!
  • Verteilungsraster=50 beschreibt die Anzahl der Intervalle für die Berechnung der statistischen Ergebnisse (z.B. Anzahl der Balken in Histogrammen).