Software: CAD - Tutorial - Optimierung - Probabilistik Sampling-Methode

Aus OptiYummy
Zur Navigation springenZur Suche springen

Statistische Versuchsplanung - Sampling Methode
Software CAD - Tutorial - Optimierung - Probabilistik Sampling OptVerfahren Simulation.gif

"Sample" ist der englische Begriff für eine Stichprobe. Bei der Sampling-Methode der probabilistischen Simulation wird die Stichprobe mit Zufallszahlen "erwürfelt":

  • Es existieren verschiedene Verfahren, wie man durch "Würfeln" Verteilungsdichten über die Streubreite der Parameter nachbilden kann.
  • Man spricht hierbei auch von Monte-Carlo-Verfahren. (Siehe: OptiY-Hilfe > Theoretische Grundlagen > Statistische Versuchsplanung > Sampling Verfahren).
  • Wir werden uns hier auf das Rechenzeit-optimale Verfahren des Latin Hypercube Sampling beschränken.

Wichtig: Man muss "Simulation" als Optimierungsverfahren wählen, damit nur eine Stichprobe berechnet wird! Anderenfalls würde jeder Optimierungsschritt aus einer kompletten Stichprobe bestehen, was sehr zeitaufwändig wird.

Versuchsplanung konfigurieren

Für sehr schnell rechnende Modelle (<1s) wäre es möglich, eine "erwürfelte" Stichprobe (Sampling Methode) direkt statistisch auszuwerten. Allerdings führen selbst einige 1000 Modellrechnungen hierbei noch zu unerwünscht hohen statistischen Fehlern:

  • In der Praxis lässt man den statistischen Fehler gegen Null konvergieren, indem man riesige "virtuelle" Stichproben (z.B. 1000000) anhand eines extrem schnellen Ersatzmodells berechnet.
  • Als Ersatzmodell benutzt man meist Polynom-Funktionen der Ordnung O.
  • Der verbleibende Fehler der probabilistischen Simulation resultiert nur aus einer unzureichenden Abbildung der originalen Übertragungsfunktion zwischen Input- und Output-Größen auf das Ersatzmodell.

Latin Hypercube Sampling erreicht im Vergleich zum klassischen Monte Carlo Sampling mit bedeutend kleinerem Stichprobenumfang eine "saubere" Verteilungsfunktion:

  • Die gesamte Toleranzbreite eines streuenden Parameters wird dazu in Teilintervalle zerlegt.
  • Jedes Teilintervall wird danach entsprechend der gegebenen Verteilungsfunktion mit Zufallszahlen gefüllt.

Das gewählte Verfahren wird sowohl für die Berechnung der realen Stichprobe, als auch für die anschließenden statistischen Berechnungen anhand der virtuellen Stichprobe benutzt:

.

Reale Stichprobe:

  • Die minimal erforderliche Anzahl der Modellberechnungen M (=Stichprobenumfang) ergibt sich aus der Anzahl n der Streuungen und der gewählten Ordnung O der Polynom-Funktion zu M=(n²-n)/2+O*n+1.
  • Mit unseren n=3 Streuungen wären für eine Polynom-Funktion 2.Ordnung nur 10 Modellberechnungen innerhalb des Streubereiches erforderlich:
    • Diese minimale Anzahl gilt nur, wenn die Übertragungsfunktion innerhalb des Streubereiches durch die Polynom-Funktion exakt nachgebildet wird.
    • Für praktische Probleme ist keine exakte, sondern nur eine hinreichend genaue Ersatzfunktion realisierbar.
    • Deshalb sollte man zumindest für Toleranzanalysen, welche auf der Berechnung nur einer Stichprobe basieren, den Stichprobenumfang möglichst groß wählen.
    • Die Polynom-Funktion wird dann nach einer Ausgleichsrechnung möglichst gut an die berechneten Stützstellen angepasst.
  • Im Beispiel ist ein Stichprobenumfang=100 ein guter Kompromiss zwischen Rechenzeit und Genauigkeit. Außerdem bietet dieser Stichprobenumfang genügend Reserven, um nachträglich auch Polynom-Funktionen höherer Ordnung als Ersatz-Modell zu testen.
  • Adaptives Design ermöglicht eine automatische Ermittlung der erforderlichen Stützstellen für die reale Stichprobe. Diese Funktion werden wir in dieser Übung nicht nutzen.

Virtuelle Stichprobe:

Das auf Basis der realen Stichprobe gebildete Ersatzmodell (Polynom-Funktion) wird genutzt, um damit möglichst große Stichproben zu berechnen. Damit tendiert der Fehler der statistischen Berechnungen gegen Null:

  • Virtuellen Stichprobenumfang=1000000 ist auf einem modernen PC ein sinnvoller Wert. Sollte es aufgrund schwacher PC-Hardware Probleme mit der Rechenzeit geben, reduzieren wir den Wert z.B. um den Faktor 10.
  • Verteilungspunkte=50 beschreibt die Anzahl der Intervalle für die Berechnung der statistischen Ergebnisse (z.B. Anzahl der Balken in Histogrammen).
  • Zufallsgenerator=Zeitabhängig Initialisiert bedeutet, dass für jede Stichprobe ein anderer Startwert benutzt wird. Insbesondere bei zu kleinen realen Stichproben können sich damit die statistischen Ergebnisse merklich unterscheiden.
Der Entwurf des Scriptes wird hier bald fortgesetzt!