Question: Du erh ltst: A ) 4 Training - Datens tze B ) einen Test - Datensatz C ) einen Datensatz, der 5 0 ideale Funktionen
Du erhltst:
A TrainingDatenstze
B einen TestDatensatz
C einen Datensatz, der ideale Funktionen beschreibt
Alle Daten bestehen aus xyPaaren. Die Struktur in den CSVFiles ist wie folgt:
x y
X Y
Xn Yn
Deine Aufgabe ist, ein Python Programm zu schreiben, welches mittels der vier Trainingsdatenstze A die vier
besten Passungen Fits aus dem Datensatz von idealen Funktionen C findet. Die folgenden Kriterien sollen
beachtet werden:
Das Kriterium zur Selektion idealer Funktionen fr den TrainingDatensatz ist die Minimierung der
Summe aller quadratischen yAbweichungen LeastSquare
Dein Programm muss den TestDatensatz B zur Validierung der Selektion benutzen. Hierbei soll fr jedes
xyPaar im TestDatensatz berprft werden, ob die Werte zu den vier idealen Funktionen passen.
a Benutze ein Kriterium, welches sicherstellt, dass die maximale Abweichung zwischen der vorher
ermittelten idealen Funktion und den Testwerten nicht die maximale Abweichung zwischen den
Trainingsdaten A und den vier idealen Funktionen aus C um mehr als den Faktor Wurzel aus
zwei sqrtbersteigt
b Sollten die Testdaten an die von Dir gefundenen vier Funktionen anpassbar sein, speichere fr
jeden Testdatensatz die entsprechenden Abweichungen ab
Alle Daten sollten logisch visualisiert werden.
Schreibe UnitTests, wo immer mglich
Um Deine im Kurs erlernten Fhigkeiten unter Beweis zu stellen, musst Du die im folgenden Kapitel Details
dargestellten Kriterien erfllen
Details
Datenbank und Tabellen
Du erhltst vier Trainingsdatenstze in Form von CSVDateien. Dein PythonProgramm muss in der Lage
sein, eine SQLiteDatenbank Datei idealerweise ber sqlalchemy unabhngig zu kompilieren und die
Trainingsdaten in eine einzelne, fnfspaltige Tabelle zu laden. Die erste Spalte zeigt die xWerte aller
Seite von
PRFUNGSAMT
IUDE
Funktionen. Tabelle am Ende dieses Unterabschnitts zeigt Dir, welche Struktur Deine Tabelle
voraussichtlich haben wird.
Die fnfzig idealen Funktionen, die auch ber eine CSVDatei bereitgestellt werden, mssen in eine
andere Tabelle geladen werden. Ebenso zeigt die erste Spalte die xWerte, was bedeutet, dass
insgesamt Spalten vorhanden sind Tabelle am Ende dieses Unterabschnitts beschreibt
schematisch, welche Struktur erwartet wird.
Nachdem die Trainingsdaten und die idealen Funktionen in die Datenbank geladen wurden, mssen die
Testdaten B Zeile fr Zeile aus einer anderen CSVDatei geladen und wenn sie das Kriterium im
Unterabschnitt erfllt mit einer der vier abgeglichen Funktionen abgespeichert werden.
Anschlieend mssen die Ergebnisse in einer anderen vierspaltigen Tabelle in der SQLiteDatenbank
gespeichert werden. Gem Tabelle am Ende dieses Unterabschnitts enthlt diese Tabelle vier
Spalten mit x und yWerten sowie die entsprechend gewhlte ideale Funktion und die damit
verbundene Abweichung.
Schlielich werden die Trainingsdaten, die Testdaten, die gewhlten Idealfunktionen sowie die
entsprechenden zugewiesenen Datenstze unter einer entsprechend gewhlten Darstellung der
Abweichung visualisiert.
Struktur des Python Programms
Das Programm soll soweit wie mglich Objektorientiert sein.
Es soll mindestens eine Vererbungshierarchie inheritance haben.
Benutze sowohl Standard als auch userdefiniertes Exception Handling.
Fr die Programmlogik solltest Du Pandas benutzen, aber auch Visualisierung mittels Bokeh, matlibplot
etc.
Schreibe UnitTests, wo immer es sich anbietet.
Dokumentiere Dein Programm vollstndig und mache von docstrings Gebrauch.
Verwendung von Git
Bitte verwende Git zur Versionskontrolle Deines Codes
Step by Step Solution
There are 3 Steps involved in it
1 Expert Approved Answer
Step: 1 Unlock
Question Has Been Solved by an Expert!
Get step-by-step solutions from verified subject matter experts
Step: 2 Unlock
Step: 3 Unlock
