Question: Du erh ltst: A ) 4 Training - Datens tze B ) einen Test - Datensatz C ) einen Datensatz, der 5 0 ideale Funktionen

Du erhltst:
A)4 Training-Datenstze
B) einen Test-Datensatz
C) einen Datensatz, der 50 ideale Funktionen beschreibt
Alle Daten bestehen aus x-y-Paaren. Die Struktur in den CSV-Files ist wie folgt:
x y
X1 Y1
......
Xn Yn
Deine Aufgabe ist, ein Python Programm zu schreiben, welches mittels der vier Trainingsdatenstze (A) die vier
besten Passungen / Fits aus dem Datensatz von 50 idealen Funktionen (C) findet. Die folgenden Kriterien sollen
beachtet werden:
1. Das Kriterium zur Selektion idealer Funktionen fr den Training-Datensatz ist die Minimierung der
Summe aller quadratischen y-Abweichungen (Least-Square).
2. Dein Programm muss den Test-Datensatz B zur Validierung der Selektion benutzen. Hierbei soll fr jedes
x-y-Paar im Test-Datensatz berprft werden, ob die Werte zu den vier idealen Funktionen passen.
a. Benutze ein Kriterium, welches sicherstellt, dass die maximale Abweichung zwischen der vorher
ermittelten idealen Funktion und den Testwerten nicht die maximale Abweichung zwischen den
Trainingsdaten (A) und den vier idealen Funktionen aus (C) um mehr als den Faktor Wurzel aus
zwei (sqrt(2))bersteigt.
b. Sollten die Testdaten an die von Dir gefundenen vier Funktionen anpassbar sein, speichere fr
jeden Testdatensatz die entsprechenden Abweichungen ab.
3. Alle Daten sollten logisch visualisiert werden.
4. Schreibe Unit-Tests, wo immer mglich.
Um Deine im Kurs erlernten Fhigkeiten unter Beweis zu stellen, musst Du die im folgenden Kapitel (Details)
dargestellten Kriterien erfllen.
1.2. Details
Datenbank und Tabellen
Du erhltst vier Trainingsdatenstze in Form von CSV-Dateien. Dein Python-Programm muss in der Lage
sein, eine SQLite-Datenbank (Datei) idealerweise ber sqlalchemy unabhngig zu kompilieren und die
Trainingsdaten in eine einzelne, fnfspaltige Tabelle zu laden. Die erste Spalte zeigt die x-Werte aller
Seite 3 von 4
PRFUNGSAMT
IU.DE
Funktionen. Tabelle 1 am Ende dieses Unterabschnitts zeigt Dir, welche Struktur Deine Tabelle
voraussichtlich haben wird.
Die fnfzig idealen Funktionen, die auch ber eine CSV-Datei bereitgestellt werden, mssen in eine
andere Tabelle geladen werden. Ebenso zeigt die erste Spalte die x-Werte, was bedeutet, dass
insgesamt 51 Spalten vorhanden sind. Tabelle 2 am Ende dieses Unterabschnitts beschreibt
schematisch, welche Struktur erwartet wird.
Nachdem die Trainingsdaten und die idealen Funktionen in die Datenbank geladen wurden, mssen die
Testdaten (B) Zeile fr Zeile aus einer anderen CSV-Datei geladen und - wenn sie das Kriterium im
Unterabschnitt 2 erfllt - mit einer der vier abgeglichen Funktionen abgespeichert werden.
Anschlieend mssen die Ergebnisse in einer anderen vierspaltigen Tabelle in der SQLite-Datenbank
gespeichert werden. Gem Tabelle 3 am Ende dieses Unterabschnitts enthlt diese Tabelle vier
Spalten mit x- und y-Werten sowie die entsprechend gewhlte ideale Funktion und die damit
verbundene Abweichung.
Schlielich werden die Trainingsdaten, die Testdaten, die gewhlten Idealfunktionen sowie die
entsprechenden / zugewiesenen Datenstze unter einer entsprechend gewhlten Darstellung der
Abweichung visualisiert.
Struktur des Python Programms
Das Programm soll soweit wie mglich Objekt-orientiert sein.
Es soll mindestens eine Vererbungshierarchie (inheritance) haben.
Benutze sowohl Standard als auch user-definiertes Exception Handling.
Fr die Programmlogik solltest Du Pandas benutzen, aber auch Visualisierung mittels Bokeh, matlibplot
etc.
Schreibe Unit-Tests, wo immer es sich anbietet.
Dokumentiere Dein Programm vollstndig und mache von docstrings Gebrauch.
Verwendung von Git
Bitte verwende Git zur Versionskontrolle Deines Codes

Step by Step Solution

There are 3 Steps involved in it

1 Expert Approved Answer
Step: 1 Unlock blur-text-image
Question Has Been Solved by an Expert!

Get step-by-step solutions from verified subject matter experts

Step: 2 Unlock
Step: 3 Unlock

Students Have Also Explored These Related Programming Questions!