efinf:blcks2017:bigdatab:start

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
efinf:blcks2017:bigdatab:start [2018/03/06 12:19]
Simon Knaus
efinf:blcks2017:bigdatab:start [2018/03/08 07:54] (current)
Simon Knaus
Line 593: Line 593:
  
 === Ziele === === Ziele ===
 +  * Jeder kann die zentralen Begriffen erklären / beschreiben (->{{efinf:blcks2017:bigdatab:slides20180306.pdf|Slides}})
   * kNN mit Python und Scikit durchführen   * kNN mit Python und Scikit durchführen
-  * Jeder kann die zentralen Begriffen erklären / beschreiben (->Slides)+  * Eigene Ziffer als GIF klassifizieren oder Random Forests durchführen
  
 +=== Aufträge ===
 +  * Bei installiertem Python 2.7. die notwendigen Module installieren (siehe [[#Zusatzhintergrund Python]])
 +  * kNN in Python durchführen, siehe [[#kNN in Python|knn_scikit.py]]
 +  * Wer soweit durch:
 +    * Eigene Ziffer als GIF klassifizieren mit der Funktion ''getPixelArrayFromFilePath(filepath)''
 +    * Random Forests durchführen und Klassifikationsgüte mit kNN vergleichen
 +    * kNN für verschiedene ''$k$'' und Random Forests für verschieden ''n_estimators'' durchführen. Beides sind sogenannte "Tunig-Parameter", welche die Klassifikationsgüte beinflussen. Frage: Wie könnte ein optimales $k$ bestimmt werden?
  
  
Line 613: Line 621:
 </code> </code>
  
-Ein wichtiges Konstrukt sind sogenannte numpy-Arrays: Diese sind grundsätzlich der Python (geschachtelten) Liste sehr ähnlich, sind aber im Umang viel praktischer. Mehr Details gibt's z.B. [[http://www.scipy-lectures.org/intro/numpy/array_object.html|hier]] und [[[[https://docs.scipy.org/doc/numpy-1.13.0/reference/arrays.indexing.html|hier]]. Das wichtigste dabei ist wohl, wie auf Elemente zugegriffen werden kann und wie Teilmengen von diesen gebildet werden können:+Ein wichtiges Konstrukt sind sogenannte numpy-Arrays: Diese sind grundsätzlich der Python (geschachtelten) Liste sehr ähnlich, sind aber im Umang viel praktischer. Mehr Details gibt's z.B. [[http://www.scipy-lectures.org/intro/numpy/array_object.html|hier]] und [[https://docs.scipy.org/doc/numpy-1.13.0/reference/arrays.indexing.html|hier]]. Das wichtigste dabei ist wohl, wie auf Elemente zugegriffen werden kann und wie Teilmengen von diesen gebildet werden können:
  
 <code python> <code python>
Line 625: Line 633:
 trainingsdata[0,:] # alle Werte inkl. Zahl des ersten Bildes. trainingsdata[0,:] # alle Werte inkl. Zahl des ersten Bildes.
 </code> </code>
 +=== kNN in Python === 
 Nachher kann relativ einfach mit Python kNN implementiert werden: Nachher kann relativ einfach mit Python kNN implementiert werden:
 <code python knn_scikit.py> <code python knn_scikit.py>
Line 631: Line 639:
 # -*- coding: utf-8 -*- # -*- coding: utf-8 -*-
 from sklearn.neighbors import KNeighborsClassifier from sklearn.neighbors import KNeighborsClassifier
 +from sklearn.metrics import confusion_matrix
 from numpy import genfromtxt,asarray  from numpy import genfromtxt,asarray 
 from imageio import imread from imageio import imread
Line 948: Line 957:
 print "Guete rf:", guete_rf print "Guete rf:", guete_rf
 </code> </code>
-<!--+
 ==== L8 ====  ==== L8 ==== 
 Prüfung und ANN Prüfung und ANN
Line 954: Line 963:
  
 === Evaluation === === Evaluation ===
-  * {{efinf:blcks2017:bigdata:exam.zip|Daten für die Prüfung}}. Die Daten sind im üblichen Format. Anstelle der Ziffer steht an der letzten Stelle eine '-99'.+  * {{efinf:blcks2017:bigdatab:exam.zip|Daten für die Prüfung}}. Die Daten sind im üblichen Format. Anstelle der Ziffer steht an der letzten Stelle eine '-99'.
   * [[https://forms.office.com/Pages/ResponsePage.aspx?id=vUGvXYwzEUOxsOEpmInDS12XSwf-80xHjgGMQjpEmz9UMzhYQTZIRTdSS0hRTVpPVlJUNzJOQzU3My4u|Formular zur Abgabe der Testcases]]   * [[https://forms.office.com/Pages/ResponsePage.aspx?id=vUGvXYwzEUOxsOEpmInDS12XSwf-80xHjgGMQjpEmz9UMzhYQTZIRTdSS0hRTVpPVlJUNzJOQzU3My4u|Formular zur Abgabe der Testcases]]
  
Line 964: Line 973:
 === Feedback === === Feedback ===
 https://forms.office.com/Pages/ResponsePage.aspx?id=vUGvXYwzEUOxsOEpmInDS12XSwf-80xHjgGMQjpEmz9UQzJGV1gxMkFHRFJVNDdWWkc4RDMwU1Q4Mi4u https://forms.office.com/Pages/ResponsePage.aspx?id=vUGvXYwzEUOxsOEpmInDS12XSwf-80xHjgGMQjpEmz9UQzJGV1gxMkFHRFJVNDdWWkc4RDMwU1Q4Mi4u
--->+
  • efinf/blcks2017/bigdatab/start.1520335171.txt.gz
  • Last modified: 2018/03/06 12:19
  • by Simon Knaus