Both sides previous revision
Previous revision
Next revision
|
Previous revision
|
efinf:blcks2017:bigdatab:start [2018/03/06 12:26] Simon Knaus |
efinf:blcks2017:bigdatab:start [2018/03/08 07:54] (current) Simon Knaus |
zu=== Unterlagen & Daten === | === Unterlagen & Daten === |
* {{efinf:blcks2017:bigdatab:handout20181213.pdf|Slides Einführung}} und {{efinf:blcks2017:bigdatab:tigerjython_cheatsheet.pdf|Cheatsheet}} | * {{efinf:blcks2017:bigdatab:handout20181213.pdf|Slides Einführung}} und {{efinf:blcks2017:bigdatab:tigerjython_cheatsheet.pdf|Cheatsheet}} |
<!-- * Daten Punktewolke: {{efinf:blcks2017:bigdata:data.zip|Training}} und {{efinf:blcks2017:bigdata:testdata.zip|Test}} | <!-- * Daten Punktewolke: {{efinf:blcks2017:bigdata:data.zip|Training}} und {{efinf:blcks2017:bigdata:testdata.zip|Test}} |
| |
=== Ziele === | === Ziele === |
* Jeder kann die zentralen Begriffen erklären / beschreiben (->Slides) | * Jeder kann die zentralen Begriffen erklären / beschreiben (->{{efinf:blcks2017:bigdatab:slides20180306.pdf|Slides}}) |
* kNN mit Python und Scikit durchführen | * kNN mit Python und Scikit durchführen |
* Eigene Ziffer als GIF klassifizieren oder Random Forests durchführen | * Eigene Ziffer als GIF klassifizieren oder Random Forests durchführen |
</code> | </code> |
| |
Ein wichtiges Konstrukt sind sogenannte numpy-Arrays: Diese sind grundsätzlich der Python (geschachtelten) Liste sehr ähnlich, sind aber im Umang viel praktischer. Mehr Details gibt's z.B. [[http://www.scipy-lectures.org/intro/numpy/array_object.html|hier]] und [[[[https://docs.scipy.org/doc/numpy-1.13.0/reference/arrays.indexing.html|hier]]. Das wichtigste dabei ist wohl, wie auf Elemente zugegriffen werden kann und wie Teilmengen von diesen gebildet werden können: | Ein wichtiges Konstrukt sind sogenannte numpy-Arrays: Diese sind grundsätzlich der Python (geschachtelten) Liste sehr ähnlich, sind aber im Umang viel praktischer. Mehr Details gibt's z.B. [[http://www.scipy-lectures.org/intro/numpy/array_object.html|hier]] und [[https://docs.scipy.org/doc/numpy-1.13.0/reference/arrays.indexing.html|hier]]. Das wichtigste dabei ist wohl, wie auf Elemente zugegriffen werden kann und wie Teilmengen von diesen gebildet werden können: |
| |
<code python> | <code python> |
# -*- coding: utf-8 -*- | # -*- coding: utf-8 -*- |
from sklearn.neighbors import KNeighborsClassifier | from sklearn.neighbors import KNeighborsClassifier |
| from sklearn.metrics import confusion_matrix |
from numpy import genfromtxt,asarray | from numpy import genfromtxt,asarray |
from imageio import imread | from imageio import imread |
print "Guete rf:", guete_rf | print "Guete rf:", guete_rf |
</code> | </code> |
<!-- | |
==== L8 ==== | ==== L8 ==== |
Prüfung und ANN | Prüfung und ANN |
| |
=== Evaluation === | === Evaluation === |
* {{efinf:blcks2017:bigdata:exam.zip|Daten für die Prüfung}}. Die Daten sind im üblichen Format. Anstelle der Ziffer steht an der letzten Stelle eine '-99'. | * {{efinf:blcks2017:bigdatab:exam.zip|Daten für die Prüfung}}. Die Daten sind im üblichen Format. Anstelle der Ziffer steht an der letzten Stelle eine '-99'. |
* [[https://forms.office.com/Pages/ResponsePage.aspx?id=vUGvXYwzEUOxsOEpmInDS12XSwf-80xHjgGMQjpEmz9UMzhYQTZIRTdSS0hRTVpPVlJUNzJOQzU3My4u|Formular zur Abgabe der Testcases]] | * [[https://forms.office.com/Pages/ResponsePage.aspx?id=vUGvXYwzEUOxsOEpmInDS12XSwf-80xHjgGMQjpEmz9UMzhYQTZIRTdSS0hRTVpPVlJUNzJOQzU3My4u|Formular zur Abgabe der Testcases]] |
| |
=== Feedback === | === Feedback === |
https://forms.office.com/Pages/ResponsePage.aspx?id=vUGvXYwzEUOxsOEpmInDS12XSwf-80xHjgGMQjpEmz9UQzJGV1gxMkFHRFJVNDdWWkc4RDMwU1Q4Mi4u | https://forms.office.com/Pages/ResponsePage.aspx?id=vUGvXYwzEUOxsOEpmInDS12XSwf-80xHjgGMQjpEmz9UQzJGV1gxMkFHRFJVNDdWWkc4RDMwU1Q4Mi4u |
--> | |