NWI-IBI008
Data Mining
Cursus informatieRooster
CursusNWI-IBI008
Studiepunten (ECTS)6
CategorieBA (Bachelor)
VoertaalEngels
Aangeboden doorRadboud Universiteit; Faculteit der Natuurwetenschappen, Wiskunde en Informatica; Informatica en Informatiekunde;
Docenten
Docent
dr. ir. T. Claassen
Overige cursussen docent
Examinator
prof. dr. T.M. Heskes
Overige cursussen docent
Docent
prof. dr. T.M. Heskes
Overige cursussen docent
Coördinator
prof. dr. T.M. Heskes
Overige cursussen docent
Contactpersoon van de cursus
prof. dr. T.M. Heskes
Overige cursussen docent
Collegejaar2019
Periode
KW1-KW2  (02-09-2019 t/m 02-02-2020)
Aanvangsblok
KW1
Onderwijsvorm
voltijd
Opmerking-
Inschrijven via OSIRISJa
Inschrijven voor bijvakkersJa
VoorinschrijvingNee
WachtlijstNee
Plaatsingsprocedure-
Cursusdoelen
Aan het eind van de cursus kun je
  • bedenken en beargumenteren welk data mining algoritme geschikt voor welk probleem;
  • verschillende data mining algoritmen toepassen, analyseren en implementeren;
  • de kwaliteit van de verkregen oplossingen evalueren.
Inhoud
Hoe kunnen we systemen maken die kunnen leren? Of meer specifiek: hoe extraheren we relevante, interessante informatie uit "(big) data"? Je zult leren dat er verschillende algoritmen zijn, afhankelijk van de vraag die je wilt beantwoorden en van de eigenschappen van de data waar je mee moet werken. In een project zul je de algoritmen implementeren en/of testen op bestaande datasets.
Niveau

Voorkennis
Je
  • bent bekend met elementaire begrippen uit de kansrekening als kansen, kansverdelingen en verwachtingswaarden;
  • kunt eenvoudige berekeningen hiermee uitvoeren;
  • weet wat vectoren en matrices zijn;
  • kunt deze optellen en met elkaar vermenigvuldigen. Deze voorkennis komt aan de orde in de cursussen Calculus and Probability Theory en Matrix Calculation
  • Toetsinformatie
    De beoordeling wordt gebaseerd op een midterm tentamen (voor 35%), een eindterm tentamen (voor 35%) en een werkstuk (voor 30%). Huiswerkopdrachten zijn verplicht en moeten voldoende worden gemaakt. Hertentamen komt in de plaats van zowel midterm als eindterm tentamen en telt dan voor 70%.
    Bijzonderheden

    Onderwerpen
    We zullen verschillende problemen behandelen met bijbehorende algoritmen:

    • exploratieve data analyse (histograms, boxplots, principale componenten-analyse, multi-dimensionele schaling);
    • beschrijvende modellen (clustering, associatieanalyse, kansmodellen);
    • classificeren (beslisbomen, naive Bayes classificatoren, naaste buren-algoritme, neurale netwerken).

    Daarbij passeren verschillende basisprincipes de revue zoals (rekenen met) afstandsmaten, (Bayesiaanse) kansrekening, cross-validatie en bootstrapping.

    Toetsinformatie
    De beoordeling wordt gebaseerd op een midterm tentamen (voor 35%), een eindterm tentamen (voor 35%) en een werkstuk (voor 30%). Huiswerkopdrachten zijn verplicht en moeten voldoende worden gemaakt. Hertentamen komt in de plaats van zowel midterm als eindterm tentamen en telt dan voor 70%.

    Voorkennis
    Je

    • bent bekend met elementaire begrippen uit de kansrekening als kansen, kansverdelingen en verwachtingswaarden;
    • kunt eenvoudige berekeningen hiermee uitvoeren;
    • weet wat vectoren en matrices zijn;
    • kunt deze optellen en met elkaar vermenigvuldigen.

    Deze voorkennis komt aan de orde in de cursussen Calculus and Probability Theory en Matrix Calculation

    Aanbevolen materiaal
    Boek
    De cursus is oorspronkelijk gebaseerd op de eerste editie van het boek (welke ook te vinden is als pdf), maar neigt qua inhoud meer en meer naar de tweede editie. Van de tweede editie is echter nog niet bekend of deze al beschikbaar zal zijn.
    Titel:Introduction to Data Mining
    Auteur:Tan, Steinbach, (Karpatne, )and Kumar
    Uitgever:Pearson
    Druk:2

    Werkvormen
    Computerpracticum

    Cursusgebeurtenis

    Hoorcollege

    Zelfstudie

    Algemeen
    De theorie wordt behandeld in hoorcolleges. In de werkcolleges kun je werken aan de huiswerkopdrachten, met name het programmeren en toepassen van data mining algoritmen in Python. Verder praktische ervaring wordt opgedaan in een project, waar je zelf een data mining algoritmen toepast op een dataset.

    Toetsen
    Eindresultaat
    Weging1
    GelegenhedenBlok KW2, Blok KW3

    Digital Midterm
    Weging0
    ToetsvormDigitale toets met CIRRUS
    GelegenhedenBlok KW1

    Tentamen
    Weging0
    ToetsvormTentamen
    GelegenhedenBlok KW2, Blok KW3