NWI-IBC036
Big Data
Cursus informatieRooster
CursusNWI-IBC036
Studiepunten (ECTS)6
CategorieBA (Bachelor)
VoertaalEngels
Aangeboden doorRadboud Universiteit; Faculteit der Natuurwetenschappen, Wiskunde en Informatica; Informatica en Informatiekunde;
Docenten
Coördinator
prof. dr. ir. A.P. de Vries
Overige cursussen docent
Docent
prof. dr. ir. A.P. de Vries
Overige cursussen docent
Contactpersoon van de cursus
prof. dr. ir. A.P. de Vries
Overige cursussen docent
Collegejaar2017
Periode
KW3-KW4  (05-02-2018 t/m 02-09-2018)
Aanvangsblok
KW3
Onderwijsvorm
voltijd
Opmerking-
Inschrijven via OSIRISJa
Inschrijven voor bijvakkersJa
VoorinschrijvingNee
WachtlijstNee
Plaatsingsprocedure-
Cursusdoelen

Na het volgen van deze cursus kunnen de studenten

  • uitleggen hoe een data centrum is opgezet, en de uitdagingen van het programmeren op de schaal van een data centrum benoemen;
  • de architectuur van map-reduce en moderne varianten zoals Spark beschrijven en analyseren;
  • deze architectuur inzetten voor het oplossen van big data problematiek;
  • veelgebruikte algorithmen, data-structuren en implementatietechnieken analyseren en gebruiken.
Inhoud

Hoe programmeer je een data centrum in plaats van een enkele computer? Wil je weten hoe internetbedrijven als Amazon, Facebook, Google, Twitter en Yahoo hun oplossingen bouwen? In deze cursus maak je kennis met technieken om grote hoeveelheden data efficiënt te bewerken. We behandelen de motivatie voor big data, de redenen om big data problemen met grootschalige compute infrastructuur op te lossen, de benodigde algorithmiek, en de daarvoor ontwikkelde grootschalige software platforms.

Onderwerpen
Big data, large scale data engineering, access patterns, latency vs. throughput, distributed file systems, mapreduce / Hadoop, Spark, NOSQL, locality sensitive hashing, inverted files, sharding, streaming, replication, fault-tolerance.

Toetsinformatie
Via een schriftelijk tentamen (examinering in twee toetsen), praktische opdrachten, en een afsluitend project.

Voorkennis
Basiskennis programmeren (niveau van de propedeuse informatica).

Literatuur
Literatuur wordt beschikbaar gemaakt via Blackboard.

Werkvormen
• 32 uur begeleid individueel project werk
• 32 uur hoorcollege
• 104 uur zelfstudie

Toelichting werkvormen: De cursus is gericht op het versterken van praktische vaardigheden, waaronder het gebruik van Spark, github en Docker. Opdrachten bereiden de studenten voor op een eindproject waarin wordt gewerkt met een grote webcrawl (~150 TB) op het nationale Hadoop cluster van SurfSara.

Verplicht materiaal
Wordt nader bekendgemaakt
Literatuur wordt beschikbaar gemaakt via Blackboard.

Werkvormen
Cursus
AanwezigheidsplichtJa

Hoorcollege
AanwezigheidsplichtJa

Project
AanwezigheidsplichtJa

Zelfstudie

Algemeen
De cursus is gericht op het versterken van praktische vaardigheden, waaronder het gebruik van Spark, github en Docker. Opdrachten bereiden de studenten voor op een eindproject waarin wordt gewerkt met een grote webcrawl (~150 TB) op het nationale Hadoop cluster van SurfSara.

Toetsen
Tentamen
Weging1
GelegenhedenBlok KW4, Blok KW4