Introductie
De data science opleiding bestaat uit presentaties, cursusmateriaal, interactieve notebooks, voorbeelden en opdrachten. Je krijgt een introductie in de concepten en algoritmes aan de hand van een korte presentatie. Daarna wordt aan de hand van een concreet voorbeeld script in python getoond hoe het werkt. We maken gebruik van de de-facto standaard tools voor data science: Python , Jupyter Notebooks en Anaconda in Python. Alle voorbeelden en het cursusmateriaal zijn direct bruikbaar. Ook na de cursus is al het materiaal een waardevolle asset voor je nieuwe data science projecten! Een onmisbare tool box voor een snelle start van je project bij elke klant of in elk project.
Waarom CDSP?
Wat maakt CDSP een unieke data science opleiding? Deze opleiding bestaat al sinds 2012. Er er zijn al meer dan 200 mensen je voorgegaan. De cursus wordt door de studenten altijd als “zeer goed” gewaardeerd! Het succes van deze opleiding is de eindpresentatie van de case van de cursus waarin alles samenkomt.
Een belangrijk onderdeel is de praktijkopdracht . De laatste weken ga je onder begeleiding van de ervaren DIKW docenten je eigen data science project vormgeven. Je zult niet de eerste zijn die hiermee een daverende businesscase voor de investering in deze cursus realiseert!
De praktijkopdracht kun je als businesscase gebruiken naar je leidinggevende voor de investering in deze opleiding!
Waarom kiezen voor DIKW Academy?
Bij DIKW Academy werken docenten met jarenlange praktijkervaring in het vakgebied van data science. Onze docenten werken dagelijks in de praktijk aan uitdagende data science projecten bij onze belangrijke klanten.
In DIKW's visie zullen succesvolle organisaties van de toekomst transformeren naar een meer en meer data gedreven organisatie. Hierin speelt het analyseren en toepassen van algoritmes en statistiek een steeds belangrijkere rol.
Data science is een breed vakgebied en omvat veel verschillende concepten, tools en technologie. Om je dit vakgebied eigen te maken zul je moeten investeren in een programmeertaal waarmee je algoritmes kunt gaan toepassen op je data.
Deze opleiding zorgt voor een brede basis in het vakgebied. Je bent natuurlijk niet gelijk een doorgewinterde specialist maar de certificering garandeert een gedegen kennis van de huidige stand van zaken zoals je dat van DIKW Academy verwacht.
DIKW Academy, een hoogwaardig opleidingsinstituut, heeft sinds 2012 als eerste in Nederland een volwaardig en uniek gecertificeerd programma ontwikkeld voor de nieuwe generatie data gedreven professionals.
We leven in de tijd van algoritmes, artificial intelligence en machine learning. Het data science landschap is enorm in beweging. Door een modulaire opbouw van het curriculum kunnen wij het programma optimaal afstemmen op nieuwe trends en ontwikkelingen. Deze opleiding is opgebouwd rond modules. Iedere module levert een stuk theoretische achtergrond en een werkend stuk code waarmee je ook na de opleiding een vliegende start kunt maken op dat specifieke data science thema.
In de onderstaande "metro-kaart" zien we het data science landschap dat als uitgangspunt dient voor de opbouw van deze opleiding:
(credits go to http://nirvacana.com/thoughts/ )
Inhoud
Leerdoelstelling
In de visie van DIKW zullen succesvolle organisaties van de toekomst transformeren naar een meer en meer data gedreven organisatie. Hierin speelt het analyseren en toepassen van algoritmes en statistiek een steeds belangrijkere rol.
Data science is een breed vakgebied en omvat veel verschillende concepten, tools en technologie. Om je dit vakgebied eigen te maken zul je moeten investeren in een programmeertaal waarmee je algoritmes kunt gaan toepassen op je data.
De opleiding data science zorgt voor een brede basis in het vakgebied. Je bent natuurlijk niet gelijk een doorgewinterde specialist maar de certificering garandeert een gedegen kennis van de huidige stand van zaken zoals je dat van DIKW Academy mag verwachten.
Na 12 weken zul je bewust zijn van de (on) mogelijkheden van het vakgebied en ben je "bewust onbekwaam", je weet waar de valkuilen zitten en je kunt zelfstandig aan de slag.
Programma
Week 1: Introductie
Het hele programma wordt kort doorgelopen, zodat je weet wat je kunt verwachten. We duiken zo snel mogelijk in de wereld van Python. We behandelen de basis data bewerkingen in Python en maken een start met uni-variate analyses. Je raakt bekend met de standaard aanpak voor data science CRISP-DM.
Week 2: Meetwaarden, data munging en introductie python
We starten met een wetenschappelijk artikel van Stevens uit 1946 over meetwaarden en schalen. Daarna maken we kennis met data munging aan de hand van de mogelijkheden van pandas . Als laatste maken we kennis met het Anaconda platform voor data science in Python.
Week 3: Introductie machine learning, de classificatie taak en de kracht van de bootstrap.
We geven een overzicht van het machine-learning landschap en gaan aan de slag met de classificatie taak. Ook maken we kennis met de kracht van sampling technieken, permutaties en bootstraps.
Week 4: Visualisatie, clustering en matrix algebra
We maken kennis met Stephan Few’s ideeen over “Storytelling with data”. Hoe zorg je ervoor dat je plaatje meer zegt dan 1000 woorden? De ‘Grammar of Graphics‘ in het package ggplot , plotly en Seaborn komen aan bod. We bouwen een geavanceerde visualisatie stap voor stap op. In de tweede module laten we de kracht van matrix algebra zien en maken we onze eigen robuuste clustering. We sluiten af met een overzicht van segmenterings- en clusteringtechnieken.
Week 5: Cloud analytics en data reductie technieken
“The Cloud” is iemand anders haar computer. Hoe kan ik data science en machine learning opzetten in de cloud? ? Welke database opties heb ik? Document stores, tuple & triple stores, columnar databases. NoSQL, XML databases. Distributed file systems, Apache HADOOP ecosysteem. Databricks Apache SPARK. Na deze dag weet je hoe de wereld van big data eruit ziet en ben je in staat een keuze te maken voor een van deze systemen bij de start van een big data project. Daarnaast krijg je meer wiskunde met toepassingen van matrix decompositie in feature reductie door middel van Principale Componenten Analyse en kijken we naar dimension reduction aan de hand van uniform manifold projectie en t-SNE .
Week 6: Advanced Machine Learning en Social Network Analysis
Ensemble learning, bagging, boosting en random forests staan op het programma. Ook kijken we in detail naar model kwaliteit en de verschillende maten om kwaliteit te meten. We sluiten af met social network analyse door live een twitter feed te analyseren.
Week 7: Textmining en Natural Language Processing
Deze dag staat in het teken van tekst en search. Met Python Natural Language Tool Kit (NLTK) onderzoeken we de mogelijkheden voor het analyseren van teksten. Feature extractie, tellen van woorden en woordcombinaties en het visualiseren van resultaten. Ook maken we kennis met open data en het semantic web, hierin heeft alle data context. We laten zien hoe we daar als data scientist gebruik van kunnen maken.
Week 8: Tijdreeksen en survival analysis
Deze dag in het teken van (het voorspellen van) tijdreeksen en survival analyses. Je raakt bekend met de aanpak voor het forecasten van tijdreeksen op basis van de forecasting principles van Rob Hyndman. We zullen de meest betrouwbare methoden voor het opstellen van voorspellingen van tijdreeksen onderzoeken. De nadruk zal liggen op methoden die reproduceerbaar en testbaar zijn, en waarvan is aangetoond dat zij werken.
Week 9: De data science business case en ethische aspecten van AI
Deze dag staat in het teken van de business case in data science. Hoe reken je een businesscase door waarbij een voorspelmodel ingezet wordt? Welke keuzes maak je om tot een optimaal resultaat te komen? Model kwaliteit speelt hier uiteraard een belangrijke rol bij maar we zullen ook goed moeten kijken naar de ethische aspecten van machine learning! Hoe identificeer je bias in je model? Welke methodes zijn er beschikbaar om te controleren dat je geen ongewenste effecten hebt getraind? Na deze dag kun je op verantwoorde wijze een ontwikkeld algoritme inzetten.
Week 10: Opdracht uitwerken met je coach
Een kort oefenexamen wordt afgenomen als voorbereiding op het examen over theorie en statistiek. Je hebt deze dag de tijd onder begeleiding aan de opdracht te werken.
Week 11: Examen
Het examen bestaat uit een 50 multiple choice vragen (2 uur) en een programmeeropdracht in Python. Samen met de opdracht vormt dit examen de basis voor de certificering. Tevens is er ruimte om de laatste hand te leggen aan de eindpresentatie voor de opdracht.
Week 12: Voordracht van jouw data science case & borrel
Het resultaat van de opdracht wordt gepresenteerd in een voordracht van maximaal 20 minuten. De presentatie wordt gegeven aan de andere cursus deelnemers en de examencommissie. De presentatie wordt beoordeeld op analytische diepgang en de commerciële businesscase. Na een evaluatie van de opleiding door de cursisten en de beoordeling van de presentaties gaan we over tot de feestelijke uitreiking van de certificaten Certified Data Science Professional.
Locatie
Leren en studeren in ons Academy lokaal in Nieuwegein is door de inrichting zeer prettig. Je bent van alle gemakken voorzien als aankomend data scientist. Koffie en fris is binnen handbereik en er wordt dagelijks gezorgd voor versnaperingen en een lunch of diner. In het direct aanpalende restaurant kun je een potje poolen of racen op onze Playseat ter ontspanning.
In het lokaal kun je op het grote scherm de presentatie goed volgen en alle uitleg die gegeven wordt op het elektronische whiteboard, kun je toegestuurd krijgen. Het lokaal is ruim opgezet waarbij het mogelijk blijft om genoeg interactie te hebben tussen de docent en de cursist.
Het is ook mogelijk om de lessen op afstand te volgen. Door middel van het cameravolgsysteem in het lokaal kun je meekijken vanuit huis en heb je dezelfde ervaring als wanneer je in het lokaal zit. Wanneer je je camera aanzet kunnen de docent en cursisten je ook zien en verhoog je de interactie met je medecursisten. Vanaf je werkplek thuis of op kantoor kan je gewoon meepraten met de andere cursisten in het lokaal.
Investering
Investering
De investering voor de gehele CDSP zijn EUR 6600,- (excl. BTW)
In de cursus zijn inbegrepen:
12 lesdagen op locatie of vanaf je werkplek
Lesmateriaal & studieboeken
Lunch of diner op de lesdagen
Koffie, thee, fris en versnaperingen tijdens de lesdagen
Fiscale aftrekbaarheid
Vanaf 1 januari 2022 zijn studiekosten niet meer aftrekbaar. In plaats hiervan komt het STAP-budget .
DIKW Alumni krijgen 10% korting.
Heb je al eens een opleiding, cursus of training bij ons gevolgd dan krijg je van ons 10% korting op de volgende cursus, training of opleiding.
Hiervoor dien je je wel aangemeld te zijn als DIKW Academy Alumni.
Ben je nog niet aangemeld?
Doe dat dan via deze link .
Aanmelden
Toelating
Er is geen specifieke voorkennis nodig. Het helpt natuurlijk wel als je al ervaring hebt met bepaalde onderdelen van de opleiding. Bij de Certified Data Science Professional (CDSP) is het bijvoorbeeld handig als je je kennis van beschrijvende en toetsende statistiek hebt opgefrist of als je al ervaring hebt in een scriptingtaal.
Aanmelden
Je kan je aanmelden door het formulier in te vullen.
Na je aanmelding:
Krijg je de bevestiging dat je ingeschreven bent
Je wordt geïnformeerd over het verder verloop van de aanloop naar de cursus
3 weken voor aanvang van de cursus krijg je alle informatie toegestuurd die je nodig hebt om aan de slag te gaan.
Routebeschrijving
De data van de de lesdagen (i.v.m. vakanties, etc.)
De studiewijzer
Carrière
Wat levert het je op?
Als gecertificeerd data scientist ben je klaargestoomd voor de toekomst. De opleiding CDSP z orgt voor een brede basis in het vakgebied. Je bent natuurlijk niet gelijk een doorgewinterde specialist maar de certificering garandeert een gedegen kennis van de huidige stand van zaken zoals je dat van DIKW Academy verwacht.
Door de eindopdracht die je uitvoert gedurende de cursus zorg je ervoor dat al het geleerde in de praktijk wordt gebracht en de kennis op zijn plek valt.
Je zult niet de eerste zijn die hiermee een daverende businesscase voor de investering in deze cursus realiseert!
Bekijk ook wat de gecertificeerde data scientist nu doet op onze Alumni pagina op Linkedin
FAQ
Q: Hoeveel werk-, studie- en contacturen zijn er?
A: We hebben opleidingen van een dag tot een half jaar. De studiebelasting is zo gekozen dat je de opleiding naast je werk kunt doen. Dat wil zeggen dat je naast de opleidingsdag/middag/ avond er vanuit moet gaan dat je nog een avond (3 uur) bezig bent met studeren, opdrachten, etc.
Q: Hoeveel tijd besteedt een cursist gemiddeld aan individueel werk en groepsopdrachten?
A: Veel van de opleidingen bij DIKW Academy zijn praktisch ingestoken. Dat wil zeggen dat je hands-on aan de bak moet. Tools installeren, dingen uitzoeken en aan de praat krijgen. Algorithms proberen, testen of dingen werken en of je snapt wat er gebeurt. Daarnaast is in veel opleidingen een praktijkcase die je als team of als individu uitvoert. Als je dat een beetje handig aanpakt zul je zien dat je die opdracht heel mooi kunt gebruiken om een eerste Minimal Viable Product (MVP) op het gebied van data science of data engineering kunt maken voor jouw opdrachtgever. Daarin willen mensen nogal eens erg enthousiast worden en er meer tijd in steken dan zo vooraf hadden gedacht. Maar wel met vaak een heel mooi resultaat.
Q: Op welke locatie worden de lessen gegeven?
A: DIKW Academy heeft een opleidingsruimte in Nieuwegein
Q: Bieden jullie ook online lessen aan?
A: Ja, we hebben een eigen video conferencing service (Jitsi) en een e-learning platform (Moodle) waar al het materiaal beschikbaar is.
Q: Wat voor voorkennis heb ik nodig?
A: Tenzij anders aangegeven bij de opleiding is er geen specifieke voorkennis nodig. Het helpt natuurlijk wel als je al ervaring hebt met bepaalde onderdelen van de opleiding. Bij de opleiding Certified Data Science Professional (CDSP) is het bijvoorbeeld handig als je je kennis van beschrijvende en toetsende statistiek hebt opgefrist of als je al ervaring hebt in een scriptingtaal. Ook voor CDSP is er echter geen specifieke voorkennis nodig, bij inschrijving ontvang je een document waarin staat hoe je je optimaal kan voorbereiden op de opleiding.
Q: Heb ik eigen data nodig om de praktijkopdracht uit te voeren?
A: Je hoeft geen eigen data te hebben om de praktijkopdracht uit te voeren. Ook met een dataset die online te vinden is kun je een mooie praktijkcase maken. De docent zal je begeleiden bij het zoeken naar een geschikte dataset.