DIKW opleiding tot  Certified Data Science Professional

Opleiding Certified Data Science Professional

waardering-ster-8-7.png

Met deze data science opleiding doe je praktische  kennis en kunde op voor het data science tijdperk van morgen.

Waarom kies je voor DIKW?

Bij DIKW Academy werken docenten met jarenlange praktijk ervaring in het vakgebied van datascience. Onze docenten werken dagelijks in de praktijk aan uitdagende datascience projecten bij onze belangrijke klanten.

Waarom CDSP ?

Wat  maakt CDSP een unieke datascience opleiding? Deze opleiding bestaat al meer dan vijf jaar, er zijn al 200+ mensen u voorgegaan. De waardering is met 8.7 uitmuntend te noemen ! Het succes van deze opleiding is de praktijk case daar kunnen we helder over zijn.

Een belangrijk onderdeel is de praktijkopdracht, de laatste 6 weken ga je onder begeleiding van de ervaren DIKW coaches je eigen data science project vormgeven. Je zult niet de eerste zijn die hiermee een daverende businesscase voor de investering in deze cursus realiseert!

De praktijkopdracht kun je als businesscase gebruiken naar je leidinggevende  voor de investering in deze opleiding!

Samenvatting

De opleiding bestaat uit presentaties, cursus materiaal, interactieve notebooks, voorbeelden en opdrachten. Je krijgt een introductie in de concepten en algoritmes aan de hand van een korte presentatie. Daarna wordt aan de hand van een concreet voorbeeldscript in R getoond hoe het werkt. We maken gebruik van de de-facto standaard tools voor datascience R, RStudio en Anaconda in python.  Alle voorbeelden en het cursusmateriaal zijn direct bruikbaar, ook na de cursus een waardevolle asset als ‘snel starter’ voor je nieuwe data science projecten! Een onmisbare toolbox voor een snelle start van je project bij elke klant of in elk project

Investering : Deze opleiding wordt aangeboden voor €6.600,- ex BTW (Alumni van DIKW Academy krijgen 10% korting op vervolg trainingen.)

Cursusduur : De cursus duurt 12 weken, 1 dag per week (van 9.30 – 17.00 uur) en wordt op elke woensdag van de week gegeven.

Locatie : De locatie waar de cursus gegeven wordt, is het opleidingscentrum van DIKW Academy, Wattbaan 1 te Nieuwegein.

Heb je vragen over deze opleiding?

Maak een bel afspraak met één van onze docenten!

Introductie

DIKW Academy, een hoog waardig opleiding instituut heeft sinds 2012, als eerste in Nederland, een volwaardig en uniek gecertificeerd programma ontwikkeld voor de nieuwe generatie data-gedreven professionals.

We leven in de tijd van algoritmes, Artificial Intelligence en machine learning. Het datascience landschap is enorm in beweging. Door een modulaire opbouw van het curriculum kunnen wij het programma optimaal afstemmen op nieuwe trends en ontwikkelingen.  Deze opleiding is opgebouwd rond modules, iedere module levert een stuk theoretische achtergrond en een werkend stuk code waarmee je ook na de opleiding een jump-start kunt maken op dat specifieke datascience thema.

In de onderstaande "metro-kaart" zien we het datascience landschap dat als uitgangspunt dient voor de opbouw van deze training:

data science metro map ( copyright http://nirvacana.com/thoughts/ )

( credits go to http://nirvacana.com/thoughts/ )

Leerdoelstelling

In DIKW's visie zullen succesvolle organisaties van de toekomst  transformeren naar een meer en meer data-gedreven organisatie. Hierin speelt het analyseren en toepassen van algoritmes en statistiek een steeds belangrijkere rol.

Datascience is een breed vakgebied en omvat veel verschillende concepten, tools en technologie. Om je dit vakgebied eigen te maken zul je moeten investering in een programmeertaal waarmee je algoritmes kunt gaan toepassen op je data.

Deze opleiding zorgt voor een brede basis in het vakgebied. Je bent natuurlijk niet gelijk een doorgewinterde specialist maar de certificering garandeert een gedegen kennis van de huidige stand van zaken zoals je dat van DIKW Academy verwacht.

Na 12 weken zul je bewust zijn van de (on) mogelijkheden van het vakgebied en ben je "bewust onbekwaam", je weet waar de valkuilen zitten en je kunt zelfstandig aan de slag.

Programma

Week 1: Introductie

Het hele programma wordt kort doorgelopen, zodat je weet wat je kunt verwachten. We duiken zo snel mogelijk in de wereld van R met R-Studio. We behandelen de basis data bewerkingen in R en maken een start met uni-variate analyses in R. Je raakt bekend met de standaard aanpak voor datascience CRISP-DM. 

Week 2: Meetwaarden, data munging en introductie python

We starten met een wetenschappelijk artikel van Stevens uit 1946 over meetwaarden en schalen. Daarna maken we kennis met data munging aan de hand van het package dplyr. Als laatste maken we kennis met het Anaconda platform voor datascience in python.

Week 3: Introductie machinelearning , de classificatie taak en de kracht van de bootstrap.

We geven een overzicht van het machine-learning landschap en gaan aan de slag met de classificatie taak. Ook maken we kennis met de kracht van sampling technieken, permutaties en bootstraps.

Week 4: Visualisatie, clustering en matrix algebra

We maken kennis met de ‘Grammar of Graphics‘ in het package ggplot en bouwen een geavanceerde visualisatie stap voor stap op. In de tweede module laten we de kracht van matrix algebra zien en maken we onze eigen robuuste clustering. We sluiten af met een overzicht van segmenterings- en clusteringtechnieken.

Week 5: BIG Databases en Analytics

Wat is BIG data? Welke database opties heb ik? Document stores, tuple & triple stores, columnar databases. NoSQL XML databases. Distributed filesystems , Apache HADOOP ecosysteem. Na deze dag weet je hoe de wereld van de big data eruit ziet en ben je in staat een keuze te maken voor een van deze systemen bij de start van een big data project. Daarnaast meer wiskunde met toepassingen van matrix decompositie in feature reductie en factor analyse.

Week 6: Advanced Machine Learning en Social Network Analysis

Ensemble learning, bagging, boosting en random forests staan op het programma. Ook kijken we in detail naar model kwaliteit en de verschillende maten om kwaliteit te meten. We sluiten af met social network analyse door live een twitter feed te analyseren.

Week 7: Semantics, Textmining en Natural Language Processing

Deze dag staat in het teken van tekst en search. Met python Natural Language Tool Kit (NLTK) onderzoeken we de mogelijkheden voor het analyseren van teksten. Feature extractie, tellen van woorden en woordcombinaties en het visualiseren van resultaten. Ook maken we kennis met open data en het semantic web , hierin heeft alle data context. We laten zien hoe we daar als datascientist gebruik van kunnen maken.

Week 8: Recommenders, tijdreeksen en survival analysis

Hoe bouw je een recommender algorithme in R? We gaan het gewoon doen!

Daarnaast staat deze dag in het teken van (het voorspellen van) tijdreeksen en survival analyses. Je raakt bekend met de aanpak voor het forecasten van tijdreeksen op basis van het forecast package van Rob Hyndman.

Week 9: Opdracht data verzamelen – opdracht data bewerken

In overleg stellen we een opdracht samen per cursist, eventueel in team verband wordt er gewerkt aan een opdracht, een belangrijk onderdeel van de certificering als data scientist. De deelnemers hebben deze dag de tijd onder begeleiding aan de opdracht te werken.

Week 10: Opdracht analyseren & presenteren

Een kort oefenexamen wordt afgenomen als voorbereiding op het examen over theorie en statistiek. De deelnemers hebben deze dag de tijd onder begeleiding aan de opdracht te werken.

Week 11: Examen

Het examen bestaat uit een aantal(50) multiple choice vragen(2 uur) en twee korte programmeer opdrachten (per opdracht 1 uur de tijd), een in python en een in R. Samen met de opdracht vormt dit examen de basis voor de certificering. Tevens is er ruimte om de laatste hand te leggen aan de eindpresentatie voor de opdracht.

Week 12: Voordracht & Borrel

Het resultaat van de opdracht wordt gepresenteerd in een voordracht van max 20 minuten. De presentatie is voor de andere cursus deelnemers en de examen commissie. De presentatie wordt beoordeeld op analytische diepgang en de commerciële businesscase. Na een evaluatie van de training door de cursisten en de beoordeling van de presentaties gaan we over tot de feestelijke uitreiking van de certificaten Certified data Science Professional !!!




Nu je al zo ver gekomen bent kun je je natuurlijk direct inschrijven met de oranje knop , mocht je nog niet zo ver zijn dan willen we je vragen ons van feedback te voorzien door 4 korte vraagjes te beantwoorden via de blauwe knop.


Bas Beekmans Phd

Bas Beekmans Phd

Data Science Consultant…

Lees meer