kNN: k Nearest Neighbor

model dat kijkt naar de ‘buren’ in ‘k’ om punt te classificeren als de meest voorkomende entiteit in k. Bij k=1: veel ruis = overfitted model Bij een te grote k worden alle punten geclassificeerd als de meest voorkomende entiteit, ongeacht de positie = underfitting; te generaliserend De k-Nearest Neighbor methode is gebaseerd op het […]

Support Vector Machines

Stoelt op het concept hyperplane 2D-stelsel: lijn 3D-stelsel: vlak MultiD-stelsel: hypervlak Minimaliseren van de ruis: Maximum Margin Hyperplane, leidt tot een model dat beter generaliseert. De vectoren uit de dataset die het hypervlak beschrijven zijn de support vectoren

Neurale Netwerken

Het modelleren van een zenuwcel begint bij de invoer: een verzameling van ingangen                            x = (x1, x2, x3, …, xn), met een wegingsfactor w = (w1, w2, w3, …, wn). Vervolgens het resultaat van de weging optellen:   En evalueren met de activatiefunctie:    Kunstmatige neurale netwerken kunnen zeker in complexe modellen lastig te doorgronden zijn, en […]

Logistieke Regressie

Bij logistieke regressie hebben we het over een dichotome uitkomst (ja/nee, 0/1, wel/niet etc) (Sigmoid functie, levert een waarde tussen 0 en 1)