Recommendation systems met association rules

Association rules maken het mogelijk om op een ongelabelde dataset onderlinge relaties tussen elementen te herkennen. Voor de set {A, B, C, D} kunt u een associatieregel herleiden wanneer de aanwezigheid van {A, B} sterk duidt naar de aanwezigheid van {C, D} De support van een set: Confidence: Zoals in het voorbeeld van de supermarkt: […]

Unsupervised Machine Learning – Clustering

Het is niet bekend hoeveel klassen er zijn, het doel is groeperen k-Means clustering Probeert een x-aantal clustermiddelpunten te herleiden, zodat de som van de afstand van de clusterleden tot het middelpunt van het cluster minimaal is. Waarbij vector x een observatie uit dataset Si is. Normalisatie min-max normalisatie z-Score normalisatie bijvoorbeeld: X=(112, 120, 152) […]

Anomaly Detection

Wordt gebruikt voor het identificeren van outliers; dit zijn datapunten die afwijken van de norm In sommige gevallen worden de outliers geëlimineerd uit de trainingset omdat deze een bias introduceren in het te herleiden model 1 methode is LOF, Local Outlier Factor, zie de DMwR bibliotheek