
Guida Introduttiva agli Algoritmi di Clustering
Una guida introduttiva agli algoritmi di clustering: cosa sono, quali sono, perché sono importanti e come valutarli nel contesto dell'analisi dei dati e la data science
Una guida introduttiva agli algoritmi di clustering: cosa sono, quali sono, perché sono importanti e come valutarli nel contesto dell'analisi dei dati e la data science
Impara come usare la PCA in Python e Sklearn per trasformare un dataset multidimensionale in un numero arbitrario di dimensioni e visualizzare i dati ridotti con Matplotlib
Una guida su come approcciare le variabili categoriali presenti all'interno di un dataset ai fini del machine learning e data science
Il campionamento statistico è fondamentale per ottenere informazioni sulla popolazione di interesse in modo efficiente. In questo articolo, esploreremo il concetto di campionamento statistico, le sue tecniche più comuni e l'utilizzo del ricampionamento per stimare la precisione delle stime.
Un articolo che esplora le tecniche per identificare le anomalie (outlier detection) nei dataset. Scopri come utilizzare la visualizzazione dei dati, score z e tecniche di clustering per individuare valori anomali
Una guida alla data visualization e ai principi che la sorreggono. Visualizzare grafici efficaci e fare storytelling per migliorare le abilità di comunicazione visiva e presentazioni.
Recensione del manuale di data visualization Storytelling with Data di Cole Nussbaumer Knaflic, esperta di comunicazione visiva. Una lettura consigliata pienamente a tutti gli interessati di data viz.
C'è davvero differenza tra data science, data engineering e data analytics? L'intero processo end-to-end di raccolta, gestione e analisi del dato viene diviso secondo questi tre termini - propongo la mia interpretazione olistica dell'intero processo.
Una attività di feature engineering può essere molto utile per migliorare le performance di un modello predittivo. Questa però può peggiorare i nostri risultati se non teniamo a mente certi principi da evitare.