Les sites utiles pour étendre ses connaissances dans le domaine du datamining et des statistiques :
- R2C-conseil : quelques sites de référence pour en savoir plus sur le datamining et les statistiques
- R2C-solution : sites d'outils performants en datamining et en statistiques
- R2C-research : sites d'institutions pour la recherche et la formation
Quelques sites de référence pour en savoir plus sur le datamining et les statistiques :
- Aiaccess : ce site référencie un dictionnaire des mots clés des statistiques et du datamining
- kdnuggets : site anglophone incontournable pour s'informer des événements bimensuels sur le datamining. Il propose des Jobs essentiellement aux USA, des benchmarks d'utilisation des outils de statistiques et de datamining, liste les résultats des coupes du monde en datamining, regroupe les événements des communautés des réseaux de neurones, des réseaux bayésiens, des classifications et segmentations, des outils de visualisation, ...
- Decideo : journal du décisionnel
Sites d'outils performants en datamining et en statistiques :
- Open Source répendus : Weka qui est une vrai alternative aux logiciels du marché et R qui est un langage de programmation pour statisticiens et dataminer avec sa version S++ industrialisable qui intègre toutes les librairies des utilisateurs Open Source R.
- AMADEA et ALICE : l'ETL AMADEA est un outil de référence quant à ses capacités à traiter et maîtriser les processus de captation des informations, triturer l'information pour la mettre en condition rapide d'exploitation statistique et d'extraction de connaissance. ALICE est un arbre de décision riche en fonctionalité de reconnaissance de connaissances.
- Les petits logiciels bien utiles, en général inclus dans les logiciels du marché : Macro Statistique sous Excel pour des études non industrialisables ; C4.5, l'ancêtre de l'arbre de décision pour un clustering automatique et son petit rejeton See5 / C5.0
- SPAD : cet outil est une alternative pour construire et industrialiser des chaînes de traitements et de calculs complexes avec des modules standards de statistiques
- KXEN pour le scoring industrialisé
- Bayesia pour les réseaux bayésiens
- STATISTICA Data Miner : plate forme de composants statistiques
- Autres outils très répendus : SAS Enterprise Miner ; IBM intelligent miner ; SPSS
- Logiciel de tri : Syncsort : performance de tri sur très gros volume
Sites d'institutions pour la recherche et la formation :
- Société Française De Statistique : site proposant de nombreux liens et donne une étendue des recherches, des événements dans le monde des statistiques
- Site francophone de Stéphane Tufféry, spécialiste du datamining, ses livres et ses références

