Ouvrir le menu principal
correlogramme Portail de la Datascience et de la donnée
Data science.png

Ce portail vise à rassembler les articles autour de la donnée, de la datascience, des technologies Big data, et de la DataViz (Data visualisation)



Outils informatique

HadoopTableau Software

Autour de Hadoop : Apache DrillApache FlumeApache HiveApache KafkaApache OozieApache PigApache SparkApache SqoopApache ZeppelinApache ZooKeeperClouderaHortonworksMapRHBaseImpala (Cloudera)MapReducePresto (moteur de requête SQL)Hadoop YARNElasticsearchSolrHue (Hadoop)Apache AtlasApache Sentry

Langages : R (langage de programmation et environnement statistique) (Ggplot2) • Scala (langage)Python (langage) (Scikit-learn) • Julia (langage de programmation)SQL

Divers : VagrantApache MahoutKubeflow

Jeux de données : Iris (jeu de données)

Logiciels : Tanagra RStudioSASSPSSOrangeH2O.ai

Bases de données : MongoDBCassandraCouchDBHBase

Formats de données : JSONXMLCSVTabulation-separated valuesPredictive Model Markup LanguageYAML

Formats de données Big data : Apache AvroApache ParquetProtocol Buffers

Concepts : Data lakeDatamartDatawarehouseODSArchitecture LambdaData Lineage

ETL & traitement de la données  : TalendOracle Data IntegratorESBEAI

DataViz

Type de représentation : DendrogrammeNuage de mots-clésNuage de pointsCorrélogramme

Logiciels : Business ObjectsTableau SoftwareQlik

Articles connexes : Carte heuristique

Ailleurs que sur Wikipédia

Autres projets:

Wikibook : Programmation statistiques avec R Découvrir ScilabApprendre à programmer avec Python

Wikiquote : Big data

Wiktionnaire : Big dataDatamining


Littérature Auteurs : Stéphane Tufféry

Internet : wikistat.frhttp://www.jybaudot.fr/General/indexstats.htmlhttp://factominer.free.fr/classical-methods/index_fr.html