Data mining research themes have been evolving. Today’s subjects are driven by two main issues. The first deals with the integration of new technical possibilities for distributed computing. The second looks at the analysis of new subjects of study, such as social networks.
Data mining is a melting pot in which we find several related disciplines. It is often reduced to machine learning, the area in which the most progress has been made, but to which it is not restricted.
A piece of raw data, either digital or printed, isn’t really useful in itself. Data mining (also called “knowledge discovery from data”) gives it its value. How can we transform data into sources of knowledge? This is one of the fundamental questions data experts ask themselves.
What’s the difference between machine learning, deep learning, big data, statistics, decision & risk analysis, probability, fuzzy logic, and all the rest?
Le data mining est un creuset au sein duquel se retrouvent de nombreuses disciplines connexes. On le réduit très souvent au machine learning, thématique où le plus grand nombre de développements ont été réalisés, mais il ne s’y limite pas.
L’informatique a permis d’accumuler des quantités massives de données sur des sujets divers et variés, qu’il s’agisse du génome humain, de simples opérations de vente ou encore de données textuelles. Une donnée brute n’est pas intéressante en elle-même. Le data mining lui apporte tout son intérêt.
Ces vingt dernières années ont vu le développement de techniques et d’outils informatiques qui permettent d’automatiser la collecte et la mise en forme de données, en particulier celles provenant d’internet. On se propose ici de réaliser un rapide tour d’horizon.
How to map controversies with a little help from the web.
The cartography of controversies is the course I teach in Sciences Po Paris as well as an intriguing research method for exploring and representing controversies in science and technology.
Le groupe “Data Mining et Apprentissage” de la SFdS (Société française de statistique) organise cette journée d’études pour introduire le domaine de l’analyse des réseaux sociaux.