La fouille de données est « un processus de recherche informatique automatisée permettant d’extraire des volumes importants de données » . Elle concerne tous les types de contenus numériques : textes, données, images fixes ou animées, sons, musiques, logiciels…
Elle a été introduite dans une perspective de développement de l’Intelligence Artificielle (IA). En effet, le TDM permet de faire obstacle aux droits de reproduction des titulaires du droit d’auteur sur les oeuvres contenues dans la base et au droit d’extraction du producteur de la base de données. Ce nouveau mécanisme met alors en place une dérogation à ces droits privatifs : obligatoire dans le cadre de la recherche ou facultative dans les autres domaines.