Il text mining è lo strumento che permette di trattare i documenti con strumenti di analisi automatica. Questi strumenti variano considerevolmente tra loro ma, in generale, riassumono e categorizzano i documenti, identificano la lingua in cui sono scritti, estraggono concetti chiave, nomi propri e frasi con più parole, ne riportano frequenze, classificano un documento in funzione della rilevanza rispetto a uno specifico argomento.
Alcuni incorporano capacità di Web-crawling (ovvero di recupero automatico di docuementi sulla rete internet), estraggono dati in vari formati, collegano le informazioni tra di loro in relazioni spaziali o temporali, scoprono legami o catene di informazioni legate fra di loro, raggruppano documenti in funzione del loro contenuto, effettuano analisi incrociate e permettono l’utilizzo congiunto di package statistici.
Attraverso il text mining si possono analizzare volumi immensi d’informazione, sia in tempo reale sia in differita e si possono identificare relazioni e strutture che altrimenti sfuggirebbero alla capacità analitica dell’essere umano.