Mar 27 2011

Il text mining

Category: TecnologiaAntonio @ 14:54


Il text mining è lo strumento che permette di trattare i documenti con strumenti di analisi automatica. Questi strumenti variano considerevolmente tra loro ma, in generale, riassumono e categorizzano i documenti, identificano la lingua in cui sono scritti, estraggono concetti chiave, nomi propri e frasi con più parole, ne riportano frequenze, classificano un documento in funzione della rilevanza rispetto a uno specifico argomento.

Alcuni incorporano capacità di Web-crawling (ovvero di recupero automatico di docuementi sulla rete internet), estraggono dati in vari formati, collegano le informazioni tra di loro in relazioni spaziali o temporali, scoprono legami o catene di informazioni legate fra di loro, raggruppano documenti in funzione del loro contenuto, effettuano analisi incrociate e permettono l’utilizzo congiunto di package statistici.
Attraverso il text mining si possono analizzare volumi immensi d’informazione, sia in tempo reale sia in differita e si possono identificare relazioni e strutture che altrimenti sfuggirebbero alla capacità analitica dell’essere umano.

Cosa è possibile scoprire con il text mining applicato a problemi di sicurezza nazionale?
Le elites politiche esprimono idee e pensieri sotto l’influenza di analisi di altissimo livello, di briefing militari e diplomatici, di gruppi di lavoro interagenti incaricati della formulazione della politica nazionale, di rapporti di commissioni e di altre fonti richhe d’informazione.

Queste idee e pensieri da loro espressi contengono perciò tracce del processo articolato attraverso il quale si va costruendo e palesando una decisione strategica.
Ma allora e’ vero anche il contrario: attraverso l’analisi contemporanea di molte fonti relative al medesimo argomento si possono rivelare strutture e legami che permettono di ricostruire le linee guida attraverso le quali viene pianificata una certa politica e di conseguenza prevedere le decisioni future.
Molte dichiarazioni di leader politici, per esempio, sono spesso prevedibili in anticipo attraverso osservazioni casuali fatte dai rappresentanti del loro staff.
A seconda dell’ambiente, le fonti d’informazioni più ricche possono essere all’interno di due o tre cerchi concentrici di persone che si trovano intorno al responsabile di un gruppo.

Questi circoli concentrici che circondono i leaders sono composti da coloro che preparano i briefing decisionali, frequentano gli incontri dei gruppi di lavoro, preparano le bozze che indirizzano i decision maker e che strutturano la politica da seguire.

Bill Flynt, tenente colonnello dell’esercito USA, in un articolo apparso su Military Review del 7 Agosto 2000 esamina l’applicazione del processo di text mining al libro Unrestricted Warfare, scritto da due colonnelli dell’esercito cinese: Qio Ling e Wang Xiangsui. Sebbene i risultati migliori del text mining si abbiano quando le fonti informative sono in numero elavato, già in questo caso Flynt ne dimostra l’utilità
per riconoscere, attraverso l’analisi automatica delle idee espresse dagli autori, le diverse minacce emergenti nelle nuove forme di guerra, i mezzi utilizzati per realizzarle, gli obiettivi e i fini strategici che si pensa di raggiungere. L’analisi mette inoltre in evidenza le relazioni che gli autori individuano come essenziali per raggiungere certi obiettivi strategici.

Flynt sottolinea l’importanza del text mining per individuare le prospettive strategiche di un certo soggetto sia che si tratti dell’esercito cinese sia che si tratti,
secondo le sue testuali parole, di un terrorista come Unabomber o dell’autore di una pagina Web.

Commenti chiusi.