Applicazione delle tecniche di Text Mining all’interno di algoritmi di clustering per articoli scientifici

Michele Pratiffi

abstract

La domanda a cui il progetto intende rispondere è come possono essere sfruttate le tecniche di Text Mining all’interno di sistemi che hanno come obiettivo principale l’auto-organizzazione della conoscenza? Il progetto prevede la implementazione di un sistema di clustering per articoli scientifici in lingua inglese, sfruttando tecniche e algoritmi di Text Mining. Come infrastruttura di coordinazione si è scelto di utilizzare TuCSoN (Tuple Centres Spread over the Network) che è un modello per la cordinazione di processi distribuiti (agenti) che sfrutta i centri di tuple. All’interno del progetto sono stati realizzati due algoritmi di clustering uno ideato da me ideato e un’altro che implemanta un algoritmo preso dalla letteratura. Del secondo sono state implementate due varianti una prevede un calcolo poco distribuito ( solo pochi agenti ) mentre l’altra prevede una fortissima distribuzione del calcolo ( un agente per articolo ). Utilizzando questi algoritmi sono stati realizzati quindi molti e vari esperimenti, sia per la taratura dei parametri, che per tracciare la dipendenza degli algoritmi da questi. I risultati ottenuti verranno poi confrontati e analizzati nel dettaglio.

outcomes

final report