Il sito NelSenso.Net, creato dall'ingegnere italiano Paolo Cavone, contiene un utile collezione di text mining tools, strumenti che, come altri di cui riferiamo, si applicano all'elaborazione di testi digitali e pagine web. I destinatari di questa produzione sono coloro che, nel maneggiare l'informazione digitale hanno bisogno di avere un profondo controllo della struttura, dei significati e dei messaggi contenuti in essa. Gli specialisti del web marketing o le media agencies, ad esempio, hanno questa necessità, quando continuamente confrontati con il fiume di testo che proviene dagli RSS, dai siti di social networking, dai siti di news, dalla pubbliczione di user-generated content e da molte altre sorgenti di content digitale.
Le applicazioni di NelSenso.Net sono accessibili direttamente sul sito web, sono utilizzabili gratuitamente e ammettono testi in gran numero di lingue, incluso l'Italiano. Segnaliamo tra questi IRezer, uno tra gli strumenti di NelSenso.Net più potenti. che fa dell'Information Retrieval (IR), identificando ed estraendo gli elementi più semanticamente rilevanti da un testo su file o sul Web. Lo strumento è di tipo Saas, gratuito e funziona in modo molto semplice; il documento di input e i risultati si trovano nella medesima pagina-web. Una volta impostata la lingua, la "granularità" desiderata dei risultati, il lancio di IRezer ottiene la serie delle "frasi chiave" e delle "keywords, con il loro peso, ordinate per rilevanza semantica (o ordine di lettura, ndr), appartenenti al documento.
Orizzonti di conoscenza. Strumenti digitali, metodi e prospettive per l'uomo del terzo millennio (collana Strumenti per la didattica e la ricerca) - di Sorrentino Fortunato; Pettenati M. Chiara - Firenze University Press, 2014 (Italy)
Sulla rete esistono numerose risorse che implementano algoritmi classici dell'Information Retrieval riconducibili, funzionalmente, a quelli usati da Google. Questi tool possono essere usati (dai SEO, ndr) come strumenti di supporto per verificare cosa il motore di ricerca potrebbe estrarre dalle pagine.
Per gli algoritmi di summarization, in grado di restituire le frasi più rilevanti del testo (utilizzate dai motori di ricerca per generare gli snippets nelle SERP, consultare Summazer.
Per gli algoritmi di Clustering, in grado di classificare frasi o stringhe di testo in differenti categorie auto-determinate, consultare Clustezer.
Per gli algoritmi di estrazione delle keywords e le keyphrases più statisticamente rilevanti consultare IRezer.
SEO strategy. Conoscenza, tecniche e strumenti per essere visibili su Google e Social Media – di Lorenzo Toscano - Editrice UNI Service, 2009 (Italy)