Tech Radar PI, il Web Crawler per Poste Italiane

Un Web Crawler per classificare le novità nel panorama IT

Individuare novità nel campo dell’Information Technology sviluppando un Web Crawler. Col progetto Tech Radar, Spindox Labs ha risposto all’esigenza di Poste Italiane di esplorare il Web alla ricerca di informazioni sempre aggiornate sulle tecnologie nel mondo IT. Abbiamo proceduto all’analisi dei contenuti editoriali on-line, sulla base di categorie d’interesse del cliente, attraverso strumenti di Augmented Intelligence. L’indicizzazione dei materiali è avvenuta tramite tecniche di classificazione sviluppate in ambito NL. Le informazioni, presentate per mezzo d’interfacce grafiche, hanno rispecchiato una copertura ampia di sorgenti di dati.

Un web Crawler per sistemi personalizzati di analisi informazioni sul panorama IT

Nome progetto:

Tech Radar PI

Durata:

11 mesi

Anno:

2019-2020

Tecnologia

Augmented Intelligence

web crawler news, or non è necessario leggere da ogni fonte informativa. basta il tech radar di spindox labs

LA SOLUZIONE REALIZZATA

Due le soluzioni individuate per riorganizzare e presentare le informazioni:

  • Una pagina di news indicizzate per area tematica, filtrate attraverso uno score d’interesse sulla base dell’engagement rate registrato sui social media. La pagina, sul modello dei periodici specializzati, offre titoli e sommari di notizie selezionate rifacendosi a criteri di ricerca configurabili dall’utente.
  • Un “radar tecnologico” di mappatura nel quale i diversi spicchi rappresentano le aree tematiche (NL, IOT, Big Data, Augmented Intelligence) e i pattern di colorazione sono riferiti alle differenti tecnologie (libreria, framework, linguaggio). La distanza dal centro del radar è indice del livello di maturità delle tecnologie stesse. Le informazioni sono validate da un operatore analista il quale, tramite interfaccia grafica, verifica i risultati e restituisce di volta in volta feedback per migliorarli.

VANTAGGI GUADAGNATI

Per lo sviluppo del Web Crawler sono state selezionate più sorgenti di dati, così da soddisfare standard di affidabilità, accessibilità e completezza attraverso un’unica soluzione:

  • StackOverflow è considerato unanimemente dagli sviluppatori un punto di riferimento per estrarre informazioni relative a tecnologie e loro trend di utilizzo nel panorama IT.
  • StackShare è un portale per l’esplorazione degli stack tecnologici delle maggiori compagnie mondiali.
  • Feedly è un collettore di news che consente di sottoscrivere feed personalizzati riguardo a specifiche aree tematiche, fornendo riscontri referenziati circa l’interesse suscitato dalle notizie
ALTRI PROGETTI DI SUCCESSO

Mimex, il progetto europeo di IOT retail a prova di Covid-19

DEEP LEARNING, SENSORI IOT, DATA SCIENCE

Asset tracking per l’auto connessa

SENSORI IOT, Asset Monitoring & Predictive Maintenance

Digital Twin e Object and Anomaly Detection

3D MODELING, IMAGE RECOGNITION, AI FOR OBJECT E ANOMALY DETECTION