Abstract: Il presente progetto, partendo dall’analisi dello stato dell’arte, ha sviluppato ricerche in settori innovativi per il document retrieval (ritrovamento di documenti). In particolare, sono state considerate tecniche basate sull’analisi strutturale (del layout), grafica (del logo) e manoscritta (della firma) di immagini documentali reali. Infine è stata effettuata l’integrazione di tali tecniche all’interno di un sistema multi-dominio, per rendere più performante il sistema di ritrovamento dei documenti. La ricerca ha utilizzato:
- per l’analisi strutturale: tecniche di filtraggio morfologico e la trasformata di Radon, al fine di ottenere dei descrittori del layout in esame;
- per l’analisi grafica: la trasformata di Haar e la tecnica di estrazione dell’istogramma del colori per le caratteristiche dal logo;
- per l’analisi manoscritta: la tecnica di segmentazione equimass grid e l’intersezione con le linee per estrarre le caratteristiche dalla firma manoscritta.
La query per il ritrovamento di documenti analoghi nella base di dati è effettuata per mezzo dell’algoritmo Dynamic Time Warping (DTW), dell’algoritmo di distanza euclidea e dell’algoritmo della similarità del coseno, rispettivamente per ciascuna analisi. Infine, è stata impiegata la strategia di decisione Borda-count per combinare le singole decisioni dei diversi classificatori implementati.
Keywords: Document Retrieval, Image Processing, Sistema Multi-Esperto