Rimettendo ordine nella /home/dat/universita ogni tanto saltano fuori delle cose che mi fanno tenerezza. Come questa: il laboratorio avanzato di WIR.
Lo metto qui per vari motivi, uno su tutti, perchè mi dispiacerebbe perderlo tra un rm -r e l’altro e quindi, non avendo bottiglie di vetro da abbandonare all’oceano, mi affido al sistema di backup del mio hosting (tanto credo che la probabilità di ritrovarlo in futuro sia, nei due casi, equivalente).
- Codice sorgente (archivio gzippato di 30KB di pessimo codive java)
- Relazione (pdf gzippato da 120KB in italiano stentato)
L’idea di partenza non era neanche malaccio, volevo vedere se era possibile fare un motore di ricerca onnisciente, un motore dove tu dicevi: “hey dimmi tutto quello che sai di xyz” e lui “beccati questo e di più non c’è“. Insomma un motore che non presentasse contenuti replicati e mostrasse le pagine più dissimili tra quelle simili (cioè di quel dato argomento cercato). Il risultato doveva essere quello di poter restituire TUTTE le informazioni possibili e immaginabili sull’argomento della ricerca.
Ovviamente, in un perfetto processo di tipo yin e yang, il tutto non ha portato a quasi niente. Gli unici risultati apprezzabili sono stati il capire che 1) non so programmare in java neanche dopo 3 esami sull’argomento 2) un motore del genere non sono in grado di farlo, però almeno riesco a pensarlo 3) bhe, un esame di meno, il che non è poco nella lenta marcia verso la specialistica.
Devo dire che è stato comunque divertente giocare con lucene e luke.