Sapete già cos’è l’OCR vero? E’ quel sistema che usate per scansionare testi stampati e interpretarli senza doverli riscrivere a manina (tranne qualche correzione). Avete presente?
Ebbene sembra che Google lo userà nei suoi spider…mmmm leggiamo meglio da Merlinox
Su Punto Informatico leggo che Google sembra aver implementato nei suoi bot la capacità di fare OCR, cioè di trasformare testi in formato immagine, in testi in formato testo. OCR è l’acronimo di Optical Character Recognition e indica tutti quei software appunto in grado di interpretare il testo dentro normali immagini bitmap / raster.
A questo punto non mi resta che fare un test. Inserisco questa immagine dentro al mio blog: nell’immagine sono contenute parole non indicizzate da google, parole inesistenti.