VI spiego il mio problema. Ho diversi ebook in PDF, alcuni con diverse pagine in cui la stragrande maggior parte delle pagine i testi sono selezionali e copiabili, quindi le parole all'interno si possono cercare. Il fatto però che per qualche strano motivo questi PDF hanno pagine semplicemente scannerizzate, quindi il PDF le vede come immagini.
Risolverei facilmente con la funzione OCR del programma PDF che possiedo ma mi toccherebbe mettere in OCR tutto gli ebook e tutte le pagine, operazione lunga e inutile dato che servirebbe in OCR solo per alcune pagine interne.
Quello che mi chiedo se esiste qualche cosa che individui le pagine con i testi non selezionabili e quindi intervenire solo su quelle pagine e non sull'intero ebook.