Самый идиотский вариант, который я могу предложить — скормить PDFку распознавателю текста типа ABBYY FineReader. Или так и сделали?