https://rmacd.com/posts/2020/06/bulk-ocr-pdf/