https://rmacd.com/posts/2020/07/ocr-ch-pdfs/