1
2
国立国会図書館は、令和3年度にオープンソースのOCR(光学式文字認識)処理プログラム #NDLOCR を開発し、GitHubでソースコードを公開しています。商用・非商用を問わず自由な利用が可能です。
NDLOCRについては国立国会図書館月報2022年11月号の特集記事でも紹介しています。
dl.ndl.go.jp/view/download/…