世の中には、Windowsの機能を拡張する『Microsoft PowerToys』のように、誰にでも役立つツールがある一方で、特定の目的を持った人にしか響かない「深すぎる便利ツール」が存在します。

私にとってそれは、江戸時代以前の文字——「くずし字」を解読するためのツールです。

スマホの『miwo』、PCの『NDL古典籍OCR-Lite』

今やAIの進化により、専門家でなければ読めなかった「くずし字」も、アプリ一つで解読できる時代になりました。スマホで手軽に使える『miwo』も素晴らしいアプリですが、PCで国立国会図書館のデジタルデータを整理したり、ファイルを一括管理したりしたい私にとっては、画面の大きなパソコンで動くツールが待望の存在でした。

そこで見つけたのが、NDLラボが開発した『NDL古典籍OCR-Lite』です。これが驚くほど優秀でした。

操作はシンプル、処理は一瞬

使い方は至って簡単です。ソフトウェアを起動し、解読したい画像ファイルと出力先のフォルダーを選択して「OCR」ボタンを押すだけ。数秒後には、かつての日本人が書き連ねた流麗な文字が、現代のテキストへと変換されて出力されます。

出力フォルダーには、テキストファイルだけでなく、元画像のどこにどの文字が対応しているのかを一目で確認できる「枠囲み画像」も生成されます。これにより、AIの誤認識を人間がチェックするのも容易になっています。

このアプリを使うのかなり簡単なので悩むこともなく、ファイルを開いて『ndlkotenocr_lite』の種類のアプリケーションをクリックすると表示されるのであとは画像ファイルを処理するを選択して、出力先を選択するで翻訳されたファイルが出力されるフォルダーを選択して『OCR』のボタンを押すと数秒で出力される。

OCRのボタンを押すと翻訳された文字が表示される。

出力されたフォルダーに翻訳された文字、翻訳されたくずし字の場所を囲ってどこが訳されたかわかるように表示された画像とうが出力される。

(※ フォルダー名に日本語を入れるとアプリケーションを起動させることが出来ない場合もあるので注意です。)
とても簡単に使うことが出来るので何かの機会にくずし字を読まなければならないときには利用してみてはいかがか。

 

 

利用時の「小さな罠」への注意

一つだけ、実際に使ってみて分かった注意点があります。フォルダー名に日本語(全角文字)が含まれていると、アプリケーションが正常に動作しない場合があるようです。作業用フォルダーは「kuzushiji」など、英数字で作成することをお勧めします。

まとめ:江戸の知恵を、現代の解像度で読む

一見、自分とは縁のない世界に見える「古文書」。しかし、こうしたツールを手にすることで、当時の瓦版や日記、料理本などが、急に「読める情報」として立ち上がってきます。

「何かの機会」など一生来ないかもしれませんが、もしも古い蔵から出てきた手紙や、旅先で見つけた石碑の文字が気になったなら。この最新のAIスコップを使って、歴史の地層を少しだけ掘り返してみてはいかがでしょうか。

 

 

 

 

多分、普通に生きている限り使うことのない自分にとっての便利ツールがいくつかある。

Windowsのアプリで無料でもマウスカーソルの場所を見失ってもすぐにわかるように光ってくれるだけでなく様々なシステムユーティリティ群を拡張できるアプリ『Microsoft PowerToys』などだれにも出役立つアプリがあるなかで、縁のないアプリもある。

だらだらと書いたが、本題に戻って日本の昔の文字であるくずし字という江戸時代までに使われていた文字だが今では読める人は勉強をした人だけが読めて一般の人にはハードルが高い文字となっている中で、この文字を読むためのアプリがいくつか出ました。

そのなかで使うことがあるのが、
『NDL古典籍OCR-Lite』
『miwo』
の2つを利用してる。

どちらもかなり優秀なアプリではあるが『miwo』はスマホに入れて使うアプリなので便利ではあるが、PCでファイルを管理したり、江戸時代の古書のデータを国会図書館から持ってくるのでパソコンで使えるものがほしいとおもっていたところにNDLラボで開発された『NDL古典籍OCR-Lite』が気づけば使えるようになった。

使い勝手はもう少し使ってみないとわからないが、ある程度の翻訳はされるのでかなり便利ではある。

このアプリを使うのかなり簡単なので悩むこともなく、ファイルを開いて『ndlkotenocr_lite』の種類のアプリケーションをクリックすると表示されるのであとは画像ファイルを処理するを選択して、出力先を選択するで翻訳されたファイルが出力されるフォルダーを選択して『OCR』のボタンを押すと数秒で出力される。

OCRのボタンを押すと翻訳された文字が表示される。

出力されたフォルダーに翻訳された文字、翻訳されたくずし字の場所を囲ってどこが訳されたかわかるように表示された画像とうが出力される。

(※ フォルダー名に日本語を入れるとアプリケーションを起動させることが出来ない場合もあるので注意です。)
とても簡単に使うことが出来るので何かの機会にくずし字を読まなければならないときには利用してみてはいかがか。