1
2
「次世代デジタルライブラリー」
⇒lab.ndl.go.jp/dl/
著作権保護期間の満了した図書約28万点のOCRテキストデータ(未校正)を対象に全文検索を行うことができます。そのほか、画像検索機能も提供しています。
#NDL全文使ってみた
3
#次世代デジタルライブラリー の全文検索機能を使ってみましょう。タクシーに乗るという意味の「タクる」という言葉。最近使われ始めた単語かと思いきや…?
「タクる」で検索すると、『歓喜咲』(1942)に用例を発見。戦前からあった言葉なんですね。
#NDL全文使ってみた
lab.ndl.go.jp/dl/book/113042…
4
一生懸命と一所懸命。普段どちらを使うことが多いですか?#NDLNgramViewer では、近代の図書の本文における単語の出現頻度を可視化できます。「一生懸命/一所懸命」で検索すると、1880年代を境に「一生懸命」がよく使われるようになったことが分かります。
#NDL全文使ってみた
lab.ndl.go.jp/ngramviewer/?k…
5
#NDLNgramViewer では高度な検索機能として、#正規表現 を使った検索が可能です。たとえば「[^あ-んア-ン]{1,1}球」と検索すると、末尾が「球」である二字熟語を探すことができます。#NDL全文使ってみた
6
なお、11月1日(火)にオンラインで開催するフォーラム「#NDL全文使ってみた ~「次世代デジタルライブラリー」&「NDL Ngram Viewer」」では、今回の古典籍資料の追加についてもご紹介します。ぜひご参加ください。
■日時:11月1日(火)15時~17時10分
■詳細・申込方法:lab.ndl.go.jp/event/lff2022/
7
実験サービス #次世代デジタルライブラリー に、OCRテキストを画像に重ねて表示する機能を追加しました。閲覧画面右上の「T」(矩形ごとにテキスト表示)ボタンをクリックすると、資料画像上のテキスト部分がハイライトされ、カーソルの位置のテキストが表示されるようになります。#NDL全文使ってみた