日本での家系調査を試みたことがあれば、誰もが同じ壁にぶつかったことがあるはずです。やっと古い古文書——家系図、過去帳、昔の手紙——を見つけ出したのに、そこには現代の日本人のほとんどが読めない流麗なくずし字で書かれています。一文字二文字は読めるけれど、そこで見切りをつけてしまう。その壁は、今や一気に低くなったのです。
2026年、AIによる文字認識は家系調査の分野で一般化しました。この春、MyHeritageが「Scribe AI」をリリース。古い書類を写真に撮るだけで、数秒以内に文字起こし、日本語訳、歴史的文脈の解説まで行ってくれます。Geminiのような汎用ツールも、今では昔のくずし字を驚くほど正確に読み取れるようになりました。日本国内では、くずし字専用AI-OCRの実用化も進んでいます。TOPPANの「古文書カメラ」アプリはスマートフォンでくずし字を読み取り、CODHの「みを」サービスはまさにそのために作られました。その規模は実証済みです。TOPPANと熊本大学が、細川家文書 約50,000ページを 約950万字のテキストデータに変換した事例がそれを証明しています。以前は専門家の手を借りていた作業が、今では数分で片付く時代になったのです。ただし、この技術があなたを助けるか、それとも静かに家系図を壊してしまうかを決める「たった一つのルール」が存在します。それについては後ほど詳しく触れます。
何がここ最近で変わったのか
- MyHeritage Scribe AI(2026年3月):手書きの記録を写真に撮るだけで、文字起こし、日本語訳、歴史的文脈の解説、そして次の調査ステップの提案が得られます。利用可能な画像数には制限がありますが、無料で試せます。
- くずし字専用AI-OCR(日本): TOPPANの「古文書カメラ」とCODHの「みを」サービスは、日本の草書体(くずし字)に特化して学習されています。特に難解なくずし字の認識精度が高いのが強みです。
- 無料で使う方法: 記録の写真画像をGeminiやChatGPTに貼り付け、文字起こしと解説を依頼するだけ。サブスクリプションの契約は不要です。
使い方の基本:読み、検証、そして次の計画
これは3つのステップに分解して考えるとわかりやすいです。もし真ん中のステップを飛ばせば、自信満々な誤認識をそのまま家系図に貼り付け、間違った先祖を1年間も追いかける羽目になります。
ステップ1 — 適切なツールで読む。 くずし字を扱う場合は、専門ツール(古文書カメラ、みを、またはScribe AI)を第一候補に選び、Geminiを補足意見として使うのが賢明です。汎用ツールを使う際の有効なプロンプトは以下の通りです。
“This is a photo of an old Japanese document written in kuzushiji. Transcribe it character by character, then give a modern Japanese reading. For any character you are unsure about, mark it clearly instead of guessing.”
ステップ2 — 必ず原本と照合する(これがルール)。 認識精度が70–97%だとしても、残りの数%のズレが氏名の変換ミスや、年号の数年ズレといった致命的な誤りにつながり、それが家系の分岐を壊す原因になります。さらにAIは単に読み間違えるだけでなく、空白部分を自信を持った推測で埋めようとする傾向があります。そのため、AIが出力したテキストは必ず画像と見比べ、氏名・日付・人物関係に特に焦点を当てて確認してください。文書に明確に記載されていない情報は、すべて「確認待ちの推測」です。事実として鵜呑みにしてはいけません。
ステップ3 — 次の一手を計画する。 検証済みの文字起こしデータを手に入れたら、すでに分かっている事実を貼り付け、以下のように問いかけてみましょう。「どのような情報の抜けや矛盾がありますか? 次に調べるべき資料はどれですか?」ただし、AIに戸籍アーカイブを検索させることはできませんし、油断すると架空の資料を提示してくることもあります。AIは「探す」ための道具ではなく、「計画を立てる」ための道具として使いましょう。
あなたにとっての意味
- 自分の家系図をたどるなら: 以前は足止めを食らっていた記録も、今では数秒で読み解けるようになりました。最初の一篇から「原文と照合する」習慣を身につけてください。
- 古い家族の書類があるなら: まずは無料で始めましょう。一枚写真に撮り、Geminiに貼り付けてみてください。何十年も謎に包まれていた内容が、この週に解き明かされるはずです。ただし、信じる前に氏名と日付は必ず確認してください。
- 郷土史の研究なら: 「文字起こし→要約」の流れを使えば、積まれた資料群を数分で読みやすい下書きに変換できます。あとはそれを原文と照合するだけで完了です。
AIにできないこと
- 自信満々に作り話をする。 滲んだ文字が、まるで完全な氏名であるかのように補完されます。常に原文と見比べる習慣を忘れないでください。
- 高精度=安全、ではありません。 70–97%という数字は、ページ上に間違いが存在することを意味します。それを見つけ出すのがあなたの役割です。
- アーカイブは開けません。 戸籍記録を読んでくれるわけではなく、架空の引用を吐き出すこともあります。計画は立てられても、実際に資料を探し出すことはできません。
- 初期設定では非公開ではありません。 チャットボットに生DNAデータをアップロードしてはいけません。存命の親族の個人情報も貼り付けないでください。存命者は匿名化し、可能であればチャット履歴や学習利用をオフにしましょう。
まとめ
AIは、日本の家系調査にかつてない最高の「初稿」をもたらしました。それまで手が付けられなかったくずし字の文書が、今では数秒で読めるテキストと、「次にどこを調べればよいか」のリストに変身します。ほぼ無料で試せる点も魅力です。ただし、ツールが文字を書くのではなく、あなたが研究者として検証するのです。毎回このループを回してください。読む、原文と照合する、次のステップを計画する。
New to AI tools for documents? 当社のAI-OCR文書処理講座では、画像を信頼できるテキストに変換する基本を、約1時間で学べます。