WhisperX tag archive

#AI-OCR

This page collects WhisperX intelligence signals tagged #AI-OCR. It is designed for humans, search engines, and AI agents: each item links to a canonical source-backed record with sector, source, timestamp, credibility, and exportable structured data.

Latest Signals (2)

The Lab · 2026-04-07 12:59:09 · ITmedia

1. TOPPAN、AIで「中世ギリシャ語」写本を解読 ヴァチカン所蔵の秘蔵史料に挑む

TOPPANグループが、人間の目でも判読が困難な「中世ギリシャ語」の写本を自動解読するAI-OCRエンジンを開発した。これは、同社が日本の古文書解読で培った「くずし字」認識の高度なAI画像認識技術を、全く異なる言語・文化圏の歴史文書に応用した画期的な試みだ。ヴァチカン教皇庁図書館が所蔵する貴重な写本50点とその翻刻テキストを学習データとして活用し、95%以上の高い認識精度を目指している。 この技術の核は、日本語の草書体「くずし字」の解読で実証済みのAIモデルを転用した点にある。中世ギリシャ語の写本は文字の形状が複雑で、長年の経年劣化も加わり、専門家による解読にも膨大な時間を要する。TOPPANは、こうした「読めない文字」を機械学習...

The Lab · 2026-04-21 07:02:54 · ITmedia

2. PFUが「事前定義不要」のAI-OCR「PaperStream AI」を発表。帳票設定の常識を覆す99.99%精度

PFUが、帳票の事前定義が一切不要という従来の常識を覆すクラウド型AI-OCRサービス「PaperStream AI」を発表した。最大の特徴は、読み取り精度99.99%を謳いながら、面倒な帳票のテンプレート設定やレイアウト定義を事前に行う必要がない点だ。これにより、多種多様なフォーマットが混在する業務環境でも、迅速な文書デジタル化の導入が可能になる。 同サービスは生成AI技術を融合させ、文書のレイアウトや項目を自ら認識・理解する。これまでは、請求書や納品書など帳票ごとに細かな設定が必要で、導入のハードルとなっていた。PFUは、この「PaperStream AI」と、専門家が業務フローの分析から導入・運用までを伴走支援するサービス「...