Google Chromeで画像ベースのPDFからテキストへの変換が可能に事例詳細

Google Chromeチームは6月22日(米国時間)、「Google ChromeOS: New features for students and educators」において、Chromebook向けの新しい教育アプリやアクセシビリティツールを発表した。この発表の中で特に興味深いのは、ChromeブラウザにおけるPDFリーダー機能の拡張だ。ChromeOSの新しいChromeでは、画像ベースのPDFからテキストへの変換がサポートされているという。

今日のWebサイトのコンテンツはPDFドキュメントとして提供されるものも少なくない。それらのPDFコンテンツには、画像ベースのPDFとして作成されたものもある。通常のPDFであれば、Chromeは内蔵のPDFリーダー機能によってWebブラウザ上で閲覧し、テキストの選択やコピー、スクリーンリーダーでの読み上げなどができる。しかし、画像ベースのPDFはテキスト情報を持たないため、単に閲覧することはできても、テキスト選択やスクリーンリーダーでの読み上げには対応していない。

スクリーンリーダーでの読み上げができないことは、音声サポートを必要とするユーザーにとっては特に深刻な問題となる。そこでGoogleでは、アクセシビリティ向上の観点から、Chromeに対して画像ベースのPDFをテキストに変換するOCR機能を追加したという。この機能によってChromeのスクリーンリーダーは、代替テキストがない画像ベースのPDFに遭遇した際に、画像をテキストに変換して読み上げることが可能になる。

このOCR機能は、現時点ではChromeOS向けのChromeに向けて、今後数カ月以内に展開される予定だという。残念ながら、ChromeOS以外の環境への対応は発表されていない。しかしBetanewsは「Google Chrome's PDF viewer is gaining the ability to convert images to text」において、この新機能は最終的に他のOSのユーザーにも展開される可能性が高いと指摘している。

OCR機能と同様に、Chromeに対して最近追加されたPDFサポート機能の一つに「読書モード」がある。これは閲覧中のPDFのテキストサイズやフォントを変更したり、一部を非表示にしたりできる機能である。読書モードも当初はChromeOS向けとしてリリースされたが、現在はWindowsをはじめとする他のOSのChromeでも利用できるようになっているという。ChromeOS以外のOS向けの読書モードについても、今後数カ月以内に展開される予定とのことだ。

著者：杉山貴章

Google Chromeで画像ベースのPDFからテキストへの変換が可能に

外部リンク