Abbyy Finereader 12 このプログラムは何のためにありますか。 仕組み: FineReader

💖 好きですか?リンクを友達と共有する

『ABBYY® FineReader 12 クイック ユーザー ガイド』 このドキュメントには、ABBYY FineReader の操作に関する基本情報が含まれています。 完了..."

ABBYY® FineReader 12

クイックユーザーガイド

この文書には、ABBYY FineReader の操作に関する基本情報が含まれています。 完全ガイド

ABBYY FineReader、Screenshot Reader、Hot Folder アプリケーションとの連携は、同社の Web サイトから入手できます。

アビー。 インターネットに常時接続していない場合は、マニュアルをダウンロードできます。

PDF 形式のユーザー。

ABBYY FineReader とは

ABBYY FineReader のインストールと起動

システム要求

プログラムのインストール

ABBYY FineReader の起動

ABBYY FineReader の使用

組み込みタスク

段階的なドキュメント変換

文書構造の分析と領域の編集

プログラムのアクティベーションと登録

ABBYY FineReader のアクティベーション

ABBYY FineReader の登録

データセキュリティ

ABBYY FineReader とは ABBYY FineReader は、光学式文字認識システム (OCR - 光学式文字認識) です。 スキャンしたドキュメント、PDF ドキュメント、およびデジタル写真を含む画像ファイルを編集可能な形式に変換するように設計されています。

ABBYY FineReader 12 の利点 認識の速度と高精度 世界のほとんどの言語をサポート 認識結果の確認 シンプルで直感的なインターフェイス 写真撮影した文書の認識 文書をさまざまな形式で保存し、オンライン ストレージに送信 登録ユーザー向けの無料テクニカル サポートABBYY FineReader のインストールと起動 システム要件 1. クロック速度が 1 ギガヘルツ (GHz) 以上の 32 ビット (x86) または 64 ビット (x64) プロセッサ。



2. オペレーティング システム Microsoft® Windows® 8、Microsoft® Windows® 7、Microsoft Windows Vista、Microsoft Windows XP、Microsoft Windows Server 2012/2012 R2、Microsoft Windows Server 2008/2008 R2、Microsoft Windows Server 2003。

ローカライズされたインターフェイスを使用するには、オペレーティング システムが必要な言語サポートを提供する必要があります。

3. RAM - 1024 MB。

マルチコア システムで実行する場合、追加のコアごとにさらに 512 MB の RAM が必要です。

4. ディスクの空き容量: すべてのプログラム コンポーネントのインストール用に 850 MB、プログラムの実行用に 700 MB。

5. 少なくとも 1,024,768 ピクセルの解像度を持つビデオ カードとモニター。

6. キーボード、マウス、またはその他のポインティング デバイス。

プログラムのインストール

ABBYY FineReader 12 をインストールするには:

1. インストール CD またはプログラム配布フォルダから Setup.exe ファイルを実行します。

ABBYY FineReader 12 Corporate をローカル ネットワークにインストールできます。 システム管理者ガイドは、ABBYY Web サイトから PDF 形式でダウンロードできます。

ABBYY FineReader の起動

ABBYY FineReader 12 を起動するには:

ABBYY FineReader 12 のクイック ユーザー ガイド [スタート] プログラム メニューで ABBYY FineReader 12 (ABBYY FineReader 12 Corporate) を選択するか、Microsoft Office アプリケーションで FineReader 12 パネルにある ABBYY FineReader 起動ボタンをクリックするか、Windows エクスプローラーで次のファイルを選択します。画像を選択し、そのコンテキスト メニューで [ABBYY FineReader で開く] を選択するか、目的の形式に変換します。

ABBYY FineReader の使用

ABBYY FineReader プログラムを使用してドキュメントを処理するプロセスは、次の 4 つの段階で構成されます。

画像を受信する。

文書認識。

受信したテキストの確認と編集。

認識結果を保存します。

多くの場合、このプロセスは、スキャン、認識、認識されたテキストを特定の形式で保存するなど、同じ一連のアクションで構成されます。 最も一般的なタスクを実行するために、プログラムには、ボタンを 1 回クリックするだけで認識されたテキストを取得できる組み込みタスクが用意されています。 複雑な構造を持つドキュメントを認識するために、各処理段階を自分で設定して実行できます。

組み込みタスク 組み込みタスクは、アプリケーションの起動時にデフォルトで開く「タスク」ウィンドウから起動されます。 ウィンドウが閉じている場合は、メイン プログラム ツールバーの [タスク] ボタンをクリックします。

ABBYY FineReader 12 クイック スタート ガイド

組み込みタスクを使用してドキュメントを変換するには:

1. [タスク] ウィンドウで、タスクが含まれる必要なタブを選択します。

基本 - ABBYY FineReader プログラムの最も頻繁に使用される組み込みタスクが含まれています。

Microsoft Word - Microsoft Wordドキュメントに変換するタスク。

Microsoft Excel - Microsoft Excel スプレッドシートを作成するタスク。

–  –  –

マイ タスク - 自分に特に必要な手順で構成される独自のカスタム タスクを作成できます (ABBYY FineReader Corporate バージョンのみ)。

2. [ドキュメント言語] リストで、認識言語を指定します。

3. [カラー モード] リストで、カラー モードを選択します。

カラー - ドキュメントのカラー デザインは変更されません。

白黒 - ドキュメント ページは白黒になり、FineReader ドキュメントのサイズが小さくなります。 カラー モードと比較して、このモードはドキュメントの処理に必要な時間が短くなります。

ABBYY FineReader 12 クイック ユーザー ガイド 注意! 白黒モードを選択すると、ドキュメントの色を復元することはできません。 カラー文書を取得するには、ページのカラー画像を含むファイルを開くか、紙文書をカラーでスキャンします。

4. 必要に応じて、ウィンドウの右側で Microsoft Word ドキュメント、Microsoft Excel ドキュメント、および Adob​​e PDF ドキュメントに変換するタスクの追加パラメータを設定します。

5. 必要なタスクのボタンをクリックします。

ABBYY FineReader タスクは、[設定] ダイアログ ([ツール]、[設定]… メニュー) で指定された設定を考慮して実行されます。

起動すると、タスクの進行状況バー、ステップのリスト、ヒントと警告を含むタスクの進行状況バーが画面に表示されます。

タスクを完了すると、必要な形式のドキュメントが作成され、画像が FineReader ドキュメントに追加されます。 必要に応じて、画像内の選択した領域を編集し、認識されたテキストを確認し、認識結果を別の形式で保存することができます。

ステップバイステップのドキュメント変換 ドキュメント処理の各段階を個別に設定して起動するには、ABBYY FineReader プログラムのメイン ウィンドウを使用します。

ABBYY FineReader 12 クイック スタート ガイド

1. メイン ツールバーの [ドキュメント言語] ドロップダウン リストで、認識言語を指定します。

2. 画像をスキャンするか開きます。

デフォルトでは、文書の分析と認識が自動的に開始されます。 これらの設定は、[設定] ダイアログ (メニュー [ツール] [設定...]) の [スキャン/開く] タブで変更できます。

3. 画像ウィンドウで、選択した領域を確認し、必要に応じて編集します。

4. 領域を変更した場合は、メイン ツールバーの [認識] ボタンをクリックします。

5. [テキスト] ウィンドウで認識結果を確認し、必要に応じて編集します。

ドキュメント構造と編集領域の分析 ドキュメントの変換の結果として得られる品質は、ソース画像、認識設定、保存オプションなどの多くの要因によって決まります。 最も重要なステップの 1 つは、文書の論理構造を分析することです。 テキスト、画像、表、バーコードのある領域を強調表示します。 領域は強調表示され、画像の特定の部分をどのように、どのような順序で認識するかをシステムに指示します。 これにより、ドキュメントの元のデザインが再現されます。

ABBYY FineReader 12 クイック ユーザー ガイド デフォルトでは、ABBYY FineReader のドキュメント分析は自動的に実行されます。

ただし、複雑なドキュメントでは、一部の領域が正しく強調表示されない場合があります。 多くの場合、すべての領域を再選択するよりも、領域のみを修正する方が便利です。領域を手動でマークおよび編集するためのツールは、画像ウィンドウ パネルと、テキスト、画像、背景画像のポップアップ ツールバーにあります。テーブルエリア。 アクティブ領域の横にポップアップ ツールバーが表示されます。 領域を選択するには、マウスの左ボタンで領域をクリックします。

手動マークアップ ツールを使用すると、次のことが可能になります。

エリアの追加または削除

–  –  –

領域の境界または領域自体を移動する 領域の長方形部分を追加または削除する 領域の番号を付け直す 領域のすべての編集操作が完了したら、再度認識を実行します。

ABBYY Web サイトの完全なヘルプで、手動マーキング用のツールの使用方法や、解決策に追加の設定が必要となる可能性がある非標準的な状況について詳しく読むことができます。

プログラムのアクティベーションと登録 ABBYY FineReader のアクティベーション ABBYY FineReader 12 を全機能モードで使用するには、製品のアクティベーションが必要な場合があります。 アクティベーションは完全に安全かつ匿名で行われます。

最も簡単かつ迅速な方法は、インターネット経由でプログラムをアクティブ化することです。 電子メールまたは電話/ファックスでプログラムをアクティベートすることもできます。 アクティベーションに関する詳細情報は、ABBYY Web サイトでご覧いただけます。

ABBYY FineReader の登録 ABBYY は、ABBYY プログラムの登録ユーザーになるよう招待します。

FineReader 12. 登録すると、次のようなさまざまなメリットが得られます。

無料の技術サポート。

ABBYY Screenshot Reader アプリケーションを使用する機能。画面領域のスクリーンショットからテキストを認識するように設計されています。

シリアル番号を紛失した場合の復元。

製品の自動更新。

ABBYY 製品の特別オファーに関する情報を受け取るチャンス。

次のいずれかの方法でプログラムのコピーを登録できます。

プログラムのアクティブ化プロセス中に登録カードに記入します。 アクティベーション プロセス中にプログラムを登録しなかった場合は、後で都合のよいときにいつでも登録できます。

ABBYY FineReader 12 クイック ユーザー ガイド [ヘルプ] メニューで [登録...] を選択し、登録カードに記入します。

ABBYY Web サイトに登録します。

データのセキュリティ プログラムの登録プロセス中に、お客様はご自身の個人データを ABBYY に自発的に転送することに同意するものとします。 また、ABBYY が機密保持の条件に基づき、ライセンス契約に従って適用法に従って個人データを収集、処理、使用することに同意するものとします。 お客様が提供する個人データは、ABBYY グループ企業内でのみ使用され、ライセンス契約またはライセンス契約自体に従って適用法で規定されている場合を除き、第三者に提供されることはありません。

ABBYY は、登録時に該当するボックスにチェックを入れて ABBYY から情報を受け取ることに同意した場合に限り、製品に関するニュース、価格変更、特別オファー、および製品または会社に関するその他の情報を含む電子メールを送信する権利を有します。 ABBYY に連絡することで、いつでも購読者リストからアドレスを削除できます。

ABBYY FineReader 12 クイック スタート ガイド

この文書に含まれる情報は予告なく変更される場合があり、ABBYY は変更する義務を負いません。

この文書で説明されているソフトウェアは、使用許諾契約に基づいて提供されています。 このソフトウェアは、本契約の条項に厳密に従っている場合にのみ使用またはコピーすることができます。 ライセンス契約または非頒布契約で特別な許可がない限り、このソフトウェアを記憶媒体にコピーすることは、ロシア連邦法「コンピュータ プログラムおよびデータベースの法的保護に関する」に違反します。国際法。

このマニュアルのいかなる部分も、書面による許可なしに、いかなる目的であっても、電子的または機械的な形式または手段(コピーまたは録音を含む)によって複製または送信することはできません。

© Abi Production LLC、2013.無断複写・転載を禁じます。

ABBYY、ABBYY FineReader、ADRT は ABBYY Software Ltd の登録商標または商標です。

© 1984-2008 Adob​​e Systems Incorporated およびそのライセンサー。 無断転載を禁じます。

米国特許によって保護されている: 5,929,866; 5,943,063; 6,289,364; 6,563,502; 6,185,684; 6,205,549; 6,639,593;

7,213,269; 7,246,748; 7,272,628; 7,278,168; 7,343,551; 7,395,503; 7,389,200; 7,406,599; 6,754,382; 特許出願中です。

Adobe® PDF ライブラリは、Adobe Systems Incorporated が著作権を所有しています。

Adobe、Acrobat®、Adobe ロゴ、Acrobat ロゴ、Adobe PDF ロゴ、および Adob​​e PDF Library は、米国およびその他の国における Adob​​e Systems Incorporated の登録商標または商標です。

このプログラムには、© 2008 Celartem, Inc. のコンポーネントが含まれています。 無断転載を禁じます。

このプログラムには、© 2011 Caminova, Inc. のコンポーネントが含まれています。 無断転載を禁じます。

AT&T Labs テクノロジーを利用しています。

DjVu® は米国特許第 2 号によって保護されています。 6.058.214。 他国でも特許出願中です。

このプログラムには、© 2013 University of New South Wales のコンポーネントが含まれています。 無断転載を禁じます。

© 2002-2008 インテル コーポレーション。

© 2010 Microsoft Corporation. 無断転載を禁じます。

Microsoft、Outlook、Excel、PowerPoint、Windows Vista、Windows は、米国およびその他の国における Microsoft Corporation の登録商標または商標です。

© 1991-2013 Unicode, Inc. 無断転載を禁じます。

© 2010、Oracle および/またはその関連会社。 無断転載を禁じます。

OpenOffice.org および OpenOffice.org ロゴは、Oracle および/またはその関連会社の商標または登録商標です。

JasPer ライセンス バージョン 2.0:

© 2001-2006 Michael David Adams © 1999-2000 Image Power, Inc.

© 1999-2000 The University of British Columbia EPUB® は IDPF (International Digital Publishing Forum) の登録商標です。このプログラムには、© 2009 The FreeType Project (www.freetype.org) が所有するコンポーネントが含まれています。全著作権所有です。

この製品には、OpenSSL ツールキットで使用するために OpenSSL プロジェクトによって開発されたソフトウェアが含まれています。 (http://www.openssl.org/)。 この製品には、Eric Young ( [メールで保護されています]).

© 1998-2011 OpenSSL プロジェクト。 無断転載を禁じます。

© 1995-1998 エリック・ヤング ( [メールで保護されています]) 無断転載を禁じます。

この製品には、Tim Hudson ( [メールで保護されています]).

その他の商標は商標または登録商標です

類似作品:

「2016/02/01 シモットは出エジプト記 1:1–6:1/イザヤ書 27:6–28:13 の名前を挙げています。 29:22,23/マルコ 1,2 出エジプト記 1:1 これらは(今)エジプトに入ったイスラエルの人々の名前です。彼らは皆、ヤコブと一緒に自分の家に入りました。 出エジプト記 1:1 これらはヤコブとともにエジプトに入り、各人が自分の家に入ったイスラエルの人々の名前である。 ここは直線です…」

「FineReader これはどのようなプログラムですか」 - 私たちはそれ自体で、事務作業に非常に役立つかけがえのないプログラムについて話しています。 かつてはほぼすべてのコンピュータに搭載されていた、これほど有名で人気のあるプログラムの名前がそのようなリクエストに含まれているのを見るのは、少し奇妙ですらあります。

ほとんどのユーザーがオペレーティング システムをインストールするとすぐにインストールするプログラムのリストがあります。 これは、それらのそれぞれがすぐに必要になるからではなく、これらが間違いなく使用される Office アプリケーションであり、非常に積極的に使用されるためです。

そのリストには、Microsoft Office ソフトウェア パッケージ、ブラウザの 1 つである Adob​​e Reader が常に含まれており、今後も常に含まれます。これらは、新しい Windows で Internet Explore を最初に最後に起動するときにダウンロードするものです。 その後、ユーザーのニーズに応じてバリエーションが始まります。 これは、Photoshop、Sony Vegas などです。

かつて、上記のプログラムには FineReader も含まれていましたが、近年その人気が失われています。 現在では、以前ほど頻繁に車に搭載されることはなくなりました。 しかし、その機能が今日でも有効であることを否定するのは愚かです。

FineReader プログラムとは何ですか?

このアプリケーションの利点は、さまざまな形式のテキスト ファイルを認識して読み取るだけでなく、画像のテキストを DOC ファイルに変換できることです。

つまり、編集不可能なテキストが編集可能になります。 また、さまざまな雑誌形式を扱う必要があることが多いという事実を考慮すると、この機能は便利です。

FineReader を使用してテキストを変換すると、ユーザーが画像からテキストを再入力して手動でテキストを入力する必要がなくなるため、時間を大幅に節約できます。

したがって、FineReader がどのような種類のプログラムであるかがわかったので、後で編集するためにコンピュータ上の画像からテキストを再入力する必要はもうありません。

さまざまな種類のファイルをスキャンおよび処理するための最も人気のある機能の 1 つは、Fine Reader です。 このソフトウェア製品の機能はロシアの会社 ABBYY によって開発され、文書を認識するだけでなく処理 (翻訳、フォーマットの変更など) も可能にします。 多くのユーザーは、ABBYY FineReader をインストールすることはできても、すぐには使い方を理解できません。 この記事では、多くの質問に対する答えが見つかります。

このプログラムを使用すると、テキストをスキャンして認識することができます。

ABBYY FineReader 12 がどのようなプログラムであるかを詳しく理解するには、そのすべての機能を詳細に検討する必要があります。 最初の最も単純な機能は、ドキュメントをスキャンすることです。 スキャン オプションには、認識ありと認識なしの 2 つがあります。 印刷したシートを通常どおりスキャンすると、スキャンした画像がコンピュータ上の指定したフォルダーに受信されます。

注意。 シートは、プリンターに表示されている輪郭に沿って、プリンターのスキャン部分に均等に配置する必要があります。 最終スキャンの品質が低下する可能性があるため、ソース ファイルが曲がらないようにしてください。

FineReader には重要な機能があるため、なぜ FineReader が必要なのかを自分で決める必要があります。たとえば、画像を受け取る色を個別に選択でき、すべての写真を白黒に変換できます。 白黒では認識が速くなり、処理の品質が向上します。

ABBYY FineReader のテキスト認識機能に興味がある場合は、スキャンする前に特別なボタンを押す必要があります。 この場合、情報を取得するにはいくつかのオプションがあります。 標準では、認識されたシートが画面に表示され、手動でコピーまたは編集できます。

その他の機能を選択すると、すぐにWord文書やExcelの表として受け取ることができます。 機能の選択は非常に簡単で、メニューは直感的で、必要なボタンがすべて目の前にあるためカスタマイズが簡単です。

重要。 ABBYY FineReader がテキストを認識できるようにするには、処理言語を正確に選択する必要があります。 このユーティリティは完全に自動的に動作しますが、ソースの品質が低いため、ソースにどのような言語が含まれているかを理解できない場合があります。 これにより、アプリケーションの最終結果の品質が大幅に低下します。

複数の動作モード

ABBYY FineReader 12 の使用方法を完全に理解するには、「慎重」と「迅速な認識」の 2 つの操作モードを試す必要があります。 2 番目のモードは高品質の画像に適しており、1 番目のモードは低品質のファイルに適しています。 徹底モードでは、ファイルの処理に 3 ~ 5 倍の時間がかかります。

図はプログラムの結果を示しています - 画像からのテキスト認識

他にはどんな機能があるのでしょうか?

ABBYY FineReader の便利な機能はテキスト認識だけではありません。 ユーザーの利便性を高めるために、ドキュメントをユーザーが必要とする形式 (pdf、doc、xls など) に変換することができます。

テキストの変更

Fine Reader でテキストを変更する方法を理解するには、「ツール」-「検証」タブを開く必要があります。 この後、フォントの編集、記号、色などの変更ができるウィンドウが開きます。画像を編集している場合は、「画像エディタ」を開く必要があります。これは、単純なペイント プログラムにほぼ完全に対応しています。ただし、最小限の編集を行うことができます。

注意。 ABBYY FineReader を効果的に使用する方法がまだわからない場合は、アプリケーション ウィンドウの [バージョン情報] タブにある [ヘルプ] セクションを参照してください。

これで、FineReader プログラムの用途がわかり、家庭でもオフィスでも正しく使用できるようになりました。 アプリケーションの機能は非常に豊富で、一度使用すると、オフィスでの文書やファイルの処理にこのソフトウェア製品が不可欠であることがわかります。

過去 50 年間にわたる人工知能 (AI) の進歩によって、スマート マシンは人間の認知能力に少しも近づいたわけではありませんが、この方向の進歩を完全に否定するのは不公平でしょう。 最も明白で印象的な例はチェスです (より単純なゲームは言うまでもありません)。 コンピュータはまだ私たちの思考を模倣することはできませんが、大量の特殊なメモリと検索速度によってこのギャップを補うことは十分に可能です。 ウラジミール・クラムニクは、2006年に自分を破ったディープ・フリッツ・プログラムの試合を、確立された(人間的な)戦略と戦術のルールにしばしば矛盾するという意味で「非人間的」だと評した。

そしてちょうど1年ほど前、かつてコンピューター(有名なディープ・ブルー)のチェスの勝利の基礎を築いたIBMのもう一つの発案であるワトソンが、アメリカの人気クイズ「ジェパディ」の2人のチャンピオンを破り、新たな躍進を遂げた。大差で。 ただし、ワトソンが独自に答えを発声したにもかかわらず、質問は依然としてテキスト形式で送信されたことは重要です。 これは、AI アプリケーションの多くの分野 (音声認識、画像認識、機械翻訳) での成功はかなり控えめであることを示唆していますが、これによって今日実際に AI を使用することが妨げられるわけではありません。 おそらく、最大の成功は光学式文字認識システム (OCR、光学式文字認識) によって実証されており、ほぼすべての PC ユーザーが何らかの形で精通していると思われます。 さらに、この分野におけるロシアの発展は世界で価値ある地位を占めています - ABBYY FineReader のことです。

ちょっとした歴史

ABBYY FineReader の現在のバージョンは 11 番です。つまり、このアプリケーションは非常に長い開発過程を経ており、このプロセスの歴史さえも興味深いものです。 網羅的な年代記を装うつもりはありませんが、私が多かれ少なかれ FineReader をフォローしてきた過去 10 年間の主なマイルストーンのみを紹介します。

バージョン主な特徴
2003 7.0 認識精度が最大 25% 向上。 これは表、特に色付きのセルや隠れた仕切りなどを備えた複雑な表に最もよく反映されていました。
2005 8.0 認識アルゴリズムのさらなる最適化は、主にスキャンされた文書ではなくデジタル写真で動作することを目的としています。 そのために、原稿を作成するための追加機能(歪みの除去、線の位置合わせなど)が登場しました。
2007 9.0 ADRT テクノロジーの出現。処理される (複数ページの) ドキュメント全体の論理構造を考慮し、繰り返し要素 (ヘッダーとフッター) を強調表示したり、「流れる」オブジェクト (表) を接続したりすることができます。
2009 10.0 ADRT と認識アルゴリズムがさらに改善され、低解像度のオリジナルの処理精度が最大 30% 向上しました。
2011 11.0 主な注意はプログラムの速度に払われます。 白黒モードの「再臨」。高品質のオリジナルでは最大 30% の追加加速が得られます。

当然のことながら、同じ時期に、FineReader はドキュメント形式のサポートを拡張し、組み込みツールとインターフェイスの改善、オリジナルの構造の再構築の改善などを行いました。ただし、強調表示されている点は OCR テクノロジに直接関連しており、開発プロセスの激動をよく示しています。これは、次の「ブレークスルー」の後に、新しいアルゴリズムを改善するために必要な一定期間の「静寂」が続く、複雑な知識集約型システムの特徴です。 これらは OCR プログラムの主な価値を表すため、それらに関する詳細情報がユーザーに届くことはほとんどありません。 しかし、ABBYY は秘密のベールを解くことに快く同意し、今日私たちは FineReader の神聖なるものを調べる機会を得ました。

基本原則

したがって、OCR は AI の分野に属しているため、開発者が少なくともある程度は私たちの脳の活動を模倣しようと努めるのは論理的です。 もちろん、私たちの視覚システムの構造は信じられないほど複雑ですが、その機能の基本的な「大きなブロック」原理は十分に研究されており、通常、そのうちの 3 つがあります。

  1. 誠実さ- オブジェクトは、その部分と、(視覚的なイメージの場合) それらの間の空間的関係の集合として考えられます。 次に、部分はオブジェクト全体の一部としてのみ解釈されます。 この原則は、仮説を構築して明確にし、可能性の低い仮説をすぐに排除するのに役立ちます。
  2. 目的意識- データの解釈は特定の目標を追求するため、認識はオブジェクトに関する仮説を立て、それらを意図的にテストするプロセスです。 この原則に従ってシステムが動作すると、計算能力がより経済的に使用されるだけでなく、間違いも少なくなります。
  3. 適応性- システムは動作中に蓄積された情報を保存し、それを再利用します。つまり、システム自体が学習します。 この原則により、新しい知識を創造して蓄積し、同じ問題を繰り返し解決することを避けることができます。

FineReader は、文書処理のすべての段階で上記の原則に従って動作する世界で唯一の OCR システムです。 対応するテクノロジーは次のように呼ばれます。 IPA- 英語の用語の最初の文字に従って。 たとえば、完全性の原則によれば、画像の断片は、類似したオブジェクトのすべての構造部分と、特定の関係にある部分が含まれている場合にのみ、シンボルとして解釈されます。 これは、認識された文書内の文字の輪郭の可能性について以前に蓄積された情報に依存して、多数の標準の検索 (多かれ少なかれ適切な標準の検索) を、妥当な数の仮説の的を絞ったテストに置き換えるのに役立ちます。 。

ただし、IPA の原則は、(おそらく) 個々の文字に対応するフラグメントだけでなく、ページのソース画像全体を分析する場合にも適用されます。 ほとんどの OCR システムは、文書の階層構造の認識に基づいています。つまり、ページは、表、画像、テキストのブロックなどの基本的な構造要素に分割され、さらにそれらは他の特徴的なオブジェクト (セル、段落)、およびその他の特徴的なオブジェクトに分割されます。個々のキャラクターに至るまで。

このような分析は、主に 2 つの方法で実行できます。1 つはトップダウン、つまり構成要素から個々の文字に至る方法で、もう 1 つはボトムアップです。 そのうちの 1 つが最もよく使用されますが、ABBYY は特別なアルゴリズムを開発しました MDA(マルチレベル文書分析)、両方を組み合わせたものです。 簡単に説明すると、ページの構造はトップダウン方式で分析され、認識完了後の電子文書の再構築はボトムアップで行われますが、すべてのレベルで追加のフィードバック メカニズムが存在します。 その結果、高レベルのオブジェクトの誤認識に関連する重大なエラーの可能性が大幅に減少します。

ADRT

歴史的に、OCR システムは個々の文字を認識することから発展してきました。 このタスクは依然として最も重要かつ最も困難であり、最も複雑なアルゴリズムがそれに関連付けられています。 しかし、より高いレベルの情報 (たとえば、文書の言語や認識された単語の正しいスペルなど) がこの問題の解決に役立つ可能性があることがすぐに明らかになりました。これが、文脈チェックと辞書チェックが登場した方法です。 その後、書式設定を保持し、文書の物理構造 (さまざまなオブジェクトの相対位置) を再作成したいという要望により、ページ全体の詳細な分析が必要になりました。 これは、複数列レイアウト、表、その他の「非線形」テキスト配置方法を正しく処理するのに役立つため、認識の全体的な品質にも大きな影響を与えることは明らかです。

最新の OCR のほとんどは、文字、単語、ページの 3 つのレベルで正確に動作し、すでに述べたように、トップダウンまたはボトムアップのアプローチを実践します。 しかし、ABBYY は IPA の原則に従って、FineReader に別のレベル、つまり複数ページのドキュメント全体を導入しました。 まず第一に、これは論理構造を正確に再現するために必要でしたが、現代の文書では論理構造はますます複雑になっています。 しかし、追加のボーナスもあります。反復オブジェクトの精度の向上と処理の高速化、ページからページへ「流れる」オブジェクトのより正確な識別 (したがって認識) です。

まさにこれが開発された理由です ADRT(Adaptive Document Recognition Technology) - 論理レベルでの文書の分析と合成のための技術。 最終的には、FineReader の結果をオリジナルとできるだけ似たものにするのに役立ちます。 これを行うために、文書全体の画像が分析され、認識された単語がスタイル、環境、ページ上の位置に応じてグループ (クラスター) に結合されます。 このようにして、プログラムはドキュメント マークアップの「ロジック」を認識し、結果のデザインを統一できるようになります。

ADRT のおかげで、バージョン 9.0 以降の FineReader は、次の構造部分とドキュメントの書式設定要素を検出、認識、再現する方法を学習しました。

  • 本文。
  • ヘッダーとフッター。
  • ページ番号。
  • 同じレベルのヘッダー。
  • 目次;
  • テキストの挿入。
  • 図面のキャプション。
  • テーブル。
  • 脚注;
  • 署名/押印ゾーン。
  • フォントとスタイル。

認識プロセス

MDA アルゴリズムに従って、実際の認識はページ レベルで上から下に始まります。 このプロセスの初期段階で誤った決定が下されるほど、その後の決定でより多くの誤った決定が行われることは明らかです。 このため、認識精度はオリジナルの品質に大きく依存しますが、前処理アルゴリズムも大きな影響を与える可能性があります。 したがって、FineReader でのカラー ドキュメントの人気が高まるにつれて、適応型 2 値化手順が登場しました。 AB)。 透かしがある場合、またはテクスチャまたはカラー素材上にテキストが配置されている場合に、ドキュメントをすぐに白黒モードでスキャンすると、必ず画像上に「ゴミ」が表示され、「ゴミ」から分離するのが非常に困難になります。役に立つ」イメージ(彼に関する元の情報はすでに失われているため)。 そのため、FineReader はカラー イメージまたはグレースケール イメージを処理し、それらを独立して白黒に変換します (このプロセスは 2 値化と呼ばれます)。 しかし、それだけではありません。 テキストと背景の色はページ内、さらには個々の行内で異なる場合があるため、AB はほぼ同じ特徴を持つ単語を識別し、認識品質の観点からそれぞれに最適な 2 値化パラメーターを選択します。 これはまさにアルゴリズムの適応性であり、MDA でのフィードバックの使用例となります。 AB の有効性がソース文書の設計に大きく依存していることは明らかです。ABBYY テストベースでは、このアルゴリズムにより認識精度が 14.5% 向上しました。

しかし、もちろん、最も興味深いのは、認識プロセスが最も低いレベルに下降するときに始まります。 いわゆる線形分割手順では、行が単語に分割され、単語が個々の文字に分割されます。 次に、IPA の原則に従って、一連の仮説 (つまり、これがどのような種類の記号であるか、単語がどのような記号に分割されるかなどについて考えられるオプション) を生成し、それぞれに確率推定値を提供して、それを渡します。文字認識メカニズムの入力に。 後者は、いわゆるいくつかの要素で構成されます。 分類子、それぞれの仮説は、予想される確率の程度によってランク付けされた多数の仮説も生成します。 分類器の最も重要な特性は、正しい仮説の平均位置です。 値が高くなるほど、後続のアルゴリズム (辞書チェックなど) の作業が少なくなるのは明らかです。 しかし、十分に確立された分類器の場合、最初の 3 つの仮説に基づく認識精度、または最初の仮説のみに基づく認識精度などの特性が評価されることが最も多くなります。つまり、大まかに言えば、3 回または 1 回の試行で正解を推測する能力です。 ABBYY は、そのシステムで次のタイプの分類子を使用します: ラスター、フィーチャ、フィーチャ微分、輪郭、構造、構造微分。これらは 2 つの論理レベルでグループ化されます。

動作原理 RK、またはラスター分類子は、文字イメージと標準とのピクセルごとの比較に基づいています。 後者は、トレーニング セットからの画像を平均化した結果として形成され、特定の標準形式に縮小されます。 したがって、要素のサイズ、厚さ、および傾きも、認識された画像に対して事前に正規化されます。 この分類器は、実装の容易さ、動作速度、および画像欠陥に対する耐性を特徴としていますが、精度が比較的低いため、仮説のリストを迅速に生成するための最初の段階で使用されます。

特徴分類子 ( パソコン) は、その名前が示すように、画像内の特定のシンボルの兆候の存在に基づいています。 このような特徴が合計 N 個ある場合、各仮説は N 次元空間内の点で表すことができます。 したがって、仮説の精度は、仮説から標準 (これもトレーニング サンプルで開発された) に対応する点までの距離によって評価されます。 特徴の種類と数が認識の品質を大きく決定することは明らかなので、通常は特徴の種類と数がかなり多くなります。 この分類器も比較的高速で単純ですが、さまざまな画像欠陥に対してあまり堅牢ではありません。 さらに、PC は元の画像ではなく、特定のモデル、抽象化で動作します。つまり、一部の情報は考慮されません。たとえば、いくつかの重要な要素が存在するという事実自体は考慮されません。彼らの相対的な位置に関するものなら何でも。 このため、PC は RK の代わりにではなく、RK と併用して使用されます。

輪郭分類器 ( 品質管理)はPCの特殊なケースであり、元の画像から抽出した目的の文字の輪郭を解析する点が異なります。 一般に、その精度は本格的な PC よりも低くなります。

特徴差分分類器 ( MPC) も PC に似ていますが、「m」と「rn」などの類似したオブジェクトを区別するためにのみ使用されます。 したがって、差異が隠れている領域のみを分析し、元の画像だけでなく、認識の初期段階で形成された仮説も入力として受け取ります。 ただし、その動作原理はパソコンとは少し異なります。 トレーニング段階では、2 つのオプションのそれぞれについて考えられる値の 2 つの「雲」(点のグループ) が N 次元空間に形成され、次に、「雲」を互いに分離する超平面が構築されます。それらから等距離にあります。 認識結果は、元の画像に対応する点がどの半空間に該当するかによって異なります。

MPC 自体は仮説を提示するのではなく、既存の仮説を洗練するだけです (そのリストは一般にバブル法を使用して分類されます)。そのため、その有効性の直接的な評価は行われませんが、間接的に、MPC の特性と同等と見なされます。 OCR 認識の最初のレベル全体。 ただし、選択した機能の正確さと標準サンプルの代表性に依存することは明らかであり、これを保証するのはかなり労力のかかる作業です。

構造微分分類器 ( KFOR) はもともと手書きのテキストを処理するために使用されていました。 そのタスクは、「C」と「G」などの類似したオブジェクトを区別することです。 したがって、SDK は文字の各ペアに特徴的な特徴に基づいており、その学習プロセスは MDC よりもさらに複雑で、その動作速度は以前のすべての分類器よりも遅くなります。

構造分類子 ( SK) は ABBYY の誇りの源であり、元々はいわゆる手書きテキスト、つまり人が「印刷された」文字を書いた場合の認識のために開発されましたが、後に印刷にも使用されました。 これは認識の最終段階で使用され、非常にまれに、つまり、十分に高い確率を持つ少なくとも 2 つの仮説が到達した場合にのみ有効になります。

すべての分類子の定性的特性を次の表にまとめます。 ただし、アルゴリズムは絶対的なものではなく、特定のテスト サンプルの処理に基づいて取得されるため、アルゴリズムの有効性を相互に相対的に評価することしかできません。 認識の最終段階では、文字どおり数パーセントの努力で苦労しているように見えるかもしれませんが、実際には、各分類器が認識精度の向上に大きく貢献します。たとえば、SC はエラーの数を顕著に減らします。 20%。

RKパソコン品質管理MPC*KFOR**SK**
最初の 3 つのオプションの精度、%99,29 99,81 99,30 99,87 99,88 -
最初のオプションによる精度 (%)97,57 99,13 95,10 99,26 99,69 99,73

* ABBYY OCR アルゴリズムの最初のレベル全体の評価
** 適切な分類器を追加した後のアルゴリズム全体の評価

しかし、非常に高い精度にもかかわらず、認識アルゴリズム自体が最終的な決定を下さないのは興味深いことです。 MDA 原則に従って、仮説は各論理レベルで提示され、その数は指数関数的に増加する可能性があります。 したがって、すべての仮説を順番にテストすることが効果的である可能性は低いため、ABBYY OCR システムは仮説を構築する方法、つまり仮説を 1 つまたは別のモデルに割り当てる方法を使用します。 後者には数十の種類があり、ここではそのタイプのほんの一部を紹介します: 辞書の単語、辞書に載っていない単語、アラビア数字、ローマ数字、URL、正規表現 - それぞれに多くの特定のモデル (たとえば、既知の言語 (ラテン語、キリル文字など) のいずれかの単語)。

すべての最終アクションは、モデルを使用して構築された仮説に基づいて実行されます。 たとえば、コンテキスト チェックにより文書の言語が特定され、モデルが間違ったアルファベットを使用する可能性が即座に大幅に減少します。また、辞書チェックにより、特定の文字の不確実な認識におけるエラーが補正されます。たとえば、「turn」という単語は、英語辞書 - 「tum」とは異なります(いずれにせよ、人気のあるものではありません)。 辞書の優先順位はどの分類子よりも高くなりますが、必ずしも最後の手段ではなく、一般にさらなるチェックを停止することはありません。第一に、前述したように、辞書に載っていない単語のモデルがあり、第二に、 、辞書の特別な構成により、未知の単語が特定の言語に属するかどうかを高い確率で推測できます。 ただし、辞書チェック (および辞書の完全性) は認識結果に大きな影響を及ぼし、ABBYY 独自のテストではエラーの数がほぼ半分に減少しました。

OCRだけじゃない

デジタル化と自動処理の観点から興味深いのは、印刷された文書だけではありません。 多くの場合、フォーム、つまり手動で比較的正確に入力される、事前定義された固定フィールドを持つドキュメント (いわゆる手書き文字) を使用する必要があります。さまざまなアンケートがその例として役立ちます。 それらの処理技術には別の名前が付いています - ICR(インテリジェントな文字認識) - OCR とは大きく異なります。 したがって、この場合のタスクはドキュメント全体を再作成することではなく、そこから特定のデータを抽出することなので、必要なフィールドを見つけることと、その内容を実際に認識することという 2 つの主要なサブタスクに分かれます。

これはかなり特殊な領域であり、ABBYY はこれに対応する完全に別個のソフトウェア製品 ABBYY FlexiCapture を提供しています。 これは、自動および半自動システムの作成を目的としており、特別なテンプレートが作成される特定のタイプのドキュメントのカスタマイズが含まれ、ページ上のさまざまなフィールドをインテリジェントに検索してその中のデータを検証できます。ただし、中心となるのは文字認識です。 FineReader で使用されるアルゴリズムと同様のアルゴリズムであり、一般的なスキームは非常に似ています。

ただし、重要な違いがまだあります。構造分類子はプロセスに必須の参加者です。これは手書きのシンボルの特性によるものです。 さらに、ICR には、文字に取り消し線が引かれているかどうか、認識された文字が実際に日付を形成しているかどうかなど、多数の特定の追加チェックが含まれます。

画像からテキストをスキャンして認識するプログラムと、Windows 7 オペレーティング システムへのインストールについて検討します。

ほぼすべてのコンピュータ ユーザーは、後でテキストを認識するために本や雑誌をスキャンしたり、写真などの画像から単純にテキストを認識したりするようなタスクに遭遇したことがあります。 そしておそらく、この種のプログラムの中で最も人気のある (そしておそらく最高の) のは、ロシアの会社 ABBYY の製品、つまり FineReader プログラムです。

現在のところ、この製品の最新バージョンは FineReader 12 です。今日はこのプログラムの機能を見ていきます。 ABBYY FineReader 12 プロフェッショナル、また、このプログラムの試用版を Windows 7 オペレーティング システムにインストールします。

今日の記事は次のように構成したいと思います。まず、このプログラムの機能と利点について説明し、次に、このプログラムがインストールされるコンピューターと OS のシステム要件を分析し、また、 FineReader 12 Professional のインストールと試用版の制限について詳しく説明します。 このプログラムは人気があるため、自宅、友人の家、または職場など、ほとんどの人が少なくとも一度は使用したことがあります。そのため、テキストをスキャンして認識する方法については、特に考慮しません。詳細な手順は公式 Web サイトにあります。ちなみに、公式 Web サイトから試用版をダウンロードすることもできます。現時点でのプログラム ページは次のとおりです - http://www.abbyy.ru/download/finereader /

このページでは、説明書 (ユーザー ガイド) とプログラム自体の試用版の両方をダウンロードできます。これを行うには、右側の [ダウンロード] をクリックします。電子メール アドレスの入力を求められますので、(有効な) を入力します。 1 つは、プログラムをダウンロードするためのリンクがここにあるためです。 メールアドレスを入力後、「送信」をクリックし、メッセージ「 ABBYY 製品にご興味をお持ちいただきありがとうございます。プログラムをダウンロードするためのリンクがあなたの電子メール アドレスに送信されました。」 すぐにメールボックスを確認すると、ダウンロード リンクが記載されたメッセージが届きます。このリンクに従うと、製品のダウンロードが開始されます。 したがって、このプログラムが気に入った場合は、ABBYY Web サイトから購入できます。 このプログラムの入手先がわかったので、その機能と利点について話しましょう。

ABBYY FineReader 12 Professional の機能と利点

ABBYY FineReaderは、すべてのテキストを再入力する必要がなく、画像からテキストを認識するプログラムであり、スキャナーから文書をスキャンする機能も備えています。

この種のプログラム作成の分野では、ABBYY は世界のリーダーであり、非常に多くの賞を受賞しており、FineReader プログラムによれば、このことが競合他社に比べて大きな優位性をもたらしているとのことです。

FineReader プログラムのもう 1 つの特徴は、画像内のテキストを高精度で認識することです。これは、実質的に書式設定する必要がなく、おそらくこれが主な利点です。

ABBYY は、世界 190 の言語をサポートする FineReader を製造しています。これにより、世界中のすべての競合他社よりも有利になります。 Word、Excel、OpenOffice など、認識結果を保存するための多くの形式もサポートしています。 また、JPEG、BMP、PNG、TIFF、GIF、PDF、DJVU、PCX、DCX など、テキストを認識できる多種多様な画像形式もサポートしています。

とりわけ、私にとっては、このプログラムはかなり便利で直感的なインターフェイスを備えているため、初心者のコンピューターユーザーであっても、誰でもこのプログラムを使用できます。

上で述べたように、バージョン 12 は現在すでに利用可能です。このバージョンの革新性と、以前のバージョン 11 と比較した利点について説明しましょう。

まず、当然ながら、バージョン 11 では 188 言語がサポートされていましたが、現在は 190 言語がサポートされていることは注目に値します (おそらく誰かが FineReader が自分の言語にローカライズされる瞬間を待っていたかもしれません :))。

第二に、開発者が言うように、認識速度が向上し、追加機能が追加されました:背景のページの認識、複数ページの文書の即時オープン、画像の不要な部分の自動トリミング、シールやマークの削除Office 文書の認識品質を向上させるために、脚注、ヘッダー、目次などの構造要素を無効にする機能が追加され、結果確認ウィンドウのテキストを書式設定するツールも追加されました。

開発者によると、既存の機能の一部が改善および最適化されており、全体的には十分な変更が加えられています。

ABBYY FineReader 12 Professional の試用版の制限事項

FineReader 12 プログラムの試用版 (サイズは 351 MB) をダウンロードしてコンピュータにインストールすると、有効期間は 30 日間になります。また、100 ページのみ認識し、それ以上の結果は保存できません。ドキュメントから一度に 3 ページ以上。 実際、これだけでもこのプログラムのメリットを理解していただくには十分です。

このプログラムに満足したら、公式 Web サイトで購入してアクティブ化できます。 コストについて言えば、ABBYY FineReader 12 Professional には 2 つのタイプのライセンスがあり、これはサブスクリプションによるものです。 年間ライセンスと永久ライセンス、つまり これを最後にきっぱりと。

今のところ:

  • 年間ライセンスの料金は 1,990 ルーブルです。 (ダウンロード版)。
  • 永久ライセンスの価格は 4,990 ルーブルです。 (パッケージ版)と4490こすります。 (ダウンロード版)。

どちらが適しているかはあなたが決めることですが、ご覧のとおり、特に何かを積極的にスキャンし、写真を撮ってテキストを認識する場合、コストはそれほど高くありません。

ABBYY FineReader 12 Professional をインストールするためのシステム要件

ABBYY FineReader 12 Professional は、Windows XP、Windows Vista、Windows 7、Windows 8/8.1、Windows Server 2003/2008/2008 R2/2012/2012 R2 のオペレーティング システムをサポートしています。

開発者によると、FineReader 12 Professional をインストールするには、1 GHz 以上のプロセッサ クロック速度、1024 MB の RAM、および 850 MB の空きディスク容量を備えたコンピュータが必要です。 ソフトウェア製品をアクティブ化するには、インターネット接続と、解像度が 1280×1024 ピクセル以上のモニターも推奨されます。

Windows 7 への ABBYY FineReader 12 Professional のインストール

ステップ1

プログラムをダウンロードすると、ファイルが作成されます ABBYY_FineReader_12_Professional.exeをダブルクリックするなどして、それに応じて起動します。 続いて、インストールファイルを解凍するためのウィンドウが開くので、「」をクリックします。 インストール»


開梱が始まります


ステップ2

次に、直接インストール メニューが表示されます。パッケージ版を購入した場合、ディスク メニューはまったく同じになります。 クリック " ABBYY FineReader 12 のインストール»


ステップ3

次に、プログラム言語を選択する必要があります。デフォルトでは、インストーラーが正しく決定しているため、すぐに「」をクリックします。 わかりました»

ステップ4


ステップ5

次に、私たちは初心者ユーザーなので、インストールモードを選択します。 通常「」をクリックして「」 さらに遠く»


ステップ6

このステップでは、これを選択する必要があります。たとえば、初期設定です。たとえば、次のようにチェックボックスをオンにして、「」をクリックします。 インストール»


そしてインストールが始まりました



ステップ7

インストールは長くは続かず、約 5 分かかります。最後に、インストールが完了したことを通知するウィンドウが表示されます。「」をクリックします。 準備ができて»


ステップ8

すべてのインストールが完了すると、プログラムを起動するためのショートカットがデスクトップに表示されます。それに応じてプログラムを起動します。

試用版を起動するたびに、ライセンスの購入を求めるウィンドウが表示されますが、まだ試しているので、「」をクリックします。 プログラムを実行する»

そして最後に、プログラム自体が開き、先ほども述べたように、優れたインターフェイスに感心することができます。


ここで終わりにしたいと思いますが、詳細なユーザー マニュアルは ABBYY Web サイトからダウンロードできることをもう一度思い出させてください。 さて、今のところはここまでです! 幸運を!