よみ姫使い方その19 段落改行

点訳用のテキストを取り出すのに便利な段落改行

一般的に、OCRソフトウェアは、印刷物の認識結果であるテキストを、印刷のレイアウトに従って出力します。 しかし、「よみ姫」では、原文を解釈して、内容の区切り目と思われる部分での改行のみを残すことができます。 これにより、認識結果を自動点訳などの2次的な翻訳作業にゆだねる場合に、そのためのテキストの前処理作業が大幅に軽減されます。

[段落ごとの改行モード]

Ctrlキーを押しながらF8キーを押すことにより、「段落ごとに改行する」モードに設定することができます。 この設定にしておくと、「スキャンリード」または「スキャン認識」を行った直後の内部文書は、レイアウトを示す改行コードが削除され、段落ごとに改行されている状態になります。つまり、1行の長さが行によって異なる状態になります。 この状態でフロッピーディスクに保存すれば、自動点訳ソフト「EXTRA」などで点字・データに変換する際に、墨字レイアウト上での改行コードを削除するという作業をする必要が無くなり、前処理編集作業の手間が大幅に軽減されます。

[レイアウト改行削除]

いったん「印刷通りに改行する」モードでスキャンした文書でも、フルキーの/(スラッシュ)を2回押すことにより、レイアウト改行を削除して、段落ごとの改行状態にすることができます。 さらに、この機能は、フロッピーなどに保存されたテキストファイルを読み込んだ時にも働きますので、レイアウト改行で折り返しのついたメール文書などのレイアウト改行を取りたい場合にも利用できます。

使い方その18 連続スキャンと一括認識へ戻る

使い方その20 白抜き文字を認識する方法へ