会社概要 製品 メルマガ ショップ ショップ利用規約 特商法表記 お知らせ よくある質問 連絡窓口 リンク
情報氾濫時代のリスク回避
情報保護の必須アイテム
あきらめていたファイルの文字データの抽出に挑戦
ダイジェスト ソフトウエア一覧 トップページ

破損したファイルなどの
文字列を抽出


製品及び事業(抽出)
1 機能と特徴のまとめ
2 想定用途
3 マニュアル
4 動作機種など
5 試用版
6 必ずお読み下さい
7 ソフトウェア使用許諾契約書
8 免責事項
9 更新履歴
10 サポート
11 よくある質問
12 購入方法
申込

抽出 Version 8.3.30
1ライセンス価格(税込)
2,100円
T 機能概要

 本製品は、ファイルの中に含まれる無変換の文字データを抽出し、任意の場所に新規ファイルを作成して抽出したテキストデータを書き込みます。
 暗号化、圧縮など変換をしていないシフトJISまたはユニコード(UTF16、UTF8)文字が含まれていることを条件に、
どのようなファイル形式にも対応しています。

U 抽出可能な文字コード
  1. シフトJIS
  2. ユニコード(UTF16、リトルエンディアン
    MS Access のテーブルのフィールドに Unicode 圧縮を設定した場合など、ソフトによっては2バイトのユニコードのうちの1バイトを省略可能時には省略する機能を有するものがあります。
    本製品ではこの機能を「ユニコード圧縮」と呼び、それを考慮して抽出するオプションを設けています。
  3. ユニコード(UTF16、ビッグエンディアン
  4. ユニコード(UTF8)
V 抽出条件

 本製品のオプションを選択することで以下の条件で抽出することが可能となります。
  1. 半角英数半角記号のみ抽出
    目的の文字が、半角英数、半角記号のみの場合は、必ず「半角英数、半角記号のみ抽出」にチェックを付けてください。付けない場合より正確な結果が得られる可能性があります。
  2. Tabは無視
    Tab情報を必要としない場合は、必ず「Tab は無視」にチェックを付けてください。付けない場合より正確な結果が得られる可能性があります。
  3. 最低連続バイト
    文字として有効なデータがこの数値以上連続して出現しない場合は無視します。
    この数値を大きくすると、無意味な文字は減り、目的の文字を探し易くなる反面、目的の文字が抽出されない可能性もあります。
  4. 抽出文字コード
    抽出元ファイルに含まれる抽出文字コードが判らない場合は、全てにチェックを付けたまま抽出し、抽出後に生成されたテキストファイルを順次開いて目的の文字を探しください。
    抽出先のあるファイルの中に目的と思われる情報が見つかったとしても、他のファイルの中により正確な情報が含まれる場合がありますので、見落とさないようご注意ください。
    また、最も正確な情報が部分によって複数のテキストファイルに分散することもありますのでご注意ください。
W 抽出例 

 下記のファイル形式は、弊社にて
抽出に成功した例の一部です。
  1. MS Word(シフトJIS、ユニコード(UTF16、リトルエンディアン))
  2. MS Exel(ユニコード(UTF16、リトルエンディアン))
  3. MS Access(ユニコード(UTF16、リトルエンディアン))
  4. MS PowerPoint(ユニコード(UTF16、リトルエンディアン))
  5. MS SQLサーバ(ユニコード(UTF16、リトルエンディアン))
  6. JS 一太郎(UTF16、ビッグエンディアン)
  7. オラクル(シフトJIS)
    ※上記の例のファイル形式でも、無変換の対応文字コードが含まれていない場合は、意味のある文字は抽出できませんのでご注意ください。例えば、オラクルでは文字コードが選択できますので、対応文字コード以外の文字コードで書き込まれている場合は無意味な文字しか抽出されません。
     
Copyright 2006 株式会社ハイセライト