DocFetcher

LINE シェアポストブックマーク 4 お気に入り

オフィスドキュメント、PDF、EPUB、SVG、Exif 情報... 等々にも対応したGrep ツール！「DocFetcher」。

DocFetcher

スクリーンショット

2.84 / 5 （31 票）

制作者　DocFetcher Development Team

対応　Vista/7/8/10

バージョン　1.1.25

更新日時　2021-05-25

ファイルサイズ　73.9 MB

幅広いフォーマットに対応したファイル内文字列検索ツール。
コンテンツ内に特定の文字列を含むファイルを、超高速に検索してリストアップすることができます。
対応しているフォーマットは、DOC / XLS / PPT などの Office 系ファイルや、Outlook のPST ファイル、Visio のVSD ファイル、PDF / EPUB / RTF / CHM / SVG / HTML / 各種テキストファイル（TXT / JAVA / CPP / PY 等）、MP3 / FLAC（メタデータ）、JPEG ファイル（Exif 情報）。

「DocFetcher」は、多形式に対応したファイル内文字列検索ツールです。

Microsoft Office　-　doc / xls / ppt
Microsoft Office 2007 以降　-　docx / xlsx / pptx / docm / xlsm / pptm
Microsoft Outlook　-　pst
Microsoft Visio　-　vsd
OpenOffice.org　-　odt / ods / odg / odp / ott / ots / otg / otp
RTF
AbiWord　-　abw / abw.gz / zabw
PDF
EPUB
HTML　-　html / xhtml
プレーンテキスト※1
CHM
MP3 （メタデータ）
FLAC（メタデータ）
JPEG （Exif 情報）
SVG

といったファイル内の文字列検索に対応したGrep ツールで、上記の通り幅広いフォーマットに対応しているところが最大の特徴※2。
1 プレーンテキストとみなす拡張子は、ユーザーが指定することができる。
txt / java / cpp / py... など。
2 7z / RAR / ZIP / TAR.* といったアーカイブ内のファイル（内の文字列）を検索することも可能。
検索の際には、検索対象とするファイルのフォーマットやサイズを指定することができ、検索結果のファイルに関しては、内蔵ブラウザでプレビュー表示してみる※3 ことが可能となっています。
3 キーワードを含む部分を、ハイライトして表示させる機能もある。
普段、オフィス系のファイルやRTF、PDF などを扱う機会が多い人におすすめです。
ちなみに、指定したフォルダ / アーカイブ内のファイルをインデックス化（データベース化）し、そのインデックスを元にテキスト検索を行うため、検索速度は超高速。
必要に応じて、インデックスに含めないファイルを指定したり※4、未対応のファイルでもファイル名のみインデックスしたりする※5 ことが可能となっています。
4 正規表現で指定することができる。
5 未対応のファイルであっても、ファイル名だけは検索できるようにする... という機能。

使い方は以下の通り。
このソフトを使用するには、「Java ランタイム」をインストールしている必要があります。

インデックスの作成
検索を実行

インデックスの作成

「DocFetcher.exe」を実行します。
メイン画面が表示されます。
まず、画面左下にある「Search Scope」欄上で右クリックし、「Create Index From」からデータベース化するアイテムを選択します。
データベース化するアイテムは、
- Folder　-　フォルダ内のファイル
- Archive　-　アーカイブ（7z / RAR / ZIP / TAR.*）内のファイル
- Outlook PST　-　PST ファイル
- Clipboard　-　クリップボードにコピー中のファイル
の中から選ぶことができます。
「Folder」を選択した場合「フォルダーの参照」ダイアログが表示されるので、データベース化したいファイルが入っているフォルダを選択します。
「Archive」「Outlook PST」を選択した場合は「ファイルを開く」ダイアログが表示されるので、データベース化したいファイルが入っているアーカイブか、PST ファイルを選択します。
続いて「Indexing Queue」という画面が表示されます。

そのまま右下の「Run」ボタンを押してもOK ですが、必要であれば各種オプションの設定を行っておきます。
実際に設定できるオプションには、次のようなものがあります。
- Plain text　-　プレーンテキストと見なすファイル（の拡張子）
- Zip archive　-　ZIP アーカイブと見なすファイル（の拡張子）
- Exclude files / detect mime type
  除外するファイル、および、MIME タイプの確認を行うファイル。
  右側にあるボタンをクリックし、
  - Pattern (regex)　-　処理対象とするファイルの名前（正規表現で指定する）
  - Match Against　-　参照する部分
    - Filename　-　ファイル名
    - Absolute path　-　ファイルパス
  - Action　-　条件と一致するアイテムに対して行うアクション
    - Exclude　-　インデックスから除外する
    - Detect mime type　-　MINE タイプの検出を行う
  といったオプションの設定を行う。
  MIME タイプの検出を行うと、拡張子が間違っていても正確なフォーマットを判別できるようになる。
- Index HTML pairs as single documents
  HTML ファイルと関連付いている「_files」フォルダは、紐付いているHTML ファイルの一部と見なす
- Detect executable zip and 7z archives (slower)
  自己解凍書庫（ZIP / 7z 形式）内のファイルもインデックスする
- Index filename even if file contents can't be extracted
  ファイル内の文書を抽出できなかった場合でも、ファイル名はインデックスする
選択したフォルダやファイルのデータベース化処理が開始されるので、しばらく待ちます。
少し待ち、「Indexing Queue」画面が消えたらデータベース化処理完了です※6。
6 何らかのエラーがあった場合、画面上部のタブにエラーマーク（）が表示される。
エラーがあった場合、「Indexing Queue」画面は自動で消えないので、手動で閉じる必要がある。
データベース化したいフォルダやファイルが他にも存在する場合は、同様の手順で登録処理を行います。
データベース化されたアイテムは、画面左下の「Search Scope」欄にツリー形式でリスト表示されます。
ここで任意のアイテムを右クリックすることにより、
- Update Index　-　インデックスを更新
- Rebuild Index※7　-　インデックスを再構築
- Remove Index　-　インデックスを削除
- Remove orphaned Index　-　パスが存在しないものを削除
- List Documents※8　-　フォルダ / ファイル内のアイテムを、リスト表示
といった操作を行うこともできたりします。

7 「Indexing Queue」画面から操作をやり直すことができる。
8 右上のペインに、リスト形式で一覧表示される。

目次へ戻る

検索を実行

画面左上の「Minimum / Maximum Filesize」欄で、検索対象とするファイルのサイズを範囲指定します※9。

9 最小～最大サイズを指定する。
ファイルサイズを指定しない場合は、空欄のままでよい。
その下にある「Document Types」欄で、検索対象とするファイルフォーマットにチェックを入れておきます。
左下の「Search Scope」欄で、検索対象とする場所にチェック。
右側ペインの上部にあるテキスト入力フォームに、検索キーワードを入力して「Search」ボタンをクリックします※10。
10 フォーム右端の ▼ をクリックすることで、過去に入力したキーワードを呼び出すこともできる。
入力されたキーワードを含むファイルが、リスト形式で一覧表示されます※11。
11 リスト上で任意のファイルを右クリックすると、「Open（関連付けソフトで開く）」「Open Parent Folder（格納フォルダを開く）」「Copy（コピー）」といった操作を行うことができる。
ここで任意のファイルを選択することにより、該当ファイルの内容を右下ペインでプレビュー表示してみることができます。
（プレビュー画面上では、選択したテキストをコピーすることができる）
選択中のファイルがHTML である場合、プレビューペインの右上にあるボタンをクリックすることで、HTML のレンダリングをON / OFF することも可能です。
尚、メイン画面の右上にあるボタンをクリックすることで、各種オプションの設定を行うこともできます。

実際に設定できるオプションには、次のようなものがあります。
- Show manual on startup
  起動時にマニュアルを表示する
- Use OR operator as default in queries (instead of AND)
  検索キーワードを半角スペースで区切った時に、AND 検索ではなくOR 検索を行う
- Automatically scroll to first match in preview pane
  検索結果のファイルを選択した時、キーワードを含む部分へ自動でスクロールする
- Hide program in System Tray after opening files
  検索結果のファイルを開いた時、「DocFetcher」をタスクトレイに最小化させる
- When closing program window, hide in System Tray instead of exiting
  ウインドウを閉じた時に、タスクトレイに最小化させる
- Clear search history on exit
  「DocFetcher」を終了する時、履歴をクリアする
- Highlight color
  ハイライトカラー
- Preview font (normal):
  プレビュー画面上で使用するフォント
- Preview font (fixed width)
  プレビュー画面上で使用するフォント（プレーンテキスト用）
- Global hotkey
  「DocFetcher」を最前面に表示させるホットキー