DocFetcher

DocFetcher の概要や使い方を紹介しています

DocFetcher を紹介しているページです
 はてなブックマークに追加  Twitter でつぶやく  Facebook でシェア  mixi でつぶやく  google+ で共有  Pocket に登録

オフィスドキュメント、PDF、EPUB、SVG、Exif 情報... 等々にも対応したGrep ツール!「DocFetcher」。

DocFetcher

● DocFetcher

幅広いフォーマットに対応したファイル内文字列検索ツール。
コンテンツ内に特定の文字列を含むファイルを、超高速に検索してリストアップすることができます。
対応しているフォーマットは、DOC / XLS / PPT などの Office 系ファイルや、Outlook のPST ファイル、Visio のVSD ファイル、PDF / EPUB / RTF / CHM / SVG / HTML / 各種テキストファイル(TXT / JAVA / CPP / PY 等)、MP3 / FLAC(メタデータ)、JPEG ファイル(Exif 情報)。

「DocFetcher」は、多形式に対応したファイル内文字列検索ツールです。

  • Microsoft Office - doc / xls / ppt
  • Microsoft Office 2007 以降 - docx / xlsx / pptx / docm / xlsm / pptm
  • Microsoft Outlook - pst
  • Microsoft Visio - vsd
  • OpenOffice.org - odt / ods / odg / odp / ott / ots / otg / otp
  • RTF
  • AbiWord - abw / abw.gz / zabw
  • PDF
  • EPUB
  • HTML - html / xhtml
  • プレーンテキスト※1
  • CHM
  • MP3 (メタデータ)
  • FLAC(メタデータ)
  • JPEG (Exif 情報)
  • SVG
といったファイル内の文字列検索に対応したGrep ツールで、上記の通り幅広いフォーマットに対応しているところが最大の特徴※2
※1 プレーンテキストとみなす拡張子は、ユーザーが指定することができる。
txt / java / cpp / py... など。

※2 7z / RAR / ZIP / TAR.* といったアーカイブ内のファイル(内の文字列)を検索することも可能。
検索の際には、検索対象とするファイルのフォーマットやサイズを指定することができ、検索結果のファイルに関しては、内蔵ブラウザでプレビュー表示してみる※3 ことが可能となっています。
※3 キーワードを含む部分を、ハイライトして表示させる機能もある。
普段、オフィス系のファイルやRTF、PDF などを扱う機会が多い人におすすめです。
ちなみに、指定したフォルダ / アーカイブ 内のファイルをインデックス化(データベース化)し、そのインデックスを元にテキスト検索を行うため、検索速度は超高速。
必要に応じて、インデックスに含めないファイルを指定したり※4、未対応のファイルでもファイル名のみインデックスしたりする※5 ことが可能となっています。
※4 正規表現で指定することができる。
※5 未対応のファイルであっても、ファイル名だけは検索できるようにする... という機能。

使い方は以下の通り。
このソフトを使用するには、「Java ランタイム」をインストールしている必要があります。

  1. 「DocFetcher.exe」を実行します。
  2. メイン画面が表示されます。
    DocFetcher

  3. インデックスの作成
  4. まず、画面左下にある「Search Scope」欄上で右クリックし、「Create Index From」からデータベース化するアイテムを選択します。
    データベース化するアイテムは、
    • Folder - フォルダ内のファイル
    • Archive - アーカイブ(7z / RAR / ZIP / TAR.*)内のファイル
    • Outlook PST - PST ファイル
    • Clipboard - クリップボードにコピー中のファイル
    の中から選ぶことができます。
  5. 「Folder」を選択した場合「フォルダーの参照」ダイアログが表示されるので、データベース化したいファイルが入っているフォルダを選択します。
    「Archive」「Outlook PST」を選択した場合は「ファイルを開く」ダイアログが表示されるので、データベース化したいファイルが入っているアーカイブか、PST ファイルを選択します。
  6. 続いて「Indexing Queue」という画面が表示されます。
    Indexing Queue
    そのまま右下の「Run」ボタンを押してもOK ですが、必要であれば各種オプションの設定を行っておきます。
    実際に設定できるオプションには、次のようなものがあります。
      File extensions
    • Plain text - プレーンテキストと見なすファイル(の拡張子)
    • Zip archive - ZIP アーカイブと見なすファイル(の拡張子)
    • Exclude files / detect mime type
      除外するファイル、および、MIME タイプの確認を行うファイル。
      右側にある Add Patern ボタンをクリックし、
      • Pattern (regex) - 処理対象とするファイルの名前(正規表現で指定する)
      • Match Against - 参照する部分
        • Filename - ファイル名
        • Absolute path - ファイルパス
      • Action - 条件と一致するアイテムに対して行うアクション
        • Exclude - インデックスから除外する
        • Detect mime type - MINE タイプの検出を行う
      といったオプションの設定を行う。
      MIME タイプの検出を行うと、拡張子が間違っていても正確なフォーマットを判別できるようになる。
    • Index HTML pairs as single documents
      HTML ファイルと関連付いている「_files」フォルダは、紐付いているHTML ファイルの一部と見なす
    • Detect executable zip and 7z archives (slower)
      自己解凍書庫(ZIP / 7z 形式)内のファイルもインデックスする
    • Index filename even if file contents can't be extracted
      ファイル内の文書を抽出できなかった場合でも、ファイル名はインデックスする
  7. 選択したフォルダやファイルのデータベース化処理が開始されるので、しばらく待ちます。
  8. 少し待ち、「Indexing Queue」画面が消えたらデータベース化処理完了です※6
    ※6 何らかのエラーがあった場合、画面上部のタブにエラーマーク( エラーマーク )が表示される。
    エラーがあった場合、「Indexing Queue」画面は自動で消えないので、手動で閉じる必要がある。

    データベース化したいフォルダやファイルが他にも存在する場合は、同様の手順で登録処理を行います。
  9. データベース化されたアイテムは、画面左下の「Search Scope」欄にツリー形式でリスト表示されます。
    ここで任意のアイテムを右クリックすることにより、
    • Update Index - インデックスを更新
    • Rebuild Index※7 - インデックスを再構築
    • Remove Index - インデックスを削除
    • Remove orphaned Index - パスが存在しないものを削除
    • List Documents※8 - フォルダ / ファイル 内のアイテムを、リスト表示
    といった操作を行うこともできたりします。
    アイテムの右クリックメニュー
    ※7 「Indexing Queue」画面から操作をやり直すことができる。
    ※8 右上のペインに、リスト形式で一覧表示される。
    検索を実行
  1. 画面左上の「Minimum / Maximum Filesize」欄で、検索対象とするファイルのサイズを範囲指定します※9
    DocFetcher
    ※9 最小 ~ 最大 サイズを指定する。
    ファイルサイズを指定しない場合は、空欄のままでよい。
  2. その下にある「Document Types」欄で、検索対象とするファイルフォーマットにチェックを入れておきます。
  3. 左下の「Search Scope」欄で、検索対象とする場所にチェック。
  4. 右側ペインの上部にあるテキスト入力フォームに、検索キーワードを入力して「Search」ボタンをクリックします※10
    ※10 フォーム右端の ▼ をクリックすることで、過去に入力したキーワードを呼び出すこともできる。
  5. 入力されたキーワードを含むファイルが、リスト形式で一覧表示されます※11
    ※11 リスト上で任意のファイルを右クリックすると、「Open(関連付けソフトで開く)」「Open Parent Folder(格納フォルダを開く)」「Copy(コピー)」といった操作を行うことができる。
    ここで任意のファイルを選択することにより、該当ファイルの内容を右下ペインでプレビュー表示してみることができます。
    (プレビュー画面上では、選択したテキストをコピーすることができる)
    選択中のファイルがHTML である場合、プレビューペインの右上にある Use Embedded HTML Viewer ボタンをクリックすることで、HTML のレンダリングをON / OFF することも可能です。
  6. 尚、メイン画面の右上にある Preferences ボタンをクリックすることで、各種オプションの設定を行うこともできます。
    オプション画面
    実際に設定できるオプションには、次のようなものがあります。
    • Show manual on startup
      起動時にマニュアルを表示する
    • Use OR operator as default in queries (instead of AND)
      検索キーワードを半角スペースで区切った時に、AND 検索ではなくOR 検索を行う
    • Automatically scroll to first match in preview pane
      検索結果のファイルを選択した時、キーワードを含む部分へ自動でスクロールする
    • Hide program in System Tray after opening files
      検索結果のファイルを開いた時、「DocFetcher」をタスクトレイに最小化させる
    • When closing program window, hide in System Tray instead of exiting
      ウインドウを閉じた時に、タスクトレイに最小化させる
    • Clear search history on exit
      「DocFetcher」を終了する時、履歴をクリアする
    • Highlight color
      ハイライトカラー
    • Preview font (normal):
      プレビュー画面上で使用するフォント
    • Preview font (fixed width)
      プレビュー画面上で使用するフォント(プレーンテキスト用)
    • Global hotkey
      「DocFetcher」を最前面に表示させるホットキー

 はてなブックマークに追加  Twitter でつぶやく  Facebook でシェア  mixi でつぶやく  google+ で共有  Pocket に登録
DocFetcher TOPへ
スポンサード リンク
 おすすめフリーソフト
 Media Player Classic Homecinema

高機能なマルメディアプレイヤー

 えこでこツール

各種動画ファイルから、音声を抽出する

 Macrium Reflect Free Edition

指定したドライブを、丸ごと完全にバックアップ

 IrfanView

多機能なマルチメディアビューア

 VidCutter

各種動画ファイルを、無劣化で高速にカット編集

 Windows DVD メーカー

超簡単に使えるDVD 変換ソフト

 Volume Control for HTML5 Video & Audio Tag

各タブの音量 / 再生状態 / 音質 等を、一元的に管理できるようにする Chrome 拡張& Firefox アドオン

 AVG AntiVirus Free 18

常駐監視型のウイルス&スパイウェア対策ソフト

 Avast Free Antivirus 18

豊富な機能を備えた常駐監視型のアンチウイルス

 WebP Codec

WebP 形式の画像ファイルを、Windows 上で普通に表示できるようにするソフト

 Default Bookmark Folder

“ デフォルトのブックマーク先フォルダ ” を設定可能にする Firefox アドオン

 アマゾン注文履歴フィルタ

Amazon の注文履歴や領収書を、月別にフィルタして表示できるようにする Chrome 拡張& Firefox アドオン

 おすすめフリーソフト
 TuxGuitar

タブ譜& 五線譜 を使って作曲することができるソフト

 Pasteasy

パソコン ⇔ iPhone / iPad / Android 間で、クリップボードの中身を共有

 Win Updates Disabler

Windows Updates の有効化 / 無効化 を、手軽に切り替えられるようにする

 Screenpresso

高度な画像編集機能を備えたスクリーンキャプチャーツール

スポンサードリンク

DocFetcher を紹介しているページです