DocFetcher

DocFetcher の概要や使い方を紹介しています

DocFetcher を紹介しているページです
 はてなブックマークに追加  Twitter でつぶやく  Facebook でシェア  mixi でつぶやく  google+ で共有  Pocket に登録

オフィスドキュメント、PDF、EPUB、SVG、Exif 情報... 等々にも対応したGrep ツール!「DocFetcher」。

DocFetcher

● DocFetcher

幅広いフォーマットに対応したファイル内文字列検索ツール。
コンテンツ内に特定の文字列を含むファイルを、超高速に検索してリストアップすることができます。
対応しているフォーマットは、DOC / XLS / PPT などの Office 系ファイルや、Outlook のPST ファイル、Visio のVSD ファイル、PDF / EPUB / RTF / CHM / SVG / HTML / 各種テキストファイル(TXT / JAVA / CPP / PY 等)、MP3 / FLAC(メタデータ)、JPEG ファイル(Exif 情報)。

「DocFetcher」は、多形式に対応したファイル内文字列検索ツールです。

  • Microsoft Office - doc / xls / ppt
  • Microsoft Office 2007 以降 - docx / xlsx / pptx / docm / xlsm / pptm
  • Microsoft Outlook - pst
  • Microsoft Visio - vsd
  • OpenOffice.org - odt / ods / odg / odp / ott / ots / otg / otp
  • RTF
  • AbiWord - abw / abw.gz / zabw
  • PDF
  • EPUB
  • HTML - html / xhtml
  • プレーンテキスト※1
  • CHM
  • MP3 (メタデータ)
  • FLAC(メタデータ)
  • JPEG (Exif 情報)
  • SVG
といったファイル内の文字列検索に対応したGrep ツールで、上記の通り幅広いフォーマットに対応しているところが最大の特徴※2
※1 プレーンテキストとみなす拡張子は、ユーザーが指定することができる。
txt / java / cpp / py... など。

※2 7z / RAR / ZIP / TAR.* といったアーカイブ内のファイル(内の文字列)を検索することも可能。
検索の際には、検索対象とするファイルのフォーマットやサイズを指定することができ、検索結果のファイルに関しては、内蔵ブラウザでプレビュー表示してみる※3 ことが可能となっています。
※3 キーワードを含む部分を、ハイライトして表示させる機能もある。
普段、オフィス系のファイルやRTF、PDF などを扱う機会が多い人におすすめです。
ちなみに、指定したフォルダ / アーカイブ 内のファイルをインデックス化(データベース化)し、そのインデックスを元にテキスト検索を行うため、検索速度は超高速。
必要に応じて、インデックスに含めないファイルを指定したり※4、未対応のファイルでもファイル名のみインデックスしたりする※5 ことが可能となっています。
※4 正規表現で指定することができる。
※5 未対応のファイルであっても、ファイル名だけは検索できるようにする... という機能。

使い方は以下の通り。
このソフトを使用するには、「Java ランタイム」をインストールしている必要があります。

  1. 「DocFetcher.exe」を実行します。
  2. メイン画面が表示されます。
    DocFetcher

  3. インデックスの作成
  4. まず、画面左下にある「Search Scope」欄上で右クリックし、「Create Index From」からデータベース化するアイテムを選択します。
    データベース化するアイテムは、
    • Folder - フォルダ内のファイル
    • Archive - アーカイブ(7z / RAR / ZIP / TAR.*)内のファイル
    • Outlook PST - PST ファイル
    • Clipboard - クリップボードにコピー中のファイル
    の中から選ぶことができます。
  5. 「Folder」を選択した場合「フォルダーの参照」ダイアログが表示されるので、データベース化したいファイルが入っているフォルダを選択します。
    「Archive」「Outlook PST」を選択した場合は「ファイルを開く」ダイアログが表示されるので、データベース化したいファイルが入っているアーカイブか、PST ファイルを選択します。
  6. 続いて「Indexing Queue」という画面が表示されます。
    Indexing Queue
    そのまま右下の「Run」ボタンを押してもOK ですが、必要であれば各種オプションの設定を行っておきます。
    実際に設定できるオプションには、次のようなものがあります。
      File extensions
    • Plain text - プレーンテキストと見なすファイル(の拡張子)
    • Zip archive - ZIP アーカイブと見なすファイル(の拡張子)
    • Exclude files / detect mime type
      除外するファイル、および、MIME タイプの確認を行うファイル。
      右側にある Add Patern ボタンをクリックし、
      • Pattern (regex) - 処理対象とするファイルの名前(正規表現で指定する)
      • Match Against - 参照する部分
        • Filename - ファイル名
        • Absolute path - ファイルパス
      • Action - 条件と一致するアイテムに対して行うアクション
        • Exclude - インデックスから除外する
        • Detect mime type - MINE タイプの検出を行う
      といったオプションの設定を行う。
      MIME タイプの検出を行うと、拡張子が間違っていても正確なフォーマットを判別できるようになる。
    • Index HTML pairs as single documents
      HTML ファイルと関連付いている「_files」フォルダは、紐付いているHTML ファイルの一部と見なす
    • Detect executable zip and 7z archives (slower)
      自己解凍書庫(ZIP / 7z 形式)内のファイルもインデックスする
    • Index filename even if file contents can't be extracted
      ファイル内の文書を抽出できなかった場合でも、ファイル名はインデックスする
  7. 選択したフォルダやファイルのデータベース化処理が開始されるので、しばらく待ちます。
  8. 少し待ち、「Indexing Queue」画面が消えたらデータベース化処理完了です※6
    ※6 何らかのエラーがあった場合、画面上部のタブにエラーマーク( エラーマーク )が表示される。
    エラーがあった場合、「Indexing Queue」画面は自動で消えないので、手動で閉じる必要がある。

    データベース化したいフォルダやファイルが他にも存在する場合は、同様の手順で登録処理を行います。
  9. データベース化されたアイテムは、画面左下の「Search Scope」欄にツリー形式でリスト表示されます。
    ここで任意のアイテムを右クリックすることにより、
    • Update Index - インデックスを更新
    • Rebuild Index※7 - インデックスを再構築
    • Remove Index - インデックスを削除
    • Remove orphaned Index - パスが存在しないものを削除
    • List Documents※8 - フォルダ / ファイル 内のアイテムを、リスト表示
    といった操作を行うこともできたりします。
    アイテムの右クリックメニュー
    ※7 「Indexing Queue」画面から操作をやり直すことができる。
    ※8 右上のペインに、リスト形式で一覧表示される。
    検索を実行
  1. 画面左上の「Minimum / Maximum Filesize」欄で、検索対象とするファイルのサイズを範囲指定します※9
    DocFetcher
    ※9 最小 ~ 最大 サイズを指定する。
    ファイルサイズを指定しない場合は、空欄のままでよい。
  2. その下にある「Document Types」欄で、検索対象とするファイルフォーマットにチェックを入れておきます。
  3. 左下の「Search Scope」欄で、検索対象とする場所にチェック。
  4. 右側ペインの上部にあるテキスト入力フォームに、検索キーワードを入力して「Search」ボタンをクリックします※10
    ※10 フォーム右端の ▼ をクリックすることで、過去に入力したキーワードを呼び出すこともできる。
  5. 入力されたキーワードを含むファイルが、リスト形式で一覧表示されます※11
    ※11 リスト上で任意のファイルを右クリックすると、「Open(関連付けソフトで開く)」「Open Parent Folder(格納フォルダを開く)」「Copy(コピー)」といった操作を行うことができる。
    ここで任意のファイルを選択することにより、該当ファイルの内容を右下ペインでプレビュー表示してみることができます。
    (プレビュー画面上では、選択したテキストをコピーすることができる)
    選択中のファイルがHTML である場合、プレビューペインの右上にある Use Embedded HTML Viewer ボタンをクリックすることで、HTML のレンダリングをON / OFF することも可能です。
  6. 尚、メイン画面の右上にある Preferences ボタンをクリックすることで、各種オプションの設定を行うこともできます。
    オプション画面
    実際に設定できるオプションには、次のようなものがあります。
    • Show manual on startup
      起動時にマニュアルを表示する
    • Use OR operator as default in queries (instead of AND)
      検索キーワードを半角スペースで区切った時に、AND 検索ではなくOR 検索を行う
    • Automatically scroll to first match in preview pane
      検索結果のファイルを選択した時、キーワードを含む部分へ自動でスクロールする
    • Hide program in System Tray after opening files
      検索結果のファイルを開いた時、「DocFetcher」をタスクトレイに最小化させる
    • When closing program window, hide in System Tray instead of exiting
      ウインドウを閉じた時に、タスクトレイに最小化させる
    • Clear search history on exit
      「DocFetcher」を終了する時、履歴をクリアする
    • Highlight color
      ハイライトカラー
    • Preview font (normal):
      プレビュー画面上で使用するフォント
    • Preview font (fixed width)
      プレビュー画面上で使用するフォント(プレーンテキスト用)
    • Global hotkey
      「DocFetcher」を最前面に表示させるホットキー

 はてなブックマークに追加  Twitter でつぶやく  Facebook でシェア  mixi でつぶやく  google+ で共有  Pocket に登録
DocFetcher TOPへ
スポンサード リンク
 おすすめフリーソフト
 Windows 10 関連のフリーソフト

Windows 10 に入れたら役に立つかもしれないフリーソフト

 Audacity

高機能なオーディオエディタ

 Media Player Classic Homecinema

高機能なマルメディアプレイヤー

 VidCutter

各種動画ファイルを、無劣化で高速にカット編集

 avast! Free Antivirus

豊富な機能を備えた常駐監視型のアンチウイルス

 COMODO Firewall

高機能なファイアウォール

 WUMT Wrapper Script

Windows Update を、完全手動で行えるようにするソフト(スクリプト)

 Windows Update MiniTool

「設定」や「コントロールパネル」に代わり、Windows Update を手動で行えるようにするソフト

 Argente Autorun

不要アイテム自動検出機能も備えたスタートアッププログラム管理ツール

 Zoom for Microsoft Edge

ウェブページの拡大率(表示倍率)を、詳細に調整できるようにする Microsoft Edge 拡張機能

 Dark Skin for Youtube / Dark Theme for YouTube

YouTube の " ダークモード " を、面倒な設定なしで実装できるようにする(ChromeFirefox

 Magical Jelly Bean Wi-Fi password revealer

パソコン内に保存されている Wi-Fi ネットワークのパスワードを、リストに一覧表示

 おすすめフリーソフト
 GIF Viewer

素材画像抽出機能も備えたGIF アニメプレイヤー

 PotPlayer

多形式に対応した軽量メディアプレイヤー

 Malwarebytes Anti-Ransomware

ランサムウェアを、検出してブロックしてくれる

 Autorun Organizer

Windows のスタートアップを、最適化することができるソフト

スポンサードリンク

DocFetcher を紹介しているページです