実際にドキュメント内を検索するファイル検索ツールを試してみました – 仕事のやり方が変わりました

実際にドキュメント内を検索するファイル検索ツールを試してみました – 仕事のやり方が変わりました


私は自分がかなり組織化されていると思いたいです。私はフォルダー内にフォルダーを使用したり、わかりやすいファイル名を使用したり、さらに規律を保っている場合には日付の接頭辞を使用したりすることもあります。ほとんどの場合、システムは機能します。少なくとも、約18か月前に書いたものを見つけなければならなくなるまではそうでした。その文書は、文書の真ん中のどこかに埋もれていた、一文の迷いを通してしか思い出せませんでした。 Windows 検索を置き換えずに改善する簡単な変更をいくつか適用したにもかかわらず、何も役に立ちませんでした。 Mac 上の Spotlight も同じ無関心で反応したのではないかと思います。完全に諦めるまでに、ファイルを 1 つずつ開くのに 20 分 (もっとかかるかもしれません) を費やしました。ファイルは間違いなく私のコンピュータのどこかにありましたが、機能的にはサイトに消えたも同然です。

この経験を何度も繰り返した結果、私はウサギの穴に落ち、最終的に見つけたのが DocFetcher でした。これは無料でオープンソースであり、ファイル内だけでなくファイル内も検索します。

実際にドキュメント内を検索するファイル検索ツールを試してみました – 仕事のやり方が変わりました

Everything アプリを使ってコンピューター上の何かをより速く見つける方法

Everything を使用すると、Windows PC 上の情報をより簡単に見つけることができます。

ファイルはそこにありますが、Windows Search は無視します

Windows 11 スタート メニュー PDF ファイル内の語句を検索します。

オペレーティング システムに組み込まれている検索機能は、ほとんどがファイル名スキャナーであり、いくつかのトリックが組み込まれています。ファイルが存在し、どこに存在するかを認識します。まったくうまくいかないのは、中に何が入っているかを伝えることです。 Windows でネイティブにファイル コンテンツを検索するようにインデックス設定を変更することは技術的には可能ですが、一般にエクスペリエンスが遅くなり、リソースが大量に消費されます。 DocFetcher は、ファイル名を調べる代わりに、PDF、ドキュメント、スプレッドシート、メモ、コード、アーカイブ、さらには電子書籍などのファイルの内部を調べます。この 1 つの違いによって、問題全体が再構成されます。

典型的な状況を考えてみましょう。文書が必要ですが、その文書の名前、保存場所、作成年がわかりません。あなたはフレーズを覚えています – おそらくクライアントの名前、プロジェクトのタイトル、特定の文章などです。通常の検索では、ここでは何も提供されません。 DocFetcher がフォルダーのインデックスを作成しているときに、文書のセクション、語句、または覚えている可能性のあるキーワードを入力すると、DocFetcher がそれらを問​​題なく取得します。

インデックスが実際にどのように機能するのか (そしてなぜ高速なのか)

一度すべてを読み取るので、再度狩りをする必要はありません

DocFetcher はインデックス検索ツールです。つまり、検索するたびにすべてのファイルを最初からスキャンするわけではありません。コンピュータ上のすべてのファイルをスキャンするのではなく、ファイルの内容を含むローカル データベースをチェックします。これは、検索結果が即時に表示されることを意味します。その下の検索エンジンは、はるかに高価なツールで検索を実行する広く使用されているオープン ソース エンジンである Apache Lucene 上に構築されています。

その代わりに、事前にいくつかの作業を行う必要があります。初めて DocFetcher を開いたときに、検索したいフォルダーを指定すると、それらのフォルダーにインデックスが付けられます。コレクションのサイズによっては、これには時間がかかる場合があります (経験則では 1 分あたり約 200 ファイルです)。ただし、一度完了すると、再び待つことはほとんどありません。また、ファイルが変更されると、DocFetcher がバックグラウンドでインデックスを自動的に更新するため、結果は最新の状態に保たれます。インデックス作成プロセスはバックグラウンドで実行され、自動的に実行されるように設定できます。

DocFetcher はデフォルトで何も追加せず、インデックスを作成するデータの選択を残します。これは、無駄を省き、ほとんどの人が実際にハード ドライブ全体を検索する必要がないという事実を考慮した意図的な選択です。何を入れるかを決めるのはあなたです。つまり、それに応じて得られる結果がよりクリーンになります。

彼は何を探すことができるでしょうか (リストは予想よりも長いです)

ファイルにテキストが含まれている場合、DocFetcher はすでに関心を持っています

特定のファイル拡張子を選択するための DocFetcher ダイアログ ボックス。7z やバックアップなどのオプションが表示されます。

DocFetcher は、PDF、Word ドキュメント、Excel スプレッドシート、HTML ファイルなど、合計 50 以上の形式を含む、さまざまなファイル タイプをサポートしています。最新の Office 形式 (docx、xlsx、pptx) だけでなく、古い形式、OpenOffice および LibreOffice ファイル、RTF、プレーン テキスト、EPUB、さらには MP3 や JPEG メタデータも処理します。私が最初にテストしたことの 1 つは、DocFetcher が PDF 内に埋め込まれた単語を実際に検出できるかどうかでした。PDF とは、Windows Search が無視するか、存在しないように装うタイプのドキュメントです。それはすぐに見つかりました。

私ほど気になるとは思っていなかった機能の 1 つは、アーカイブのサポートです。 ZIP、RAR、7z ファイルなどの圧縮アーカイブ内を検索できるため、検索前にコンテンツを手動で抽出する必要がなくなります。また、ネストされたアーカイブ (7z を含む zip に rar を含むなど) もサポートしています。これは、ダウンロードしたファイルがどれだけ多くのファイルを結局 zip フォルダーに保存され、解凍されずに残っているかに気づくまで、極端に聞こえるかもしれません。

また、開発者やソース コードを扱う作業をしている場合には、DocFetcher がどのファイル拡張子をプレーン テキストとして扱うかをカスタマイズできるため、DocFetcher を、使用している言語やフレームワークに応じたコード ファインダーに効果的に変えることができます。

DocFetcher アプリは、検索結果を表示し、PDF ドキュメントをプレビューします。

実際に使ってみると、まずスピードが重視されます。ファイルのインデックスが作成されると (これには長い時間がかかることに注意してください)、検索は非常に高速になり、結果は数ミリ秒以内に表示されます。 DocFetcher には、ドキュメント内の検索語を強調表示するプレビュー ウィンドウも用意されているため、各ファイルを開いて確認する必要はありません。代わりに、ファイルをクリックすると横にプレビューが表示され、すぐにコンテキストを確認できます。

検索構文は、インターフェイスが最初に示すよりも奥が深いです。 DocFetcher は、基本的なキーワードに加えて、ワイルドカード、フレーズ検索、近似用語のあいまい一致、および特定の範囲内で隣り合って出現する単語を検索できる近接検索をサポートしています。おそらくほとんどの人はこれらを毎日使用することはないと思われますが、近似ではなく精度が必要な場合には、それらがあなたを待っています。

彼についていくつか不満がある

主に棘があるところ

DocFetcher のインデックス キュー ウィンドウ。フォルダーのファイル変更の監視などのさまざまな設定が表示されます。

どのツールも、そのツールで何ができないのかについても読んでいない限り、誠実とは言えません。 DocFetcher は画像を検索しないため、スキャンした領収書を見つけたいと思っても、運が悪いです。そしてもちろん、ビデオ ファイル内にオーディオやビデオ コンテンツは追加されません。ただし、MP3 や FLAC などのオーディオ ファイルのメタデータ (タグ、アーティスト、タイトル) だけでなく、JPG や JPEG 画像の EXIF メタデータにもインデックスを付けることができます。また、リアルタイムのインデックス作成機能もありません。つまり、ユーザーが指示したとき、またはアプリケーションがバックグラウンドで継続的にではなく、実行中にファイルの変更を検出したときにインデックスを更新します。

インターフェースが美しくない。 DocFetcher は 2009 年に設計されたように見えますが、これはほぼ正しいことであり、初めて開いたときは、一瞬間違いを犯したのではないかと思うかもしれません。しかし幸運なことに、それを乗り越えることができました。

では、本当に DocFetcher を使用する必要があるのでしょうか?

あなたの仕事に大量のドキュメント (研究、執筆、法律、医療、開発、アーカイブなど) が含まれる場合、DocFetcher を使用する価値があります。 Windows 11 用のいくつかの最高のデスクトップ検索ツールと比較しても、この特定の使用例では独自の性能を発揮します。インターフェースは賞を受賞しません。最初のインデックスには忍耐が必要です。また、ファイルを整理するという正しい習慣に代わるものでもありません。これは、デスクトップ上で現在管理されているもの以外の方法で、すでに所有しているファイルを検出できるようにするものです。

docfetcherのロゴ

オペレーティング·システム

Windows、macOS、Linux

クリスチャン・シュミダー

価格モデル

無料/オープンソース

DocFetcher は、コンピュータ上のドキュメントにインデックスを付け、PDF、Word ファイル、スプレッドシートなど内で即座に検索できるデスクトップ検索ツールです。ファイルに対するプライベートのオフライン検索エンジンのように機能し、埋もれた情報を簡単に見つけられるようになります。


Leave a Reply

Your email address will not be published. Required fields are marked *