物書きの全文検索について
日々、大量の原稿を執筆される方にとって、バージョンごとの文書比較や、フォルダ内の串刺し検索は必要不可欠な作業です。
特に『一太郎』『縦書きPDF』に関しては、完全対応の全文検索ツールは稀です。
Windows標準のサーチ機能も内部まで及びません。
『一太郎』にもエディタにも、アプリケーションの標準機能として、複数シートの串刺し検索やGREPなどが備わっていますが、新旧バージョンの文書比較には不十分ですし、長文の場合、「その一文を、どのファイルの、どこに記述したか」を正確に思い出すのも至難の業です。
いくつものファイルを閉じたり、開いたりしながら、いちいち確認していては、時間がいくらあっても足りません。
そこでおすすめしたいのが、インデックス型の全文検索ツール『Search++』(全文検索くん『サーチプラス』)です。
一太郎や縦書きPDFの全文検索に完全対応し、値段もリーズナブル。
検索スピードも、一太郎よりはるかに高速で、検索結果のプレビュー画面も見やすいです。
一つの作品について、いくつものバージョン・ファイルが存在し、推敲前の文章やキャラクター設定、作中の技術解説や人物相関など、こまめにチェックして、完成度を高めたい方にはおすすめです。
検索だけでなく、文章の比較にも便利ですよ。
『Search++』のオフィシャルサイトはこちら。
http://www.searchplusplus.jp/
全文検索くんの試用とインストール
『Search++』は、オフィシャルサイトからもダウンロードできますが、Vectorも分かりやすいです。
試用期間は30日間。
製品版のフル機能が使えます。
なお、製品の種類には、標準版と、64ビットOSに対応したPRO版の二種類があり、。PRO版は容量の大きいファイル検索に適しています。
個人利用で、数MB程度のオフィス系文書のテキスト検索がメインなら、標準版で十分だと思います。
Vectorの紹介記事はこちら。
http://www.vector.co.jp/magazine/softnews/130524/n1305241.html
ダウンロードURLはこちらです。
https://www.vector.co.jp/soft/winnt/util/se498053.html
配布ファイルは、アプリケーションファイルと圧縮タイプの二種類があります。
どちらでも、都合のいい方をダウンロードして下さい。
アプリケーションファイルはそのまま実行して、任意の場所にインストール。
zipファイルは、適当な場所に保存して、解凍。
『Search_J』フォルダのsearchpluspuls.exe から初期画面を起動します。
Windowsのアラートが出るかもしれませんが、「詳細を表示」→「実行」でインストールを続行します。
実行ファイルは下図の通りです。
主な操作や設定画面は公式マニュアル(PDF)に詳しく記載されていますので、下記もご参照下さい。
以下、基本の設定にフォーカスして、説明します。
キーワード色の調整やインデックス生成のタイミングなど、細かなカスタマイズは、自分の使い方に合わせてカスタマイズして下さい。
全文検索くんの基本の設定
アプリケーションの起動と初期設定
初めて使用する場合、プログラムを実行したら、『試用する』か『ライセンス入力』か選択する項目が現れますので、試用する場合は、『試用する(30日殘る』をクリックして、アプリケーションを起動します。
アプリケーションはタスクトレイに格納されますので、緑十字マークのあるアイコンを右クリックして、『検索画面』を開きます。
まず、検索画面の右上、『その他の機能』→『オプション』をクリックして、設定画面を呼び出します。
検索対象フォルダの指定
まず、『検索データ』→『検索対象の指定』→『検索対象のフォルダを指定して下さい』→『設定』をクリック。
『追加』をクリックして、空欄に任意の名称を記入。
検索対象のフォルダにチェックを入れます。
下図の場合、このサイトで使用しているテーマ・テンプレートのフォルダを指定しています。
OKをクリックして、最初の画面に戻ります。
基本的に、上位のフォルダにチェックを入れると、下位フォルダにも自動的にチェックが入ります。
アプリケーションの自動保存や画像など、検索に不要なフォルダは、インデックス生成の妨げになりますので、チェックを外しておきましょう。
検索対象のファイルと除外するファイルの指定
次に、検索対象のファイルと、検索結果から除外するファイルを指定します。
複数の場合は、;(セミコロン) で区切ります。
*.txt;*.jtd;*.php;*.xml;*.sql;*.pdf
jtd は、一太郎ファイル。
$$$は、一太郎の自動バックアップファイル(除外)。
SAVは、秀丸エディタのバックアップファイル(除外)です。
次に、『インデックスデータ保存場所の設定』で、任意の場所を指定。
検索条件が決まったら、OKをクリックして、インデックスの作成を開始します。
オプション設定で、検索対象のフォルダを増減する度に、インデックスの再生成が必要になりますので、自分がよく使う検索対象は最初にまとめて登録した方が手間が省けます。
特に、アプリケーションのバックアップファイルは、検索結果が重複する原因になりますので、必ず除外しましょう。
なお、登録ファイルが複数存在しても、検査結果をファイル別に絞り込む機能もありますので、日常的に使うファイルは最初にまとめて登録した方がインデックス再生成の手間が省けます。
画面表示及びインデックス作成
次に、『画面表示及びインデックス作成』のメニューを開き、『検索画面を呼び出す設定』『検索結果リストの表示順』『抜粋表示のオプション』、インデックス作成のタイミングを設定します。
このあたりは、とりあえずデフォルトで、使い勝手を見ながら、調整すればOK。
検索画面のカスタマイズ
次に、『その他』で、検索画面の背景色やキーワードの強調色を調整します。
モニターのレベルに合わせて『高い解像度に対応する』にチェックを入れます。
個人利用であれば、『Httpサーバを起動する』はOFFで構いません。
全文検索の便利な機能
インデックス生成(再生成)を確認
設定が済んだら、早速、インデックスの生成(再生成)を始めます。
基本的に、検索対象のフォルダを指定(追加・削除も含む)し、設定を完了(更新)した時点で、インデックスの生成が始まります。
インデックス生成中に、検索を開始したり、オプションをいじったりすると、アクションの度にインデックスの再生成が必要になりますので、検索画面、もしくはWindowsのタスクバーに『インデックスの生成が完了しました』のメッセージが出るまで、辛抱強く待ちましょう。
物書き向け検索の実際
国内外の検索ツールは、たいてい、プログラマ向けに設計されており、文系の検索には向いていません。
一太郎ファイルとか、最初から度外視ですし、ファイル検索が出来ても、キーワードの記述箇所が一目で分からないことには、文系検索の役には立たないんですね。
なぜなら、物書きに必要なのは、「推敲前、この箇所は、どのように記述していたか」を文書比較する機能で、「行番号」とか、「ファイルのプロパティ」とか、あまり関係ないし、検索結果(プレビュー)が一目で確認できない事には次に進めないからです。
そんな中、一太郎や縦書きPDFに対応して、なおかつ、分かりやすいプレビュー機能を備えた全文検索ツールといえば、『全文検索くん Search++』か、ひしだ氏の『KWIC Finder 4』しか存在しません(筆者調べ)。それ以外は、企業向けの高価な文書管理ツールか、プログラマ向けの専門ツールで、一般人に使いこなせるものではないです。
KWICに関しては、後述しますが、私は前バージョンの愛用者で、一太郎の検索にも重宝していました。
ところが、バージョンアップに伴い、一太郎の検索で頻繁にフリーズするようになり、使用を断念した次第です。
これは開発元のスキルがどうこうという問題ではなく、一太郎という特殊なファイルの宿命だと思っています。これほど互換性のないファイルも珍しく、PC界においては、どんどんガラパゴス化しています。一太郎で文書を作ってしまうと、後々まで泣かされることが多いです。かといってWORDに乗り換える気も無いのですが。
それで『全文検索くん Search++』に乗り換えたわけですが、今のところ、一太郎も、PDFも問題なく使えるので、文系にもおすすめです。
検索結果のプレビュー
下図は、一太郎のファイルにフォーカスしてキーワード検索した際のプレビュー画面。
プレビュー表示を『該当行』に設定した場合、キーワードの存在する箇所が、行番号付きで複数表示されます。
プレビュー画面のフォントサイズやフォントファミリーは上部のプルダウンメニューから好きなものを選択することができます。
プレビュー表示『抜粋』に設定した場合。
該当箇所の前後数行が表示されます(オプションで調整可能)
『テキスト』の場合、文書全体が表示されますが、一太郎の場合、容量が大きいとクラッシュしやすいので、おすすめしません^^;
プログラマ向け検索の実際
プログラマ系の検索では、「あのコードは、どのファイルの、どの箇所に記述したか」を確認することが多いと思います。
たとえば、WordPressのテーマ・テンプレートの中から div class="viral" の記述を検索したい場合。
検索窓にキーワードを入力して、虫眼鏡のアイコンをクリックすれば、すぐに検索が始まります。
該当する phpファイルは次の通りです。
右側のプレビュー画面は、該当箇所の『抜粋』を表示。
こちらは『該当行』の表示。
該当箇所の『テキスト全体』を表示。
『絞込検索』を使えば、検索結果を特定のファイルや特定のフォルダに限定して絞り込むことが可能です。
他にも、名前順、時間順などで検索結果の並び替えができます。
縦書きPDFファイルの検索の準備
縦書き文書をメインで使用している場合、デフォルトでも、一太郎とWORDファイルの検索はできますが、縦書きPDFファイルの検索には、『Adobe PDF IFilterのインストール』と、『Configファイルの編集』が必要です。
Adobe PDF IFilterをインストール
公式サイトよりダウンロード(リンク先が存在しない場合は名称で検索)
https://supportdownloads.adobe.com/detail.jsp?ftpID=2611
config.xmlを編集する
プログラムのインストールフォルダ Search_Jtoolconfig.xml にアクセスし、エディタでconfig.xmlを開きます。
!-- 1 -- を下図のようにコメントアウトします。
編集が完了したら、上書き保存します。
インデックスを再作成
全文検索くんを再起動し、インデックスを再作成します。
再作成の過程で、縦書きPDFも読み込まれ、一太郎やWORDと同じように検索することができます。
また、IFilterを入れると、若干、動作が遅くなる為、縦書き検索が必要なユーザーだけ、個別対応する仕様だそうです。
バージョンアップについて
ライセンスを購入して、ユーザー登録をすれば、プログラムの更新時に、アップデート用ファイルのダウンロード・リンクがメールで送られてきます。
説明に従って、パッチファイルを当てれば、設定画面をそのまま引き継いで、アップデートすることができます。
ただ、バージョンアップの内容によっては、更新が上手く行かないこともあるらしいので、以下の情報を参考にして下さい。
私も、二度目のバージョンアップに躓いて、サポートを依頼しました。
バージョンアップの注意点
『全文検索くん』は、パソコン1台につき、1ライセンスです。
ライセンス認証をしていても、以前にインストールした試用版のプログラム・フォルダや、旧バージョンのファイルがローカルに残っていると、アプリケーションの実行ファイルが勘違いして、旧バージョンのファイルを読み込むことがあります。
私もこれが原因で、何度も旧バージョンに引き戻され、更新に失敗しました。
つまり、旧バージョンの圧縮フォルダ→解凍ファイルが『Dドライブ』に残っていて、一台のパソコンに、新旧、二種類のプログラムフォルダが存在する状態だったんですね。
スムーズに更新を完了するには、以前、インストールしたプログラムファイルを全て削除し、最新バージョンのプログラム・フォルダ、一つだけが常駐する状態にしないといけません。
案外、試用版のファイルが別ドライブに残っていたり、旧バージョンは圧縮フォルダ、新バージョンはexeからインストールみたいに、二重、三重に、インストールしていることがあるので、ライセンス認証、および、バージョンアップの際は注意して下さい。
バージョンアップの手順
バージョンアップの手順は、三通りあります。(開発元より)
2) プラットフォーム(Java&Lib)も更新
3) データ構造も変更
アプリケーションの更新
パッチファイルを上書きすれば完了します。一番、簡単な方法です。
プラットフォーム(Java&Lib)も更新
プラットフォーム(JavaまたはLib)も更新の場合は、上書きだけで上手くバージョンアップできない事があるようです。
複数Libが混在すると、アプリケーションが動作不良になるとのこと。
ユーザー側の旧Java、または、Libデータの削除が必要になります。
※ 私も、Javaの旧バージョンで躓いた感じです。Javaのアップデートを完了したら、上手くいきました。
データ構造も変更
開発元で、データ構造も変更した場合、アプリケーションの更新だけでは上手くバージョンアップできない事があるようです。
手動によるアプリケーションの更新作業 「旧バージョンのアンインストール → 新バージョンの再インストール」、
次いで、インデックスの再生成が必要になります。
アプリケーションをインストールしたフォルダを開きます。
フォルダ名は『Search_J』です。
ファイル構成は下図の通りです。
手動で更新作業を行う場合は、まず、検索画面を閉じて、プログラムを完全に停止します。
次に、『tool』のフォルダを開き、config.xml ファイルを任意の場所にバックアップします。(設定情報が記載されています)
バックアップが完了したら、Search_J フォルダ内のファイル、toolフォルダも含めて、全て削除します。(旧バージョンのアンインストール)
その後、新バージョンの圧縮ファイルを解凍して、全ファイルを、空のSearch_Jフォルダにコピー&上書きします。(新バージョンのインストール)
ファイルの移し替えが終わったら、バックアップした config.xml を上書きし、設定情報を継承します。
最後に、searchplusplus.exe から再起動すれば、設定はそのままで、バージョンアップが完了します。
開発元いわく、将来的にバージョンアップの自動化も検討されているそうなので、今後の更新に期待しましょう。
安全なアンインストールの方法
『全文検索くん』をアンインストールする場合、プログラムフォルダ内にある『deletetool』を使えば簡単にできます。
プログラムフォルダ『Search_J』の直下にある『deletetool』をクリックすれば、下図のようなダイアログが立ち上がるので、『アンインストール』を実行するだけです。
手動でファイルを削除することもできますが、より安全、確実にアンインストールするなら、ツールをおすすめします。
【標準版】と【Pro版】の違い
全文検索くん『Search++』には、【標準版】と【Pro版】があり、両者の違いは下記のようになっています。
【Pro版】・・64ビットのOSのみサポート。容量の大きいファイルや、数百以上のファイルリストにも高速対応。インデックス生成もスピードアップ。
私も最初、標準版を購入したのですが、『一太郎という厄介なファイルをメインで扱う』『検索対象のフォルダに数百のファイルリストが存在する』『各ファイルの文字量(容量)が多い』ことから、Pro版にグレードアップしました。
決定的に違うのは、ファイル処理に必要な最大メモリに制限がなく、インデックスの生成や検索スピードが倍速になる点です。
Pro版の場合、『最大利用メモリ値』に制限がないのですが、標準版の場合、『1000MB』の制限があるので、Pro版の方がはるかに処理能力が高いです。
下図はPro版の管理ツール。Search_J直下の『MemAdm』でメモリ量を調整します。
初めに【標準版】を購入して、途中で【Pro版】にグレードアップしたい場合は、運営者に相談すれば、PayPalなどで差額対応してもらえまえすので、お気軽にお問い合わせ下さい。
KWIC Finder 4について
ひしだ氏が公開されている『KWIC Finder 4』も、使い勝手のいい全文検索ツールです。
txt形式やdoc形式など、一般的な文書ファイルの串刺し検索には非常に便利で、プレビュー画面も見やすいのですが、一太郎ファイルでフリーズ&クラッシュが頻発するようになりました。これはKWICどうこうより、一太郎ファイルがそれだけ厄介な証です。(どんなアプリも読み込み不可)
『全文検索くん Search++』と『KWIC Finder 4』の大きな違いは、『全文検索くん』がインデックス生成を必要とするのとは対照的に、『KWIC Finder 4』はエクスプローラ風という点でしょう。インデックス生成しなくても、通常のWindows Search 機能で、さっと検索できるのが強みです。
ただ、新バージョンになってから、検索場所が即座に反映されない(?)、一太郎のプレビューでクラッシュする、等々、不具合が多くなったので、今は様子を見ているところです。
下図は、テキスト、PDF、オフィスなど、一般的なファイル検索。
一太郎の検索もまったく出来ないわけではないですが、動作が不安定になります。
『全文検索くん Search++』と『KWIC Finder 4』については、開発元のコンセプトの違いも大きいと思います。
ひしださんの所は、元々、電子辞書ツールやリーダーなど、文系ツールを数多く開発しておられて、KWICも文系ユーザーが対象と感じます。
検索結果のプレビューも、「記述箇所を探す」というよりは、「文書確認」を重視している印象なので。
一方、全文検索くんは、オールマイティーなファイル検索が強みで、プログラマ系のように、多種多様なファイルの中から、キーワードの記述されている箇所を一発検索したい人に向いていると思います。動作も安定感があり、更新頻度も高いので、長期で使いたい方には心強い存在です。
海外製でも優秀な無料ツールはたくさんありますが、やはりプログラマ向け検索が主流で、日本語の対応も完全とは言えません(一太郎など論外)。
その点、和製の上記二点は、こまめに更新されており、サポートも親切丁寧なので、十分に有償の価値があります。
エクスプローラの検索結果から、いろんなファイルを閉じたり、開いたり、面倒な作業にお疲れの方。
推敲に力を入れる派で、新旧の文書比較をもっと効率的に行いたい方は、ぜひお試し下さい。
最後に・・
『全文検索くん Search++』の開発元代表、Hさま、いろいろと有難うございます。
今後のバージョンアップを楽しみにしています♪