wordgrep by kanegon 1. 概要 Word 文書から正規表現テキストを検索します。 Word 文書のテキスト化、全角文字検索を行うサンプルも同梱しています。 Word 文書内の文字列加工を行うサンプルとしても利用できます。 2. 動作環境 以下の環境でテストしています。 なお、OS、Office のバージョンに大きく依存する機能は使用してないため、 他の環境でも問題なく動作する可能性は高いと考えています。 - OS Windows XP pro Windows 2000 pro - Word Word 2000 Word 2002 (Office XP) 3. インストール アーカイブには以下のファイルが含まれています。 wordgrep.js Word 文書から文字列を検索するスクリプト word2text.js Word 文書をテキスト形式に変換するスクリプト(サンプル) zengrep.js Word 文書から全角文字を検索するスクリプト(サンプル) readme.txt このファイル 任意のフォルダに展開してください。 ツールは JScript で記述されたスクリプトであり、展開を行うだけで、特別なイン ストール作業は必要ありません。 4. アンインストール 展開したすべてのファイルを削除してください。 5. コマンド書式 - wordgrep.js Word 文書から正規表現テキストを検索します。 wordgrep.js pattern 検索する文字列の正規表現パターンを指定します。 file名 検索対象の Word 文書のファイル名を指定します。 ファイル名としてワイルドカードを使用できます。 - zengrep.js Word 文書から全角文字(半角カナ含む)を検索します。 見つかったら Word 文書を開き、該当 sentence を選択状態にします。 zengrep.js file名 検索対象の Word 文書のファイル名を指定します。 単一のファイル名を必ずフルパスで指定してください。 - word2text.js Word 文書のテキスト変換を行います。 word2text.js file名 検索対象の Word 文書のファイル名を指定します。 単一のファイル名を必ずフルパスで指定してください。 5. 使用例 ツールが C:\wordgrep に展開されているものとします。 検索対象の Word 文書が C:\doc\sample.doc にあり、ここから、文字列 "日本語" を検索するものとします。 コマンドプロンプトを開き、該当のフォルダに移動してから以下のコマンドを入力し ます。 C:\doc>cscript C:\wordgrep\wordgrep.js "日本語" sample.doc 以下のように結果が表示されます。 sample.doc(72): 日本語教育の現状について sample.doc(78): 世間では「日本語は難しい」と言われている。 結果で表示されるカッコ内の数字は擬似的な行番号で、テキスト化した文書内の改行 に対応しますが、実際の Word 文書の行数や文の数などを正確に反映するものではあ りません。 検出したテキストの文書内位置の参考のために表示するものです。 なお、検索文字列パターンは正規表現が使用できます。 例として、文書内に半角カナを含む全角文字(半角英数記号以外の文字)を含んでいる かどうかを調べる方法を示します。 C:\doc>cscript C:\wordgrep\wordgrep.js "[^\x00-\x7f]" *.doc "[^\x00-\x7f]" が全角文字(半角カナ含む)にマッチする正規表現です。 正規表現の詳細はここでは説明しません。 *.doc でカレントフォルダ以下のすべての Word 文書を検索対象とします。 6. 修正履歴 ver0.01 2006.10.07 新規作成 8. 使用条件、免責 本プログラムおよびソースコードは自由に使用することができます。 本プログラムおよびソースコードの配布や改変に制限はなく、商用利用も可能としま す。改変した生産物に著作権表示も不要です。 本プログラムおよびソースコードは無保証です。 本プログラムおよびソースコードの使用において生じた如何なる損害についても作者 は一切の責任を負いません。 金子尚史(kanegon) e-mail : wbs01621@mail.wbs.ne.jp WebPage : http://www2.wbs.ne.jp/~kanegon/