AWKで正規表現

処理対象の行の指定に / で囲んだ文字列を使ってきましたが、これは正規表 現という文字列のパターン指定方法の一番簡単な形です。もう少し正規表現の ことを知ると、もっと多彩なテキスト操作ができるようになります。正規表現 は、muleやvi、grep、sedなどUNIX系のツールで大抵使えます。

例を見ていきましょう。まず後で説明する幾つかの例外の文字を除いて

    /abc123/

などアルファベットや数字などを並べたものは、並べられた文字そのものを表 します。この例の場合、 abc123 です。 AWKでは、

    % gawk '/abc/' file

とすれば、file内のabcを含む行が全て出力されました。このことを「/abc/に マッチした行が出力された」と言います[*]

次に例外の文字を説明します。例外となるのは次の文字でメタ文字 と呼ばれます。

    | . * + ? ^ $ [ ] ( ) \

これらの文字は以下に説明する特別な意味を持っています。



Subsections
OGURISU Osamu
2004-01-15