処理対象の行の指定に / で囲んだ文字列を使ってきましたが、これは正規表 現という文字列のパターン指定方法の一番簡単な形です。もう少し正規表現の ことを知ると、もっと多彩なテキスト操作ができるようになります。正規表現 は、muleやvi、grep、sedなどUNIX系のツールで大抵使えます。
例を見ていきましょう。まず後で説明する幾つかの例外の文字を除いて
/abc123/
などアルファベットや数字などを並べたものは、並べられた文字そのものを表 します。この例の場合、 abc123 です。 AWKでは、
% gawk '/abc/' file
とすれば、file内のabcを含む行が全て出力されました。このことを「/abc/に
マッチした行が出力された」と言います
。
次に例外の文字を説明します。例外となるのは次の文字でメタ文字 と呼ばれます。
| . * + ? ^ $ [ ] ( ) \
これらの文字は以下に説明する特別な意味を持っています。