正規表現を使ったみようと勉強していたものの、「\dってなんだっけ」「.の意味忘れちゃった」など全く勉強が捗らなかったので、
まずは正規表現で使われている文字を覚えることを前提に文字をまとめてみました。
正規表現を確認できるツールとして「Rubular」を使用します。
| 正規表現 | 表現 |
|---|---|
| \d | 半角数字。0~9 |
| \w | 英単語を校正する文字(半角英数字とアンダースコア) |
| \t | タブ文字を表す |
| \n | 改行文字(UNIX系マシンの標準的な改行コード) |
| \s | 空白文字(スペース、タブ文字、改行文字等) |
| \b | 単語の境界線 |
| \W、\S、\D、\B | それぞれ \w、\s、\d、\b の逆の意味 |
| ^ | 行頭。[^ ]で否定の文字クラスの意味。 |
| $ | 行末。 |
| . | 任意の1文字 |
| * | 直前の文字が0個以上 |
| + | 直前の文字が1個以上 |
| ? | 直前の文字が1個、または無し |
| \ | 正規表現中の特別な文字をエスケープする |
| + | 直前の文字が1個以上 |
| | | OR条件 |
| {n,m} | 直前の文字が n 個以上、m 個以下 |
| [AB] | AまたはBのいずれか1文字 [ABC]と書けば、「AまたはBまたはCのいずれか1文字」 |
早く正規表現を覚えて少しでもテキストデータの編集を効率よくしたいものです。