正規表現を使ってデータ整理を楽にしよう!

2016年12月1日

正規表現を使ってデータ整理
日頃から膨大なデータから必要なデータを抽出したり、バラバラなフォーマットを統一化する業務は必要なことですが、かなり骨の折れる作業です。

マクロでこれらの処理ができる場合はいいですが、マクロを使うにはハードルが高いという人は正規表現が便利です。

今回は、正規表現初心者へデータ整理を楽にする方法をご紹介します。

 

正規表現とは?

正規表現は、通常の文字 (a ~ z など) と、”メタキャラクタ” という特殊文字から構成される文字列のパターンです。パターンによって、テキスト本文を検索するときに一致する 1 つ以上の文字列を指定します。正規表現は、検索対象の文字列と文字パターンを一致させるためのテンプレートとして機能します。
出典:正規表現の構文 – Microsoft Developer Network

簡単に言うと、「大文字や小文字、全角や半角などが入り混じった文字列を統一化する表現方法」です。

例1)
09012345678
09012345678
例2)
5丁目
五丁目

この2つの例はどちらも同じ意味ですが、表記が違います。
これをEXCELなどの一つのファイルにまとめたときに、それぞれ表記が違っていると、見栄えが悪いですし、何よりも検索に引っかかりにくいですよね。
そんなことにならないように、扱いやすく見やすいデータに統一できます。

どういうアプリケーションで使えるの?

正規表現は幅広く使用可能で、PHPやVBAなどあらゆるプログラミング言語に組み込み可能ですが、プログラミングができるならこんなページは見ていないと思いますので、もっと簡単なフリーソフトをご紹介します。

  • OpenOffice Calc(表計算)
  • 秀丸エディタやサクラエディタなどのテキストエディタ

 

 

正規表現を使う設定

OpenOffice Calc(表計算)の場合
OpenOffice Calc
[編集]→[検索と置換]を選択して検索と置換ダイアログを開きます。
OpenOffice Calc2
①[詳細オプション]を押すとさらに細かい設定が表示されます。
②[正規表現]をチェックしてください。

[閉じる]で設定終了です。

 

サクラエディタの場合
サクラエディタ1
[検索]→[置換]を選択して置換ダイアログを開きます。
サクラエディタ2
[正規表現]をチェックして設定終了です。

 

 

 

 

次回から実際に解説していきます。
ふじもとkでした!