テキストファイルに対して同じ作業を何度も繰り返す必要がある場合、正規表現を使って効率化できることがあります。今回はテキストデータにHTMLタグを付与するケースを確認しておきましょう。
目次
テキストファイルにHTMLタグを追加したい!
過去に「正規表現」を使ったデータの整形について取り上げました。
このときはアプリなどからダウンロードしたデータに不要なHTMLタグがついていたため、正規表現を使ってデータをキレイにするというものでした。
今回は逆のパターンで、HTMLタグがついていないテキストファイルの前後にHTMLタグをくっつけるというケースを取り上げることにします。
データの整形には今回も「サクラエディタ」を使います。
正規表現を使って箇条書きのタグを追加する
今回はNotionにおいて箇条書きの形で整理した内容から、自社ホームページに反映するためのコードを作成するというケースを想定します。
Notionにおいて次のデータを作ったとします。
このデータをサクラエディタにコピペすると次のような状態になります。
これを最終的に次のようなデータにする方法を確認しましょう。
ちなみに
「NotionからHTMLでデータ出力できるんじゃないの?」
と思った方もいるかもしれません。
確かにNotionからページをHTMLで出力することは可能なのですが、次図のように不要なタグがたくさんついてきます。
ページそのものをウエブページとして公開するのならよいのですが、自分のサイトにコードとして追加するには適さないため、今回はテキストデータの整形を行います。
以下、順を追って手順を説明します。
手順1:行頭の「- 」を取り除く
正規表現において行の先頭を意味するのは「^」です。
サクラエディタの「検索」-「置換」メニューを開いて
- 置換前:^- (最後に半角スペースが入っています)
- 置換後:(何も入力しません)
- 正規表現:チェックを入れる
と設定して「すべて置換」をクリックします。
これで行頭の「- 」を消すことができました。
手順2:<li>を先頭に追加する
HTMLで箇条書きにするためには各行を<li></li>で挟む必要があります。
各行の先頭に<li>を追加したいわけですが、行頭を指定するのは手順1と同じく「^」を使います。
サクラエディタの置換画面で
- 置換前:^
- 置換後:<li>
- 正規表現:チェックを入れる
と設定して「すべてを置換」をクリックしましょう。
すべての行頭に<li>を追加できました。
手順3:文末に</li>を追加する
行頭ではなく文末を指定するには「$」を使います。
サクラエディタの置換画面で
- 置換前:$
- 置換後:</li>
- 正規表現:チェックを入れる
と設定して「すべてを置換」をクリックしましょう。
あれ、最後の箇所だけ</li>が追加されていません。
7行目の最後には「改行」を示すマークがありませんので、行の最後と認識してくれないようです。一箇所だけなので、今回は手作業でコピペしておきます。
漏れなく各行の最後に文字列を追加したい場合は、最終行が改行されているか確認してから行いましょう。
手順4:タブで字下げを行う
コードを書く場合にはできるだけ見やすい状態にしておきたいものです。そのため各行の先頭にタブを追加します。
タブは「\t」で表現できますので、サクラエディタの置換画面で
- 置換前:^
- 置換後:\t
- 正規表現:チェックを入れる
と入力してから「すべて置換」を実行します。
このようにすべての行をタブで字下げすることができました。
あとは先頭と最後に<ul></ul>を追加すれば完成です。
今回の作業、実は生成AIを使うと・・・
このブログでよく書いていることですが
「本当にこんな面倒なことしないといけないの?」
と感じたら、ほんの一瞬でいいので調べみましょう。
今なら生成AIにやり方を聞いてみるのもひとつの方法です。というか、実は今回の内容はChatGPTにお願いすると一瞬でやってくれます。
「正規表現なんてよくわからない記号は使いたくない」という方は、テキストデータの整形について、生成AIを積極的に活用することを検討しましょう。
ただ、正規表現を知っていると細かい指定ができますので、ChatGPTに頼んだけれど、思った通りのデータにならないという場合にも対応できます。
やり方はひとつとは限りませんが、少なくともチマチマと手作業でコピペを繰り返すことはしないようにしたいものです。
投稿者
-
大学卒業後、大手上場企業に入社し約19年間経理業務および経営管理業務を幅広く担当。
31歳のとき英国子会社に出向。その後チェコ・日本国内での勤務を経て、38歳のときスロバキア子会社に取締役として出向。30代のうち7年間を欧州で勤務。
40歳のときに会社を退職。その後3年で税理士資格を取得。
中小企業の経営者と数多く接する中で、業務効率化の支援だけではなく、経営者を総合的にサポートするコンサルティング能力の必要性を痛感し、「コンサル型税理士」(経営支援責任者)のスキルを習得。
現在はこのスキルを活かして、売上アップ支援から個人的な悩みの相談まで、幅広く経営者のお困りごとの解決に尽力中。
さらに、商工会議所での講師やWeb媒体を中心とした執筆活動など、税理士業務以外でも幅広く活動を行っている。
最新の投稿
- AI2024年10月31日生成AIを「間違えることもあるコンピューター」と位置づける
- 経理2024年10月27日「経理が苦手な人」に共通する特徴とその対処法
- PDF2024年10月24日Adobe Acrobatで枠線付きテキストを入力する方法
- Notion2024年10月20日「新しくなる前のNotionAI」でも、できたことを整理してみる