RSS非対応のニュースリリースなどでもRSSフィードを利用できるFeed43を利用する
うまく使いこなせればかなり便利なサービスです。
RSSはすごく便利!
インターネット中年会ぐらいの方々は昔に使っていた人も多いかもしれないRSS。
最近はSNSやニュースアプリの発展によって利用する利点があまりないかもしれません。
が、私はかなり便利に使わせていただいています。RSSに関して興味があるのならば上の記事をご覧ください。
意外とRSS非対応サイトが多い
というかニュースリリースなどが非対応なのです。そもそもRSSはブログやニュースなどの記事更新情報を取得するものでニュースリリースを取得するためのものではないので仕方ありません。
でもニュースリリースもRSSでチェックできたらなぁ~~~
便利ですよね???すごく便利ですよね???
そこでFeed43
これです。
大抵のニュースリリースは一定の法則にのっとって配信されています。
その一定の法則を指定することでその更新部分を取得できるというのがこのFeed43です。
使い方
わかりやすい使い方は他の方々が画像付きで解説しているのでそちらをご覧ください。
Create your first RSS feedをクリック
ここをクリックしないことには始まりません。
取得したいURLと文字コードを指定
Addressに取得したいURL、Encodingに文字コードを指定します。
例えばLINE CorporationのPRを取得したい場合、URLに”https://linecorp.com/ja/pr/news/”、Encodingには今のサイトでは一般的なutf-8を指定します。適切な文字コードを指定しないと日本語が文字化けします。
入力が完了したらReloadをクリックしてください。
ソースから規則性を探す
ここからは若干難易度高めの作業です。
Page Sourceに先程指定したページのソースが表示されています。
ここからニュースリリースの規則性を探し抜き出します。
例えばLINE CorporationのPRの場合
<p class="news_title"> LINE およびみずほフィナンシャルグループ、"スマホ銀行"の設立に向け、LINE Financial、みずほ銀行を通じた共同出資によるLINE Bank設立準備株式会社を設立 </p> <p class="news_inf">2019.05.27 <span class="bar"></span> 金融関連サービス</p> </a> </li> <li class="bx_img"> <a href="https://linecorp.com/ja/pr/news/ja/2019/2718"> <figure class="figure_img" style="background-image:url(https://scdn.line-apps.com/stf/linecorp/ja/pr/LINE_pay.png)"> <span class="bd"></span><span class="blind"><!-- IMPORTANT! -->image's alternative text</span> </figure> <p class="news_title"> 【LINE Pay】7月から「セブン-イレブン」での決済対応開始 </p> <p class="news_inf">2019.05.21 <span class="bar"></span> LINE Pay</p> </a> </li> <li class="bx_img"> <a href="https://linecorp.com/ja/pr/news/ja/2019/2716"> <figure class="figure_img" style="background-image:url(https://scdn.line-apps.com/stf/linecorp/ja/pr/PRrelease20190330_01thumbnail_linechef_ja.png)"> <span class="bd"></span><span class="blind"><!-- IMPORTANT! -->image's alternative text</span> </figure>
というのがニュースリリース部分で
<li class="bx_img"> <a href="URL"> <p class="news_title">リリースタイトル</p> <p class="news_inf">日付 <span class="bar"></span> ジャンル</p>
という規則性なのだろうなぁという予測ができます。
(<li class=”bx_img”>はなぜか無いと記事URLより上のリンクを取得してしまうため追加しています)
Item (repeatable) Search Patternに規則性を指定する
上で
<li class="bx_img"> <a href="URL"> <p class="news_title">リリースタイトル</p> <p class="news_inf">日付 <span class="bar"></span> ジャンル</p>
という規則性だということが判明したので、Item (repeatable) Search Patternに変わる部分を{%}、改行を{*}に変えて入力します。
上の例の場合は
<li class="bx_img">{*} <a href="{%}">{*} <p class="news_title">{%}</p>{*} <p class="news_inf">{%}<span class="bar"></span> {%}</p>
となります。きちんと改行も入力しないと動作しないので注意してください。
完了したらExtractをクリックすればうまく行った場合求めていた抜き出しができるはずです。
出力のテンプレートを決める
もうここまで来たら簡単です。
例の場合Clipped Dataに
Item 1 <Wed, 29 May 2019 12:37:28 GMT> {%1} = https://linecorp.com/ja/pr/news/ja/2019/2720 {%2} = LINE およびみずほフィナンシャルグループ、スマホ銀行の設立に向け、LINE Financial、みずほ銀行を通じた共同出資によるLINE Bank設立準備株式会社を設立 {%3} = 2019.05.27 {%4} = 金融関連サービス Item 2 <Wed, 29 May 2019 12:35:26 GMT> {%1} = https://linecorp.com/ja/pr/news/ja/2019/2718 {%2} = 【LINE Pay】7月から「セブン-イレブン」での決済対応開始 {%3} = 2019.05.21 {%4} = LINE Pay
というふうに綺麗に抜き出すことが出来たのであとはそれを利用してRSSに出力するテンプレートを作るだけです。
Item Title Templateに取得したタイトルを、Item Link Templateに取得したリンクを、Item Content Templateに内容を書きます。
私の場合タイトルに{%2}、リンクに{%1}を入力します。他のものも利用できますが、最低限タイトルとリンクさえあれば困らないので今回はこれだけにしておきます。
完了したらPreviewをクリックすることできちんと取得できるか確認できます。
あとはFeed URLをRSSリーダーに登録するだけ
おめでとうございます。やっと長い戦いも終わりあとはRSSリーダーに登録するだけです。
Feed URLに購読用リンクがありますので、それを自分の利用しているRSSリーダーに登録すれば完了です。
以上です。RSS非対応でもRSSで確認できるのはかなり便利なので活用してみてください。個人的にはニュースリリースチェックにかなり便利だと思います。
もちろん、残念ながらFeed43でも対応できないページもあります。例えば三井住友カードとか・・・動的なサイトを作らないで頂きたい・・・
-
前の記事
適当に貯めたネジを分別して再利用する話 2019.05.27
-
次の記事
BDドライブを取り付けました 2019.05.29