分析に使えるスプレッドシート術!IMPORTXML関数のご紹介
GA4情報
こんにちは、FAROチームです。
今回の記事では、ウェブの分析の際に役立つスプレッドシートの関数、IMPORTXML関数について解説します。
※2024年10月後半よりGA4の仕様上、エラーが発生するためFARO REPORT NEXTでは基本レポートのランディングページTOP20内のURLとタイトルの組み合わせでの出力部分を修正し、現在URLのみの表示となっています。以下をご参考に、タイトル算出の一助になればと考えております。
IMPORTXML関数でできること
IMPORTXML関数はウェブスクレイピングを行う関数の一種で、例えばサイトURLからタイトル(meta title)やディスクリプション(meta description)を抽出することが出来ます。IMPORTXML関数が活躍する場面として、以下のようなケースが挙げられます。
「ページURL別のレポートをもらったけど、URLだけではどのページかわからないのでタイトルをつけたい」
「SEO対策を行うために現状のディスクリプションをまとめたいけど、数が多くて大変」
これらのような場合、IMPORTXML関数を使うことで、スプレッドシートにタイトルやディスクリプションを一括で出力することが可能です。
IMPORTXML関数の使い方 【URLからタイトルを抽出】
今回はIMPORTXML関数で、URLからタイトルとディスクリプションを抽出する方法を解説します。まずはタイトルから抽出してみましょう。関数の式は以下の通りです。
=IMPORTXML(ページのURL,"//title")
「ページのURL」はセル参照で指定することも可能です。例として、A列にページURLがあるシートの、B列にタイトルを出力してみます。式は以下のとおりです。
=IMPORTXML(A2,"//title")
下図の例はFARO REPORT NEXTの直近のブログ記事のURLになりますが、B列に無事にタイトルが出力されました。
▼URLからタイトルを抽出
IMPORTXML関数の使い方 【URLからディスクリプションを抽出】
今度はURLからディスクリプションを抽出します。式は以下の通りで、こちらでもセル参照が使えます。
=IMPORTXML(ページのURL,"//meta[@name='description']/@content")
下図の例では先程のブログのURLのディスクリプションを抽出します。
=IMPORTXML(A2,"//meta[@name='description']/@content")
▼URLからディスクリプションを抽出
IMPORTXML関数の注意点
IMPORTXML関数のような、ウェブスクレイピングを行う関数は、実行前に必ずサイトの利用規約を確認しましょう。サイトによってはサーバーに負荷がかかるなどのトラブルを防ぐために、ウェブスクレイピングを禁止している場合もあります。便利なIMPORTXML関数ですが、しっかりとルールを守ってご使用ください。また、データをスクレイピング(ファイルから抽出)する都合上、大量のデータを処理できない場合もあります。
おわりに
今回の記事が皆様の分析業務の一助になれば幸いです。また、ウェブの分析業務にはFARO REPORT NEXTもぜひお役立てください。FARO REPORT NEXTはGA4のデータを網羅的にパワーポイントに出力可能で、煩雑な集計業務を効率化できます。分析によるデータドリブンな意思決定に、ぜひご検討ください。