紅蓮ブログ

アフィリエイトのことが全く分からないあなたに超簡単に詳しく、実戦形式でお話していくブログです

はてなブログのサイトマップを読み込んでくれない理由を解説

サイトマップ

f:id:slash1196:20200521163130j:plain

サイトマップを送信してもうまく読み込まれない人

「はてなブログで書いているんだけどサイトマップがなかなか読み込んでくれないんだ。

理由はなんでなんだろう。対処法とかあるのかな。あったら教えてほしいなあ。」

 

こんなお悩みにお答えします。

 

この記事でわかること

  • はてなブログのサイトマップ読み込んでくれない事件が頻発している
  • はてなブログの送信すべきサイトマップの種類
  • サイトマップ送信が失敗したときの対処法

 

こんにちわ、紅蓮です。

 

はてなブログで書いていて、サイトマップを読み込みがうまくいかないと悩んでいませんか。

 

そんなあなたに今回は、はてなブログのサイトマップを読み込まない理由をご紹介していきましょう。

 

この記事を読めばはてなブログのサイトマップを読み込みがうまくいかない理由と送信する種類や対処法まで網羅的に学ぶことができます。

 

この記事を書く僕は、はてなブログ歴は3年目。

 

今ではアフィリエイトからの収益も伸びてきて、毎月3000円くらいもらっています。

 

そんな僕も6か月前までサイトマップを読み込まないことにイライラしていました。

 

そんな時にある記事を読んでやってみたら、うまくいったので今回記事にしてみました。

 

ぜひ参考になればうれしいですね。

 

ではさっそく行ってみましょう。

Here We Go!!

 

 

はてなブログのサイトマップ読み込んでくれない事件が頻発している

読み込みエラー

はてなブログではサイトマップを送信するも、確認したところステータスが成功しましたとなっていないことが多いように思います。

 

実際に僕自身もついこの間まで、サイトマップを読み込んでもらえなくて困っていたのです。

 

はてなブログのサイトマップを読み込んでくれない理由

はてなブログのサイトマップを読み込んでくれない理由をお話していきましょう。

 

理由は以下の通り。

 

  • ①サイトマップの構造上のお話
  • ②サイトマップの送信の自動化ができない

 

では詳しく見ていきましょう。

 

①サイトマップの構造上の理由

理由の1つ目は、サイトマップの構造上の理由ですね。

 

構造的にいけてなかったことによって、サイトマップをGoogle先生が読み込もうとしても読み込めない状態だったんです。

 

サイトマップの構造

はてなブログのサイトマップの構造については、以下のようになっていますね。

 

  • はてなブログのサイトマップは、親階層と子階層の2階層構造になっている
  • 親階層では、子階層へ続くリンクが貼られていて、月別ぺージの最終更新日時が書いてある
  • 子階層は、月毎に公開した各記事ページがかいてあり、最終更新日時が書いてある

 

イメージ的には、以下のような感じ。

 

はてなブログのサイトマップイメージ

 

最終更新日時が同じになっていることが、問題点だった

そんなサイトマップなんですが、実は更新日時が問題点でした。

 

というのも、通常は記事を書いて公開されるとそのタイミングで、公開された記事のURLがサイトマップに記載され更新されるんですよね。

 

しかしはてなブログの場合には、今までの書いた記事のすべての最終更新日時が新しく公開した記事と同じ日時になっていたのです。

 

イメージ的には、以下の通り。

 

<url>
<loc>http://www.affili-blog-of-gren.com/entry/new-exampleA
<lastmod>2021-13T00:24:31+9:00</lastmod>
</url>
<url>
<loc>http://www.affili-blog-of-gren.com/entry/old-exampleB
<lastmod>2021-13T00:24:31+9:00</lastmod>
</url>

 

新記事Aを更新すると、もともとあった記事Bの最終更新日時までも一緒に変わってしまうという感じですね。

 

でも実際にはすべての記事の更新日時が、同じ日時になることなんてあり得ないんですよね。

 

Google先生は、更新した記事URLだけをクロールしたいです。でも上記の構造だと、すべての記事が更新したことになってしまうので、すべてをクロールしないといけないんです。

 

そのために後回しにされ、クローリングの頻度が下がっていたというのが問題点でした。

 

最終日時の問題は解決している

しかし現在は、最終日時の問題は解決されていますね。

 

2020年の5月時点でサイトマップの形式が変わり、改善されています。

 

ブログを更新するとサイトマップが変更されて、Google先生側からサイトマップを読みに来てくれるようになりました。

 

現在は、サイトマップの構造的には問題なくなっています。

 

理由②サイトマップの送信が自動化できないこと

2つ目の理由はサイトマップの送信が自動化できないことですね。

 

理由は、プラグインが入れられないからですね。

 

WordpressなどのCMSについては、サイトマップのプラグインがあるため自動化ができるのですが、はてなブログに関しては構造上プラグインが入れられません。

 

サイトマップのプラグインは、記事の重要度とクローラーが読みに来る周期を選ぶことができます。

 

そのためにクローラーに適切に内容を伝えることができるのですが、はてなブログの場合には、プラグインがないために読み込んでくれるかどうかはクローラー頼みなんですね。

 

はてなブログは記事を更新時にもちろんサイトマップは更新されますが、見に来てくれるかどうかはわからないということなんですね。

 

そのために来ないので、読み込まれないという状態が発生しています。

 

サイトマップが読み込まれなくてもインデックス登録をされる

サイトマップって実はなくても、インデックス登録はされたりします。

 

というのもクローラーがURLを発見して記事がインデックスされる方法はサイトマップだけではないからなんですよね。

 

実は、リンクもインデックスに必要な方法の1つなんですよね。

 

例えばサイトやブログには、トップページという記事の一覧ページがありますよね。


一覧ページというのは記事ページにリンクしているためにすべてのページにアクセスするようになっています。

 

そのためにたとえサイトマップがなくてもGoogle先生は認識できるんですね。

 

時間がたてばどの記事もインデックスされるというお話にはなるんですが、ブログの記事は見てもらってなんぼですよね。

 

サイトマップは送信しておいて損はないですね。

 

 

はてなブログの送信すべきサイトマップの種類

サイトマップ②

はてなブログのサイトマップって、どれかってよく聞かれますよね。

 

というのもサイトマップには、種類があるからなんですよね。

 

一般的には、以下のように言われることが多いようです。

 

  • sitemap.xml
  • sitemap_index.xml
  • sitemap_periodical.xml?year=20xx&month=xx

 

robots.txtにて読み込まれているサイトマップの確認!

上記のサイトマップから読み込んでいるのは、いったい何なのでしょうか。

 

robots.txtにて、読み込まれているサイトマップを確認しましょう。

 

サイトURLの後ろに、/robots.txtと入れ込むだけで確認ができます。

 

sitemap_index.xmlが、正しいことがわかりますね。

 

これに関しては、GoogleSearchConsoleからのサイトマップ送信に失敗する問題についてにてはてなブログの運営でもいわれていますし、間違いないですね。

 

ですから、送信するサイトマップはsitemap_index.xmlにしましょう。

 

サイトマップのfeedも一緒に送信しよう

サイトマップとともにfeedも一緒に送信しましょう。

 

というのもGoogle先生が推奨しているから

 

Google先生はウェブマスター向け公式ブログの中で、以下のようなことを言ってます。

 

  • 「Google では、最適なクロールを行うために、XML サイトマップと RSS/Atom フィードの両方を使用することをおすすめしています。」
  • 「RSS/Atom フィードによって、サイト内のすべての更新情報を取得することができるからです。」
  • 「正規 URL であること。内容の重複した複数のページの URL が指定されていることがありますが、これは間違った指定方法です。そのままでは、インデックスが改善されない一方で、あなたのサーバーの負荷が増大してしまいます。」

(引用元:Google ウェブマスター向け公式ブログ [JA] : XML サイトマップと RSS/Atom フィードのベストプラクティス)

 

そのために、feedも一緒に送信しておいたほうがいいですね。

 

定期的にサーチコンソールを確認しよう。

定期的にサーチコンソールを確認しましょう。

 

というのも時間が解決する可能性もあるからなんです。

 

ちなみに僕はこのブログは2年たった今、ようやくエラーがなくなりましたが、読み込みできませんでしたが多かった時期もありました。

 

それで毎日のようにurl検査からインデックス登録の申請をしていますね。

 

ですからしっかりと確認して置きましょう。

 

サイトマップ送信が失敗したときの対処法

対処法

サイトマップ送信するもいつまでも成功しない時には、URL検査からインデックス登録の申請を出すのがいいですね。

 

サイトマップをブログ更新するたびに送信するというのもありますが、今までの書いた記事のすべてを送信することになってしまうんですよね。

 

そのためにデータ量が多くなってしまいます。

 

それに比べてURL検査なら更新した記事だけのURLを送信するため、クロールにも時間がかからないですし、サーバーに負荷もかからないですよね。

 

そのためにurl検査を使うようにしましょう。

 

まとめ|サイトマップの読み込まない理由を知って対策を。

お疲れさまでした。

 

ここまでサイトマップを読み込まない理由から対策、読み込む種類などをお話してきました。

 

まとめると以下の通り。

 

まとめ
  • はてなブログではサイトマップを読み込んでくれない事件が頻発している
    • はてなブログのサイトマップを読み込んでくれない理由は以下の通り。
      • 理由①サイトマップの構造上の理由
        • サイトマップの構造上の話。はてなブログのサイトマップの構造は、以下の通り。
          • はてなブログのサイトマップは、親階層と子階層の2階層構造になっている
          • 親階層では、子階層へ続くリンクが貼られていて、月別ぺージの最終更新日時が書いてある
          • 子階層は、月毎に公開した各記事ページがかいてあり、最終更新日時が書いてある
        • 構造には問題がないけど、更新日時がすべて同じになるのが問題だった
        • でも今は問題は解決している
      • ②サイトマップの送信の自動化ができない
    • サイトマップが読み込まれなくてもインデックス登録はできる。なぜなら記事一覧ページがあるから検出できる。
  • はてなブログの送信すべきサイトマップの種類
    • サイトマップの送信する種類はよく聞かれますね。sitemap_index.xmlですね。
    • robots.txtにアクセスして、サイトマップの種類を調べましょう。
    • サイトマップとともにfeedも送っておきましょう。
    • 定期的にサーチコンソールを確認しておきましょう。
  • サイトマップが読み込まれない時の対処法は、URL検査からインデックス登録申請を行うようにする。というのもサイトマップを送ると今まで書いた記事をすべて送ることになるのでデータが大きくなるから。

 

という感じ。

 

ワードプレスの場合にはサイトマップを送るとすぐにインデックス登録がされますが
はてなブログの場合はそうは行きません。

 

そのために定期的に確認をしてサイトマップを読み込みをするように努力が必要なのです。

 

サーチコンソールを確認する癖をつけておきましょう。

 

サイトマップがあると後々楽になりますので確認しておきましょうね。

 

もし送信していないなら、アフィリエイトの強い味方、サーチコンソールの使い方を解説 をご参考の上すぐに送信しましょう。

 

3分で済みますので・・・

 

ってことで今回は以上です。
また次回に。