
こんにちはGaraKutaです。
先日サーチコンソールを眺めていて気がついたのですが、PFDファイルがインデックス登録に引っかかっており問題となっていました。
そもそもPDFファイルをインデックスするつもりが無かったので、クローラーさんにそのページは登録しなくていいよ、と教えてあげることにしました。
通常のhtmlファイルならheader部分にmetaタグでnoindexを追加すれば良いのですが、PDFファイルではそれができなかったので、調べてみたことを備忘録します。
.htaccessファイルにX-Robots-Tagを設置する
インデックスを拒否したいPDFファイルがある階層より上の階層に「.htaccess」ファイルを設置し以下のように入力します。
<FlilesMatch "\.pdf$">
Header set X-Robots-Tag "noindex"
</FilesMatch>
全階層でPDFのインデックス拒否をしたいのであればルートディレクトリ直下でOKです。
X-Robots-Tagの動作確認方法
まずはサーチコンソールの「URL検索」で該当URLを検査します。

続いて「公開URLをテスト」をクリック

すると以下のような画面が表示されます。

「インデックス登録を許可?」の項目に「いいえ、’X-Robots-Tag’httpヘッダーで’noindex’が検出されました」が表示されていればX-Robots-Tagがちゃんと設定できているのでOKです。
あとはリンク元のaタグに「nofollw」を指定しましょう。「nofollw」を指定すると、リンク先のページへ評価を受渡さないようになり、インデックスされるのを防ぐことができます。
具体的にサンプルを書くと以下のような感じ。
<a href=”demo.pdf” rel=”nofollow”>
これでリンク元からもPDFページへのインデックスを防止することができます。
まとめ
大抵の場合PDFファイルはインデックスさせたくないのでは?
SEOを意識してPDFを作成している人は少ないと思うので、SeachConsoleでインデックス未登録になっている場合も多く、かえって邪魔になっているかと思います。
そんなときは「.htaccessファイル」にX-Robots-Tagを使ってnoindexを指定してあげればOKです。
あまりSearchConsoleに振り回されるのも良くありませんが、インデックス周りの項目を少しでもクリアにしたい方はお試しください。
それではまた〜。

コメントを残す