www.rtpro.yamaha.co.jpのFAQ


検索エンジンは、何故、ホームページの情報を持ってるのですか?


最終変更日 2018/Nov/06
文書サイズ 3.0KB


検索エンジンは、何故、ホームページの情報を持ってるのですか?


特別な情報提供をしている訳ではありません。

WWWの検索エンジンでは、インディックスの作成の為に定期的にWWWサーバを 調べにきます。それを行なうプログラムをこの世界では「ロボット」と言います。
WWWドキュメントルートに「robots.txt」というファイルを置き、 ロボットによる調査の可否を意思表示します。
もし、

 http://host.any.domain.com/robots.txt
が無いと、 検索エンジン(ロボット)による調査を許可したものと見倣されるようです。

本サーバでは、ロボットによる検索を禁止しておりません(robots.txtが無い)ので、 WWWの検索エンジンで検索すると、ヒットする訳です。
でも、エラーログが増えるのイヤなんで......
現在のrobots.txtファイル

-------- 
User-agent: *
Disallow: /cgi-bin/
--------

例)ロボット検索を全く禁止する場合の「robots.txt」の内容。

-------- 
User-agent: *
Disallow: /
--------
「User-agent」には、ロボットの名前を。
「Disallow」には、検索されたくないディレクトリを。

詳しくは、http://info.webcrawler.com/mak/projects/robots/robots.htmlなどを参照してください。



[ FAQ for www.rtpro.yamaha.co.jp ]
[ WWWサーバ / WWWブラウザ ]