<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
		xmlns:xhtml="http://www.w3.org/1999/xhtml"
>

<channel>
	<title>東大島に暮らすWEBディレクターブログ &#187; robots.txt</title>
	<atom:link href="http://web-dire.net/tag/robotstxt/feed" rel="self" type="application/rss+xml" />
	<link>http://web-dire.net</link>
	<description>WEBと音楽に関連した情報ブログです。WEB情報を中心でSEO・Wordpress関連と好きな音楽の情報を発信していきます。</description>
	<lastBuildDate>Tue, 07 Sep 2010 03:44:41 +0000</lastBuildDate>
	<language>ja</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.0.1</generator>
<xhtml:link rel="alternate" media="handheld" type="text/html" href="http://web-dire.net/tag/robotstxt/feed" />
	<atom:link rel='hub' href='http://web-dire.net/?pushpress=hub'/>
		<item>
		<title>robots.txt　アクセス許可</title>
		<link>http://web-dire.net/archives/1035</link>
		<comments>http://web-dire.net/archives/1035#comments</comments>
		<pubDate>Thu, 23 Apr 2009 04:59:39 +0000</pubDate>
		<dc:creator>takashi</dc:creator>
				<category><![CDATA[SEO対策]]></category>
		<category><![CDATA[robots.txt]]></category>

		<guid isPermaLink="false">http://visicre.sakura.ne.jp/?p=1035</guid>
		<description><![CDATA[通常のrobots.txtは、ロボットの巡回を禁止（Disallow）するために利用するファイルです。 拒否するために使用するファイルを逆に迎え入れる内容へと設定もできるのです。 それは、すべてのファイルにアクセスしてよいという許可の指示（Allow）を、あえて設定することによってアクセスの許可を出します。 普通に考えれば巡回してくれるから必要ないと考えがちですが、サイトには必須なファイルですし、何も明示していないサイトとサイトを見てくださいと許可を出しているサイトでは、ロボットの記憶に刻まれれば巡回の回数も増える可能性があります。 いろいろな考えがありますが、ロボットに対して目測とそれに対しての実績で対策するしかないと今は感じています。 ■robots.txtのファイル名でファイルを作成。 以下の内容を入れてファイルをアップする。 User-Agent: * Allow: /]]></description>
			<content:encoded><![CDATA[<p>通常のrobots.txtは、ロボットの巡回を禁止（Disallow）するために利用するファイルです。<br />
拒否するために使用するファイルを逆に迎え入れる内容へと設定もできるのです。<br />
それは、すべてのファイルにアクセスしてよいという許可の指示（Allow）を、あえて設定することによってアクセスの許可を出します。
</p>
<p>普通に考えれば巡回してくれるから必要ないと考えがちですが、サイトには必須なファイルですし、何も明示していないサイトとサイトを見てくださいと許可を出しているサイトでは、ロボットの記憶に刻まれれば巡回の回数も増える可能性があります。</p>
<p>いろいろな考えがありますが、ロボットに対して目測とそれに対しての実績で対策するしかないと今は感じています。</p>
<p></p>
<p><strong>■robots.txtのファイル名でファイルを作成。</strong><br />
以下の内容を入れてファイルをアップする。<br />
<br />
User-Agent: *<br />
Allow: /</p>
<div style="float:left;margin:0px 0px 0px 0px;"></div>]]></content:encoded>
			<wfw:commentRss>http://web-dire.net/archives/1035/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
	<xhtml:link rel="alternate" media="handheld" type="text/html" href="http://web-dire.net/archives/1035" />
	</item>
		<item>
		<title>robots.txt　その２</title>
		<link>http://web-dire.net/archives/1024</link>
		<comments>http://web-dire.net/archives/1024#comments</comments>
		<pubDate>Wed, 22 Apr 2009 14:04:26 +0000</pubDate>
		<dc:creator>takashi</dc:creator>
				<category><![CDATA[SEO対策]]></category>
		<category><![CDATA[robots.txt]]></category>

		<guid isPermaLink="false">http://visicre.sakura.ne.jp/?p=1024</guid>
		<description><![CDATA[robots.txtの必要性の根拠はないんだが、ロボットはまずrobots.txtのこのテキストファイルを探して毎回巡回している。 だから根拠はないけど、robots.txtは必要なんです。 もう一度言います！ robots.txtは必要なのです。 記述方法は、下記を参照↓↓ &#160; ======================================================= &#160; ■全てのディレクトリを巡回されたい場合・・・ User-agent: * Disallow: のように記述する。 &#160; ======================================================= &#160; ■Googleのロボット（Googlebot）だけ、すべてのディレクトリ巡回やファイルGETを拒否する場合・・・ User-agent: [...]]]></description>
			<content:encoded><![CDATA[<p>robots.txtの必要性の根拠はないんだが、ロボットはまずrobots.txtのこのテキストファイルを探して毎回巡回している。<br />
だから根拠はないけど、robots.txtは必要なんです。</p>
<p>もう一度言います！<br />
robots.txtは必要なのです。</p>
<p>記述方法は、下記を参照↓↓</p>
<p>&nbsp;</p>
<p><span id="more-1024"></span><br />
=======================================================</p>
<p>&nbsp;</p>
<p>■全てのディレクトリを巡回されたい場合・・・</p>
<p>User-agent: *<br />
Disallow:</p>
<p>のように記述する。</p>
<p>&nbsp;</p>
<p>=======================================================</p>
<p>&nbsp;</p>
<p>■Googleのロボット（Googlebot）だけ、すべてのディレクトリ巡回やファイルGETを拒否する場合・・・</p>
<p>User-agent: Googlebot<br />
Disallow: /*</p>
<p>と記述する。</p>
<p>&nbsp;</p>
<p>=======================================================</p>
<p>&nbsp;</p>
<p>■Yahoo!のロボット（Yahoo! Slurp）だけを、全てのディレクトリの巡回やファイルGETを拒否する場合・・・</p>
<p>User-agent: Slurp<br />
Disallow: /*</p>
<p>と記述する。</p>
<p>&nbsp;</p>
<p>=======================================================</p>
<p>&nbsp;</p>
<p>■すべてのロボットを拒否</p>
<p>User-agent: *<br />
Disallow: /*</p>
<p>と記述する。</p>
<p>&nbsp;</p>
<p>=======================================================</p>
<p>&nbsp;</p>
<p>■ロボットの巡回を制限する<br />
訪問までの時間を指定<br />
例えば10秒経たないとアクセスできないようにするには、</p>
<p>MSNBotの場合<br />
User-Agent: msnbot<br />
Crawl-Delay: 10</p>
<p>Yahoo! Slurpの場合<br />
User-agent: Slurp<br />
Crawl-delay: 10<br />
Googleはできるかどうかは分からないが、そういう話は聞いたことがない。</p>
<p>&nbsp;</p>
<p>=======================================================</p>
<p>&nbsp;</p>
<p>=======================================================</p>
<p>■下記の記述は、クローラーに下記の４ページを巡回しないように指示を出していることになります。</p>
<p>User-Agent: *<br />
Disallow: /cgi-bin/<br />
Disallow: /private/<br />
Disallow: /testground/<br />
Disallow: /work/</p>
<p>=======================================================</p>
<div style="float:left;margin:0px 0px 0px 0px;"></div>]]></content:encoded>
			<wfw:commentRss>http://web-dire.net/archives/1024/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
	<xhtml:link rel="alternate" media="handheld" type="text/html" href="http://web-dire.net/archives/1024" />
	</item>
		<item>
		<title>robots.txt 検索ロボットのアクセス管理する</title>
		<link>http://web-dire.net/archives/841</link>
		<comments>http://web-dire.net/archives/841#comments</comments>
		<pubDate>Sun, 29 Mar 2009 08:27:27 +0000</pubDate>
		<dc:creator>takashi</dc:creator>
				<category><![CDATA[SEO対策]]></category>
		<category><![CDATA[robots.txt]]></category>

		<guid isPermaLink="false">http://visicre.sakura.ne.jp/?p=841</guid>
		<description><![CDATA[【robots.txt ファイルを作成する最も簡単な方法】 ウェブマスター ツールの robots.txt 生成ツールを使用すること。 作成後、robots.txt 解析ツールを使用して、期待どおりに作動しているかどうかを確認できます。 robots.txt ファイルを作成した後、ドメインのルートに置いて「robots.txt」という名前で保存します。ファイルを確認する際、ロボットはこの場所を確認します。他の場所に保存されている場合は認識されません。 非常に単純な形式の robots.txt ファイルでは、次の 2 つのルールを使用します。 User-agent: 以降のルールを適用するロボット Disallow: [...]]]></description>
			<content:encoded><![CDATA[<p><strong>【robots.txt ファイルを作成する最も簡単な方法】</strong><br />
ウェブマスター ツールの robots.txt 生成ツールを使用すること。<br />
作成後、robots.txt 解析ツールを使用して、期待どおりに作動しているかどうかを確認できます。</p>
<p>robots.txt ファイルを作成した後、ドメインのルートに置いて「robots.txt」という名前で保存します。ファイルを確認する際、ロボットはこの場所を確認します。他の場所に保存されている場合は認識されません。</p>
<p>非常に単純な形式の robots.txt ファイルでは、次の 2 つのルールを使用します。</p>
<p>User-agent: 以降のルールを適用するロボット<br />
Disallow: ブロックする URL<br />
この 2 行はファイルの各エントリとみなされます。含めるエントリの数に制限はありません。1 つのエントリに複数の Disallow 行と複数の user-agent を含めることができます。</p>
<p>　</p>
<p><strong>「 User-agent 」 以降のルールを適用するロボット</strong><br />
user-agentというのは、特定の検索エンジンロボットのことを指しています。そして、ウェブマスターツールにては、一般的なロボットがリスト化されていて、特定のロボットを適用するようエントリを設定したり、全てのロボットに適用させるようにアスタリスク（*）を設定できます。</p>
<p>（記述例?）<br />
User-agent: *</p>
<p>（記述例?）<br />
User-agent: Googlebot</p>
<p>　</p>
<p><strong>「 Disallow 」 ブロックする URL</strong><br />
Disallow 行にはブロックするページをリストします。特定の URL またはパターンを入力できます。エントリはスラッシュ (/) で始める必要があります。</p>
<p>■ サイト全体をブロックするには、スラッシュを使用します。<br />
Disallow: /</p>
<p>■ ディレクトリとそのコンテンツをすべてブロックするには、ディレクトリ名の後にスラッシュを入力します。<br />
Disallow: /junk-directory/</p>
<p>■ ページをブロックするには、ページをリストします。<br />
Disallow: /private_file.html</p>
<p>■ Google イメージ検索から特定のイメージを削除するには、次の記述を追加します。<br />
User-agent: Googlebot-Image<br />
Disallow: /images/dogs.jpg</p>
<p>■ Google イメージ検索からすべてのイメージを削除する場合、次のように記述します。<br />
User-agent: Googlebot-Image<br />
Disallow: /</p>
<p>■ 特定の種類のファイル (例: .gif ファイル) をブロックするには、次のように記述します。<br />
User-agent: Googlebot<br />
Disallow: /*.gif$</p>
<p>■ サイトのページに AdSense 広告を表示する一方で、クロールをブロックするには、Mediapartners-Google 以外のすべてのロボットを許可しないようにします。これによって、ページは検索結果に表示されなくなりますが、表示広告の決定に使用される Mediapartners-Google ロボットによるページ分析を許可できます。Mediapartners-Google ロボットは、他の Google ユーザー エージェントとページを共有しません。</p>
<p>例:<br />
User-agent: *<br />
Disallow: /folder1/</p>
<p>User-agent: Mediapartners-Google<br />
Allow: /folder1/</p>
<p><a href="http://www.google.com/support/webmasters/bin/answer.py?answer=40360"><strong>Google ウェブマスターツール</strong><br />robots.txt ファイルを使用してサイトへのアクセスを管理する用してサイトへのアクセスを管理する</a></p>
<hr />
<p><a href="http://www.google.com/support/webmasters/bin/answer.py?answer=83098&#038;hl=ja">robots.txt ファイルの生成</a></p>
<p><a href="http://www.google.com/support/webmasters/bin/answer.py?answer=35237&#038;cbid=-63q4ki9evalz&#038;src=cb&#038;lev=index">robots.txt のチェック</a></p>
<p style="margin: 30px 0px 20px 0px;">
<hr /></p>
<div align="center" style="display:table; width: 380px; height:100px; margin: 0px auto;">
<p style="float:left; margin: 10px 10px;" align="center"><a href="http://ameblo.jp/visicre/" target="blank"><img src="http://visicre.sakura.ne.jp/wp-admin/images/mushu.jpg" alt="かまやつじゃないムッシュのブログ" border="0" /></a></p>
<h4 align="center" style="margin-top:30px;"><a href="http://ameblo.jp/visicre/" target="blank">『かまやつじゃないムッシュのブログ』</a><br /><a href="http://ameblo.jp/visicre/" target="blank">http://ameblo.jp/visicre/</a></h4>
</div>
<div style="float:left;margin:0px 0px 0px 0px;"></div>]]></content:encoded>
			<wfw:commentRss>http://web-dire.net/archives/841/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
	<xhtml:link rel="alternate" media="handheld" type="text/html" href="http://web-dire.net/archives/841" />
	</item>
	</channel>
</rss>
