Yahoo! JAPANのGoogleの検索エンジンを採用したことでYahoo! JAPANの検索エンジン登録が終了しましたね。
気がつかなかったのですが、NAVERの検索エンジンへの登録が出来るようになっていたのでご紹介します。
この検索サイトは、韓国でよく利用されている検索エンジンで、livedoorの検索にも採用していることもあり、自分のサイトやブログを登録できるなら少しの可能性がある限り登録しておくべきでしょう!
Yahoo! JAPANのGoogleの検索エンジンを採用したことでYahoo! JAPANの検索エンジン登録が終了しましたね。
気がつかなかったのですが、NAVERの検索エンジンへの登録が出来るようになっていたのでご紹介します。
この検索サイトは、韓国でよく利用されている検索エンジンで、livedoorの検索にも採用していることもあり、自分のサイトやブログを登録できるなら少しの可能性がある限り登録しておくべきでしょう!
初歩的な考えから始めると、お互いにリンクを貼り合ってアクセスアップを図ることです。
リンクを貼ってもらったサイトからのアクセスはもちろんですが、被リンクを受けるとそのサイトから支持されているサイトとなり自分の運営サイトの評価が上がることになるのです。
特に、有名なYahoo!ビジネスエクスプレスのカテゴリ登録しているサイトからリンクされているとなりますと、サイトの評価はさらに上がるのです。カテゴリ登録しているサイトから流れてくる訪問者が増えるからです。
良いサイトからリンクをしてもらえるということは、良いサイトという証となるので、そういうリンクが多ければ多いほど効果がでます。
ですが、これだけを考えて常日頃生活をしていても意味がなく、自分のサイトの内容をもっと訪問者に対して、意味のあるサイト、実用性のあるサイトである必要があります。
特に、ユーザビリティ・アクセシビリティなどSEO対策を施していることが必要となります
「SEO = 訪問者への優しさ」と考えればサイトの構成も変わってくるはずです。
サイト内のリンク切れに注意!
リンク切れの確認は常に確認する。
「ユーザーに対して」
リンク切れによってサイト訪問者の期待を裏切り、離脱させてしまう可能性が高い。
「検索エンジンに対して」
サイトのメンテナンスを怠っているとみなされてしまい、サイトの評価を落としてしまう。
※リンク切れによるデメリット
ディレクトリ検索サイトの登録の際に大きなマイナス要因となってしまうため要注意。
そんなリンク切れをチェックするには ⇒ リンク切れチェックツール「deadlink.tv」
通常のrobots.txtは、ロボットの巡回を禁止(Disallow)するために利用するファイルです。
拒否するために使用するファイルを逆に迎え入れる内容へと設定もできるのです。
それは、すべてのファイルにアクセスしてよいという許可の指示(Allow)を、あえて設定することによってアクセスの許可を出します。
普通に考えれば巡回してくれるから必要ないと考えがちですが、サイトには必須なファイルですし、何も明示していないサイトとサイトを見てくださいと許可を出しているサイトでは、ロボットの記憶に刻まれれば巡回の回数も増える可能性があります。
いろいろな考えがありますが、ロボットに対して目測とそれに対しての実績で対策するしかないと今は感じています。
■robots.txtのファイル名でファイルを作成。
以下の内容を入れてファイルをアップする。
User-Agent: *
Allow: /
robots.txtの必要性の根拠はないんだが、ロボットはまずrobots.txtのこのテキストファイルを探して毎回巡回している。
だから根拠はないけど、robots.txtは必要なんです。
もう一度言います!
robots.txtは必要なのです。
記述方法は、下記を参照↓↓
最近のmetaタグに対していは、意識が薄くなりつつあり、「keywords」については、記述しても構わないがほとんど効果はないという状態です。
いろいろなMETAタグの効果があるのでご紹介いたします。
■表示言語文字を指定する
このMETAタグには文書のファイル形式やそのページが使用している表示言語を記述します。
日本語指定の書式には、「Shift_JIS」「x-sjis」「EUC-JP」「ISO-2022-JP」などが有ります。
■表示言語文字を指定する
このmetaタグには文書のファイル形式やそのページが使用している表示言語を記述します。
日本語指定の書式には、「Shift_JIS」「x-sjis」「EUC-JP」「ISO-2022-JP」などが有ります。
■スパイダーの巡回を制御する
検索ロボットのスパイダーは、サーチしたページをきっかけにリンクをたどって自動的に他のページを登録します。
なかには登録されたくないページもあるでしょうし、 逆に検索サイト上位登録のために積極的に検索ロボットに巡回してもらいたい時もあります。以下のタグを使って上手に検索ロボットのスパイダーを制御しましょう。
■スパイダーの巡回を制御する
検索ロボットのスパイダーは、サーチしたページをきっかけにリンクをたどって自動的に他のページを登録します。
なかには登録されたくないページもあるでしょうし、 逆に検索サイト上位登録のために積極的に検索ロボットに巡回してもらいたい時もあります。以下のタグを使って上手に検索ロボットのスパイダーを制御しましょう。
● そのぺージとそこからリンクしているページの両方とも巡回拒否
<meta name=”robots” content=”none”>?
● そのぺージのみOK、リンクを辿るのは拒否
<meta name=”robots” content=”index,nofollow”>?
● そのページの登録を許可する
<meta name=”robots” content=”index”>?
● リンクを辿るのはOK、そのページを指定するのは拒否
<meta name=”robots” content=”noindex”>?
● 下部階層ページの巡回を許可する
<meta name=”robots” content=”all”>?
● そのページとリンクされている全てのページの検索を許可する
<meta name=”robots” content=”index,follow”>
※infoseekは「follow」を指定してもサイト内のリンクは巡回してくれません。?
● このページを登録しないが、ページ内のリンク先は巡回を許可する
<meta name=”robots” content=”noindex,follow”>?
● そのページ内の画像が検索対象となるのを防ぐ
<meta name=”robots” content=”noimageindex”>?
● そのページ内の画像への直接リンクを防ぐ
<meta name=”robots” content=”noimageclick”>?
● 検索ロボットに後日、再巡回させる
<meta name=”revisit_after” content=”30 days”>
ロボットが訪れた際に後日再度訪問させたい場合に記述します。上記例(30日後にまたきてね)?
● 閲覧者のブラウザのキャッシュを制御する
<meta http-equiv=”pragma” content=”no-cache”>
ページがブラウザ側にキャッシュされるのを防ぎ、アクセスする度に最新のページを読み込ませる事ができます。?
● ページ内容の期限切れを伝える
<meta name=”Expires” content=”December 25, 2004″>
コンテンツの有効期限切れの日付を入力します。期限切れの場合、検索ロボットはデータベースから削除します。?
● 閲覧対象年齢層の指定
<meta name=”rating” content=”adult”>
そのページが対象とする利用者層を指定します。利用者の指定がなければ”general”と記述します。
未成年者用記述に、”child”、”safe for kids”があります。 ※上記例(未成年者閲覧禁止)?
● 指定ページをロードする
<meta http-equiv=”refresh” content=”30;URL=ロードしたいページのURL”>
contentで指定した値(上記例、30秒)の時間経過したら、指定したURLを表示します。時間とURLは ;(セミコロン)で区切って、両方ともcontent=の”"で囲まれた中に書きます。別ページへ自動ジャンプすることができるので、ページが移転したときなどに使うと便利です。但し、検索エンジンにスパム行為と取られデータから削除されてしまう事もあるので注意が必要です。
【robots.txt ファイルを作成する最も簡単な方法】
ウェブマスター ツールの robots.txt 生成ツールを使用すること。
作成後、robots.txt 解析ツールを使用して、期待どおりに作動しているかどうかを確認できます。
robots.txt ファイルを作成した後、ドメインのルートに置いて「robots.txt」という名前で保存します。ファイルを確認する際、ロボットはこの場所を確認します。他の場所に保存されている場合は認識されません。
非常に単純な形式の robots.txt ファイルでは、次の 2 つのルールを使用します。
User-agent: 以降のルールを適用するロボット
Disallow: ブロックする URL
この 2 行はファイルの各エントリとみなされます。含めるエントリの数に制限はありません。1 つのエントリに複数の Disallow 行と複数の user-agent を含めることができます。
「 User-agent 」 以降のルールを適用するロボット
user-agentというのは、特定の検索エンジンロボットのことを指しています。そして、ウェブマスターツールにては、一般的なロボットがリスト化されていて、特定のロボットを適用するようエントリを設定したり、全てのロボットに適用させるようにアスタリスク(*)を設定できます。
(記述例?)
User-agent: *
(記述例?)
User-agent: Googlebot
「 Disallow 」 ブロックする URL
Disallow 行にはブロックするページをリストします。特定の URL またはパターンを入力できます。エントリはスラッシュ (/) で始める必要があります。
■ サイト全体をブロックするには、スラッシュを使用します。
Disallow: /
■ ディレクトリとそのコンテンツをすべてブロックするには、ディレクトリ名の後にスラッシュを入力します。
Disallow: /junk-directory/
■ ページをブロックするには、ページをリストします。
Disallow: /private_file.html
■ Google イメージ検索から特定のイメージを削除するには、次の記述を追加します。
User-agent: Googlebot-Image
Disallow: /images/dogs.jpg
■ Google イメージ検索からすべてのイメージを削除する場合、次のように記述します。
User-agent: Googlebot-Image
Disallow: /
■ 特定の種類のファイル (例: .gif ファイル) をブロックするには、次のように記述します。
User-agent: Googlebot
Disallow: /*.gif$
■ サイトのページに AdSense 広告を表示する一方で、クロールをブロックするには、Mediapartners-Google 以外のすべてのロボットを許可しないようにします。これによって、ページは検索結果に表示されなくなりますが、表示広告の決定に使用される Mediapartners-Google ロボットによるページ分析を許可できます。Mediapartners-Google ロボットは、他の Google ユーザー エージェントとページを共有しません。
例:
User-agent: *
Disallow: /folder1/
User-agent: Mediapartners-Google
Allow: /folder1/
Google ウェブマスターツール
robots.txt ファイルを使用してサイトへのアクセスを管理する用してサイトへのアクセスを管理する
インターネットに情報を発信するコンピュータ(サーバ)の一部を自前で用意ができないユーザを対象に容量の一部を間貸しするサービスです。
通信事業者やプロバイダなど専門業者も存在して提供しているサービスです。
ほとんどのサービスは、一台のサーバを複数の顧客で共有するのが基本となっています。
基本的には、料金の上限は決まっており、システムの使えるか否かなども金額が高くなるほど、プロが必要とするサービスが備わっています。
バックリンクとは、いわゆる「被リンク」です。
自分のサイトのリンク(URL)がどれだけ他のサイトから張られているのかだと思います。
バックリンクの数の調べ方は、Yahoo!で調べたいページのURLの頭に「 link: 」をつけると調べることができます。
もし、気になる場合は調べてみてください。
(例)
「link:http://www.yahoo.co.jp/」
個人的には、バックリンク(被リンク)は、量より質が重要だと思っています。
例えば、チームマイナス6%に登録申請を出すとか・・・