goo住宅・不動産のメニューへジャンプ本文へジャンプ
gooトップ
ヘルプ

使い方、よくある質問、新着情報など

  • gooトップ
  •  | サイトマップ
  •  | ヘルプ
を検索

goo ヘルプ

ここからメニューです
  • ヘルプトップ | 
  • サイトマップ | 
  • よくある質問/お問い合わせ | 
  • ソフトウェア | 
  • プレスリリース
  • ヘルプ
  • >
  • Webクローラについて

よくある質問
goo よくある質問
gooサービス全般に関するよくある質問です
1 コメントをした人のIPアドレスを知ることはできますか?(機能/使い方)
2 gooスティック Ver6.0をインストールしようとすると、「could not access VB(サービス共通)
3 ログインしようとしてもログイン画面が繰返し表示されてしまうのですが ?(その他)
4 ID、パスワードを忘れてしまったのですが。(サービス共通)
5 ワンビリングからのお知らせメールの配信を止めてほしいのですが。(機能/使い方)

メニュー
目的別メニュー
├検索する
├ニュースを読む
├ショッピングに役立つ
├お出かけに役立つ
├エンタメコンテンツを楽しむ
├エンタメ情報を見る
├毎日の暮らしを豊かにする
├人生のステージに役立つ
├ネットを活用するツール
├ソフトウェア
├勉強に役立つ
├仕事に役立つ/法人向け
└携帯電話向けサービス
ポリシー 免責等
  • 会社概要
  • 広告掲載について
  • パートナー企業
  • gooからのお知らせ
  • プライバシーポリシー(個人情報保護方針)
  • ご利用にあたって
  • 個人情報の取り扱いについて
  • 免責事項

Webクローラについて


[goo ヘルプ] 2009/1/28

ichiroについて
Webクローラとは、インターネット上のWebサーバからWebページを 網羅的に収集し、検索エンジンのデータベースに反映させるためのシステムです。 「ichiro」は、NTTレゾナント株式会社が運用しているWebクローラの名称です。

*ichiro が収集した Webページは下記サイトでの検索サービスに使用させて頂きます。
(1) http://bsearch.goo.ne.jp/
(2) http://mobile.mmm.nttr.co.jp/
(3) http://mobile.goo.ne.jp/
(1)(2) は、画像、動画、音楽(音声)の検索サービスですので、HTML ページだけでなく、画像、動画、 音楽(音声)も収集させて頂きます。

また、システムの研究開発のための収集をさせて頂く場合もあります。

*ichiro は、皆様の Webサーバに負担をかけないために、以下のルールに従います。
1)robots.txt に従います
認識するのは、"User-agent:"、 "Disallow:"、 "Allow:" です。   robots.txt の書き方については、 こちらを 参照してください。

2)META TAG による収集制限に従います
認識するのは、"NOFOLLOW"、 "NOARCHIVE"、 "NOIMAGEINDEX"、 "NONE"、 "FOLLOW"、 "INDEX"、 "ALL"、 "NOSERVE"、 "SERVE"、 "ARCHIVE"、 "NOIMAGECLICK"です。   META TAG の書き方については、 こちらを参照して下さい。

3)同一の Webサーバに対しては、一度に 1ページしか Webページを収集しません
これは、複数のドメイン名を持つ Webサーバに対しても同様です。ある Webサーバが、A と B という二つのドメイン名を持っていても、A と B に同時に接続する事は致しません。

4)適切な間隔で収集します
収集間隔は状況によって変更されますが、動画等のファイルを収集した後は、長めに間隔をあける等の制御を行っています。

5)その他
その他、ichiro に関するご質問はヘルプデスクまでご連絡下さい。

下記の要領でご連絡頂けると、回答をより早く差し上げることができますので、ご協力をお願いします。
・件名には「[ichiro]」とご記入ください。
・お問い合わせ事項を本文にお書きください。

→English
wakame について
「wakame」はNTTレゾナント株式会社が運用するデータ解析用Webクローラのうちのひとつです。
1)クローラのIPアドレス

210.165.39.36
210.165.39.37

2)ユーザーエージェント
WakameCrawler/0.01(+http://help.goo.ne.jp/door/crawler.html)

3)robots.txt に従います
認識するのは、"User-agent:"、 "Disallow:"、 "Allow:" です。

4)META TAG による収集制限に従います
認識するのは、"NOFOLLOW"、 "NOARCHIVE"、 "NOIMAGEINDEX"、 "NONE"、 "FOLLOW"、 "INDEX"、 "ALL"、 "NOSERVE"、 "SERVE"、 "ARCHIVE"、 "NOIMAGECLICK"です。
  META TAG の書き方については、 こちらを参照して下さい。

5)適切な収集間隔
同一の Webサーバに対しては、一度に 1ページしか Webページを収集しません。
また収集間隔は状況によって変更されますが、同一ホストに対して概ね数秒程度 の間隔をあけるよう制御を行っています。

6)その他
その他、wakame に関するご質問はヘルプデスクまでご連絡下さい。

下記の要領でご連絡頂けると、回答をより早く差し上げることができますので、ご協力をお願いします。
・件名には「[wakame]」とご記入ください。
・お問い合わせ事項を本文にお書きください。
 
gooblogsearch について
「gooblogsearch」はNTTレゾナント株式会社が運用するブログ検索用Webクローラのうちのひとつです。
1)ユーザーエージェント
gooblogsearch/[バージョン]
例:gooblogsearch/2.0

2)robots.txt に従います
認識するのは、"User-agent:"、 "Disallow:"です。

3)META TAG による収集制限に従います
認識するのは、"NOINDEX"です。

▲ページトップ
モバイルgoo 携帯検索クローラについて
モバイルgoo 携帯検索クローラについてはこちらをご覧下さい。
▲ページトップ

goo ヘルプ
ヘルプ 基本情報
  • Webクローラについて  (2009/1/28)
  • 個人情報の取扱いについて  (2008/12/15)
  • プライバシーポリシー  (2008/12/15)
  • gooって何?  (2008/11/6)
  • あなたのサイトにgooの機能を:モバイル検索  (2008/10/2)
もっと読む>>
関連リンク
  • gooヘルプ
  • モバイルgoo 携帯検索クローラについて
  • gooトップ
  •  | サイトマップ
  •  | 広告掲載
  •  | 免責事項
  •  | プライバシーポリシー
  •  | ヘルプ
  • gooトップ
  • Copyright:(C) 2010 NTT Resonant Inc. All Rights Reserved.