意外とたくさんあるんです

こんなにある、自動車保険の保障の種類

Webを勉強しよう

文部科学省ホームページ
中高一貫教育の解説、学習指導要領の全文、各種審議会情報。 ... 「質の高い大学教育推進プログラム」選定取組のWebサイトのリンク集について ... 本Webサイトにおけるアクセシビリティへの取り組みについて紹介します。 メールマガジン ...
http://www.mext.go.jp/

Yahoo!ウェブ検索APIで検索した際に、一般的な言葉で検索すると、ヒット件数が2147483647になってしまいます。
これ以上大きい数を取得する方法はありますでしょうか?
http://chalow.net/2005-10-12-1.htmlこちらのサイトの手法を使ってTF-IDF法を実装しています。
たとえば"info"のような一般的な言葉では、ヒット数(totalresultsavailable)として32bit符号付き整数の最大値である2147483647が帰ってきます。
以下はクエリと帰ってきたXMLの一部です。
クエリhttp://api.search.yahoo.com/WebSearchService/V1/webSearch?appid=<YOURAPPID>&query=info&results=1&language=en&country=us&adult_ok=0&similar_ok=0&format=html結果<resultset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="urn:yahoo:srch" xsi:schemalocation="urn:yahoo:srch http://api.search.yahoo.com/WebSearchService/V1/WebSearchResponse.xsd" type="web" totalresultsavailable="2147483647" totalresultsreturned="1" firstresultposition="1" moresearch="/WebSearchService/V1/webSearch?query=info&appid=<YOURAPPID>&region=us">そのほかにも「google」や「yahoo」でも同様の結果が帰ってきてしまいます。
TF-IDF法として利用するには、それらのキーワード間でヒット数の優劣がついてほしいです。
そこで以下の二つについて、ご存じならばご教授願えますでしょうか。
1.2147483647以上の数値を返すことはできるのか。
2.検索条件をコントロールすることで、2147483647以下の値を返すことはできるのか。
http://developer.yahoo.co.jp/
http://api.search.yahoo.com ということは、米ヤフーのAPIを使っているようですね。
試してみてわかったのですが、日本のヤフーと米ヤフーでこの部分の挙動が違うようです。
「YahooDemo」の部分は適宜読み替えてください。
search.yahooapis.comの場合はご指摘のとおりhttp://search.yahooapis.com/WebSearchService/V1/webSearch?appid=YahooDemo&query=this&results=1totalResultsAvailable="2147483647"が返ってきますが、search.yahooapis.jpの場合はhttp://search.yahooapis.jp/WebSearchService/V1/webSearch?appid=YahooDemo&query=this&results=1totalResultsAvailable="20800000000"が返ってきています。
というわけで、日ヤフーのウェブ検索APIを使えば解決します。
http://developer.yahoo.co.jp/webapi/search/websearch/v1/websearch.htmlちなみに、特徴語抽出ができればいいのだったら、6月に公開されたキーフレーズ抽出APIを使えば、特にプログラムを書かなくても一発で取得できると思います。
http://developer.yahoo.co.jp/webapi/jlp/keyphrase/v1/extract.html

Yahoo! JAPAN

  • ウェブ全体を検索
  • このサイト内を検索