どれだけのサンプル数があれば信頼できるデータなのか

    この「消し」ファクターをいくらで買いますか?」の続きです。

    2005年から2014年の10年間で
    頭数:20,615
    単勝的中数:1,295
    単勝的中率:6.3%
    単勝回収率:62.4%

    という、統計的に明らかに回収率が低い馬は、
    実は馬名が「シ」から始まる馬でした。
    もし期待していた人がいたらごめんなさい。。。

    馬王Zであれば、回収率データ分析ウィンドウで「条件」欄に
    LEFT(馬名,1)="シ"
    と入れれば検証できます。

    答えを聞けば、そんなファクターは何の役にも立たないと
    ほとんどの人が考えると思いますが、
    私がこの記事で伝えたかったことは、このファクターが
    役立つとか、そういうことではありません。
    ファクターを分析するときに、どれだけのサンプル数があれば
    信頼できるのだろうかということです。

    G1シーズンの競馬新聞では、そのG1の過去10年の
    連対馬から、勝ち馬を分析したりしていますが、
    そんな20程度のサンプル数では信頼できません。

    でも、上の例のように、2万のサンプル数であっても
    信頼できないこともあります。
    結局、サンプル数がどれだけあれば信頼できるかなんて、
    誰にも分かりません。

    サンプル数よりも競馬センスの方が大事だと思います。
    競馬センスがあれば、僅かなサンプル数でも有効なファクター
    を見分けることができると思います。

    アナログ予想で黒字を達成できているような人は、
    自分が記憶しているレース(数多くはないレース)の記憶に
    基いて傾向を的確に読み取れるような人だと思います。

    コンピュータを使ったデータ分析でも、競馬センスが全くなければ
    どんなに統計学に精通していても
    有効なファクターを見分けることは容易ではないと思います。

    なので、競馬センスを磨くためにも、データ分析ばかり
    するのではなくて、レースを見たり、競馬本を読んだり、
    インターネット上の情報を見たりして、
    アナログ的な競馬予想にも精通する必要があると思います。

    ちなみに、上記のサンプル数の考え方は、
    自分の予想方法が将来うまくいくかどうかを判断する場合にも
    当てはまります。
    つまり、単勝を2万レース(1日20レースとして10年間)
    買い続けたとしても、運が無ければ、
    その予想方法本来の回収率よりも10%以上下回ることも
    “あり得る”ということです。

    とりあえず、今後は馬名が「シ」で始まる馬に注目したいと思います(笑)
    関連記事

    テーマ : 競馬予想
    ジャンル : ギャンブル

    自己紹介

    卍(まんじ)

    管理人:卍(まんじ)
    2005年~2009年の5年間で馬券の配当で得た所得に関して裁判で争い、雑誌「競馬王」では「1億5000万円稼いだ馬券裁判男」として取り上げられました。

    卍の著書
    最新記事(6件分)
    過去記事一覧(カテゴリ別)
    過去記事一覧(月別)
    リンク
    メールフォーム

    名前:
    メール:
    件名:
    本文: