血液型の第三次ブームだそうですね。以前 わかった2 にあった部分を抜き出してきました。死んでいるリンクを消して、一部追記しました。 血液型の都道府県分布は?血液型占いの根拠とかで、政治家にO型が多かったとかいうのがあった場合に、1票の格差から田舎にO型が大勢住んでいるということか? とか思ってしまったのですが、都道府県毎の血液型分布が載っているページはありませんか? コミュニティー系のサイトで、出身地と血液型の両方を聞いている様なところなら、知っているかも知れません。後は日赤か。誰か知っている人がいたら教えてください。
百科事典で血液型を見ると、オッテンベルク Ottenberg が6つの地域に分けたというのが出てきました。検索エンジンでさらに詳しいページが見つからないかとおもいましたが、血液関係のOttenbergは、Reuben Ottenberg が1907年に輸血に関してなにかした話しか見つけられませんでした。 『そんなバカな』の人に大量の無断転載をされた松田という人の本を以前買ったはずなので、それにすべての都道府県はなくても、部分的には載っていたのかも知れません。記憶には残っていません。他にも、構造主義生物学の人との論争とかも載っていた記憶があります。実家にあって手元にないので、、、。人類学の人も今では血液の他に無数のマーカーが使えるからそんなには調べていないのかな。調べてもWebには載せていないだけか? 外部リンク
以下のページに載っていました。
上のデータをグラフにプロットしてみました。通常は、A,B,Oの因子の比率をp,q,rの3文字で表すようです。また、上述のサイトに、p,q,rの計算結果付きの表がありました。Index of -~kamioka (http://www4.justnet.ne.jp/~kamioka/) 以下の図はそのデータのごく一部を図にプロットしたものです。上のサイトでは、800件あまりのデータを電子化してありました。右に行くほどAが多く、左上に行くほど、Bが多く、左下に行くほどO型が多く、右上に行くほどABが多くなっています。
1%の精度の表だったので、O,A,B,ABについてのデータに変換した上での誤差の二乗和が最小になる様に、+−0.5%の範囲内で、少しだけずらしています。以下は、日本の県ごとのデータに限って拡大表示してあります。元のデータでは、O,A,B,ABの比率は、1%の精度に丸めた上に、合計が100%になるように調整してあるので、最大で1.5%の誤差が含まれているはずです。合計100%になるようにする調整分の誤差についてはそのままです。また、p,q,rの計算方法は多様に存在しますが、同じ資料をもとにしているわけではない様で、かなり大きな誤差が出ているものもありますが、それについても放置してあります。 たとえば、僕が考えたのは、 1)p=sqr(O+A)-sqr(O) q=sqr(O+B)-sqr(O) r=sqr(O) でしたが、これでは合計が100%になりません。 2) p=sqr(O+A)-sqr(O) q=sqr(O+B)-sqr(O) r=1-q-p こうすれば、100%になりますが、rの誤差が大きくなります。百科事典には、 3) p=1-sqr(O+B) q=1-sqr(O+A) r=sqr(O) という式と、 4) p=(1-sqr(O+B)+sqr(O+A)-sqr(O))/2 q=(1-sqr(O+A)+sqr(O+B)-sqr(O))/2 r=sqr(O) という式が載っていました。1)と3)の平均ですが、合計100になるし、rの誤差も少ないので良い方法かなと思います。とはいえ、今なら、O,A,B,ABの比率に戻した時点での誤差が最小になるp,q,rの組を求めるのが正しいと思います。ここで問題になるのが、AB型の比率が低い場合、AB型のサンプル数も少ないわけで、比率の精度も、AB型の方が少ないわけで、O,A,B,ABに戻して誤差の二乗和を最小にするというのもまた荒い近似ということになってしまいます。誤差をサンプル数のルートで重み付けしてから最小化すべきでしょう。あるいは、ポアソン分布にあてはめて尤度最大という基準に、、、ただし、今回は元データが1%の精度なのでそこまでは意味が無いでしょう。 というか、これは小学校で習ったことについての疑問を引き起こすことになります。O,A,B,ABの比率を計算して1%の精度に丸めその合計が100%にならなくなった場合には、一番多いところでつじつまを合わせるという風に小学校の算数では習いませんでしたか? しかし、元々の誤差が多いのは、一番比率の少ない部分であるわけで、、、比例代表選挙での計算方式が一通りでないようなもので、途中で精度を落とす必要は現時点ではどこにもないので無意味な問題ですが。(比例代表選挙の場合でも、議員が多数決をするときに一人1票ではなく、得票数に比例する票数を投票できるようにすれば解決する問題です。精度を落とす技術的な必然性はありません。)
この図のためにわざわざVisualBASICでプログラムを書いてしまいました。これくらいのことは出来合いのアプリケーションでできるのでしょうが、、、まあ、どうせ、高かったりするのでしょうが。同じ位置に複数の県が来る場合には、サンプル数の多いデータだけを表示してあります。
関連ページ
|
関連ディレクトリ 関連サイト
外部リンク
|
|
|