計測データを元に、仮説を検証します。
生物に関するさまざまな計測値には「ばらつき」がつきものであり、前回に計測したデータも例外ではありません。
ばらつきのソース(源)は、次の3つです。データにばらつきがあると、次の2つの問題が生じます。
「統計」の大きな役割は、上の2つに対処することです。1に対するのが「記述統計」、2に対するのが「統計的推定・検定」です。
今回の実験では、約20(班によっては約15種)の樹木について仮説を調べますが、仮説が支持されたにしても、支持されなかったにしても、「たまたま調べた20種がそうだっただけじゃないの?」という反論が成り立ちます。統計的推定・検定のもう1つの役割は、これを乗り越えることです。
仮説とそれに基づく予測(作業仮説)は、単葉を持つ樹種であれば当てはめることができるものです。そこで、「単葉を持つ全ての樹種を対象とした仮説」を「計測した20種」を通じて調べる、という論理を取ります。つまり、「計測した20種」を「単葉を持つ全ての樹種から、仮説の検証のために選び出した代表」と見なします。
図式化すると、次のようになります。
あらゆる樹種(母集団)→標本抽出(サンプリング)→計測した20種(標本/サンプル)
記述統計の役割は、データの含まれる情報の圧縮です。
だから、記述統計における圧縮のデザインは、検証しようとしている仮説によって変わります。
データの分布や大小を表現するのに、上のような表現がよく使われます。
使用例1 (表の場合)体長 (cm) | 体幅 (cm) | |
雄 (n=12) | 2.5±0.61 | 1.2±0.22 |
雌 (n=10) | 2.8±0.55 | 1.4±0.25 |
雌の体長が平均2.8cm (n=10, s.d.=0.55)なのに対して、雄は平均2.5cm (n=12, s.d.=0.61)と、雌の方がやや大きかった。
分布が既知の分布に近似している場合は、平均値と標準偏差で分布の特徴のほとんどを表現することができます。既知の分布のうちもっとも有名かつ重要なものは「正規分布」です。
平均値と標準偏差による表現法は、分布が既知の分布、特に正規分布に近いときには問題ありませんが、そうでないときには不十分です。だいいち、正規分布に似ているかどうかは平均値と標準偏差だけ見ても分かりません。そこで、ヒストグラムによる表現が必要となります。
181.4 | 38.4 | 100.2 | 54.4 | 139.7 | 57.1 | 33.7 | 218.8 | 119.2 | 98.9 | 110.6 |
66 | 90.8 | 102 | 55 | 116.5 | 43.7 | 73.9 | 118.6 | 95.4 | 75.7 | 64.4 |
60.1 | 108.5 | 31.7 | 175.7 | 183.8 | 106 | 110.8 | 71.9 | 84.9 |
上の表から作成した度数分布(上)・頻度分布(下)の表
20 | 40 | 60 | 80 | 100 | 120 | 140 | 160 | 180 | 200 | 220mm |
0 | 3 | 4 | 6 | 4 | 9 | 1 | 0 | 1 | 2 | 1 |
20 | 40 | 60 | 80 | 100 | 120 | 140 | 160 | 180 | 200 | 220mm |
0 | 9 | 12 | 18 | 12 | 27 | 3 | 0 | 3 | 6 | 3 |
2種類の計測値の間の関係(この実験の場合は、葉柄の相対的な長さ(6)と葉身幅/葉身長(7)の関係が必要となります)は、散布図で表現します。
上の例では、葉身が長いほど幅も広くなる、という傾向が見られます。このことを「正の相関関係がある」と表現します。
作業仮説2. 「葉の基部の広がり」は「直立型」の種より「背腹型」の種の方が大きい
作業仮説3. 「葉の基部の広がり」は常緑樹の種と落葉樹の種でははっきりとした差がない
上の2つは、いずれも、大小関係に関する仮説です。上で述べたように、サンプルの平均値の大小→母集団の平均値の大小、にはなりません。ばらつきがある場合は、母集団の平均値が同じであっても、サンプルの平均値に差が出ます。そこで、次のような論理で仮説の妥当性を検証します。
以上の筋道はたいへん入り組んでいますが、Excelで、半自動的にpを算出することができます。
左の図は、2つのグループ(AとB)の差をt検定した例です。同じファイルがここを右クリック→保存でダウンロードできるので、図だけで理解できない人は、ダウンロードしたファイルを開いて確認して下さい。
セル「D4」と「I4」に、それぞれのt検定によるp(グループ間の差がないのに、サンプルで偶然差がついてしまった確率)が計算されています。
t検定の結果を計算する式は、
=TTEST(グループAの値がある範囲,グループBの値がある範囲,2,3)
となっています。最後の「,2,3」は、t検定にはいくつかの設定があるので、この実験に適した設定を指定している部分です。今回は説明を省略しますが、全ての場合に「,2,3」を入れるようにして下さい。
関数入力ウィンドウを使った入力の例
作業仮説1. 丸い葉は細い葉に比べて葉柄が長い→葉が丸くなるほど葉柄が相対的に長くなる
2つの変数が連動している(一方が大きければ、もう一方も大きい、一方が小さければ、もう一方も小さい)度合いを示す相関係数r(厳密には、Pearsonの積率相関係数)の関数「CORREL」(相関 correlation の略)を入力します。
=CORREL(範囲名1,範囲名2)という形になります。
有意な相関があるかないかは、下の表で判定してください。
N | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
---|---|---|---|---|---|---|---|---|---|
|r| | 0.817 | 0.771 | 0.732 | 0.697 | 0.667 | 0.640 | 0.616 | 0.594 | 0.575 |
N | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 |
|r| | 0.557 | 0.541 | 0.526 | 0.512 | 0.499 | 0.487 | 0.476 | 0.466 | 0.456 |
データから算出されたrの絶対値が表の値以上なら、p≦0.05で有意な相関(rが正の値なら有意な正の相関、負の値なら有意な負の相関)があります。
授業名・日付・実験のタイトル・課程またはコース名・学籍番号+氏名(全員分)。代表者1人または全員の携帯のアドレス。
実験の概要(とくに目的の明示)
仮説を中心とするパターン(仮説検証型)の典型例読者が同じ実験を再現できるだけの情報→再現性の確保
序論・材料と方法・考察で参照した文献のリスト
「参照」: 本文中で、文献の内容を述べたり、引用すること。
「文献」: 書籍・論文(学術雑誌論文)・ネット上のページ、など。学生実験の場合、教員が配付した資料・板書・口頭説明なども含まれます。
(本文中) 木下(1998)によれば、長野県堀金のマムシグサは、偽茎直径20〜25mmを境に雄と雌が分かれた。
(本文中) 長野県堀金のマムシグサは、偽茎直径20〜25mmを境に雄と雌が分かれた(木下 1998)。
(文献リスト中) 木下栄一郎 1998 性が変化する植物 『植物の世界36』朝日新聞社 pp. 52-79
なくてもよい。書いても書かなくても評価に影響はありませんが、教員へのクレームや要望がある場合、ここに書くと以降の授業に反映されるかも知れません。
「樹木の葉形」レポートは、班ごとに提出してください。
上の1・2はメールで、3は研究室(311)前の箱に入れてください。
〆切: 7/16(月) 16:00