FC2ブログ

2013年1月6日(日) 平均化、でもデータは見えないといけない

●今日は、映画へ行くとか。人混みは気持ちが折れるので苦手なのだが。
●映画は結局「ワンピースFILMZ」へ。もう3週間目のためか人も少なく、席も広くて。内容は、そつなく、テンポよく、でもサイドストーリーをここまで広げてやる必然性はあるのか、と思いながら、ワンピース、収束するのであろうか、と思うところ。グインサーガーも広げて広げて作者死んでしまったなぁ、と。[18:10]
●平成18年に現地茶園で同一管理者の3圃場の一番茶期経時枠摘み調査を実施。圃場による差は、その年の霜害の影響(特に圃場№1)と整せん枝処理状況の違い(圃場№2は前年中切り更新処理)と判断していた。
goto1.jpg
●基本、枠摘み調査をする場合、自分は茶株上で3枠採取(南北畝の場合は東側-中央-西側、東西うねの場合は北側-中央-南側で採取)するのだが、グラフにする場合は3点データを平均化して1点データとして使用していた。その3点データを全てplotすると以下の図のようになる(数字は圃場№、eはEast:東側、mはmiddle:中央、wはWest:西側を示す)。
goto2.jpg
●これを圃場別、採取位置別に分類すると以下のグラフ群に。圃場№2と№3の関係性は、比較論的には芽重型と芽数型の影響があると考えられるが、圃場により採取位置の影響の在り方が異なり、特に圃場№2においては、その他2圃場と異なり、東側枠の生育が中央及び西側枠より早く、他2枠と重量増加に伴う窒素含有率減少傾向が異なる点が面白い。多数点をサンプリングする頻度主義者なら(自分だが)、やはりそのallデータを視覚化し、それに基づいて平均化によるトレンド確認を図る基本を忘れてはいけないと再認識。
goto6-60.jpg
●今日の一冊。金明哲著「Rによるデータサイエンス」【2007年,森北出版㈱,¥3,600+税】。多分、Rを知って初めて買ったのがこの本。開いたページに並ぶグラフの多様性にわくわくした事を覚えている。基本、Rのコマンドとグラフ、そして統計手法の簡潔な解説のみ、の本であるが、統計のなんたるかも知らなかった(今も分かりませんが)自分にとっては視覚で感じられる統計本というのはありがたい存在でした。今ならもっと丁寧な解説書は多分に出ていると思うが、個人的にはR本の中では好きな方である。なぜなら、グラフがたくさん載っているから。
rBook-kin.jpg
[ 2013/01/06 ] 統計 | TB(0) | CM(0)