このノートブックを使えば、『手を動かしながらやさしく学べるはじめてのAIデータサイエンスリテラシー』 (技術評論社)に掲載しているWolfram言語のプログラムを直接実行することができます。最初に、右上のメニュー [ Make Your Own Copy ] をクリックし、自分のWolfram Cloudにこのノートブックをコピーして利用しましょう。詳しくは、序章 「0-3 Wolfram言語を使うための準備」および「0-4 本書のプログラムを実行する方法」(P11〜16ページ)を参照して下さい。なお、このノートブックでは、本書独自のフォーマットを使ってプログラムの入力部分にオレンジの枠,出力部分にブルーの枠がついたものとなっています。新規でノートブックを開いた時のまっさらのノートブックとは異なりますが、通常のノートブックと同様にプログラムを自分で入力することもできます。

第7章 統計学の基礎

7-4 演習:ヒストグラムと基本統計量を求めてみよう

データのリストを変数に代入する

In[1]:=
data="学籍番号","数学","国語","英語",{10001,67,55,42},{10002,42,50,33},{10003,55,42,57},{10004,87,82,35},{10005,92,84,30},{10006,60,70,54},{10007,35,40,70},{10008,46,32,82},{10009,72,68,42},{10010,95,98,30};
Grid[data]
Out[2]=
学籍番号
数学
国語
英語
10001
67
55
42
10002
42
50
33
10003
55
42
57
10004
87
82
35
10005
92
84
30
10006
60
70
54
10007
35
40
70
10008
46
32
82
10009
72
68
42
10010
95
98
30
testdata=Drop[data,1,1]
Out[3]=
{{67,55,42},{42,50,33},{55,42,57},{87,82,35},{92,84,30},{60,70,54},{35,40,70},{46,32,82},{72,68,42},{95,98,30}}
math=testdata[[All,1]]
Out[4]=
{67,42,55,87,92,60,35,46,72,95}
japanese=testdata[[All,2]]
Out[5]=
{55,50,42,82,84,70,40,32,68,98}
english=testdata[[All,3]]
Out[6]=
{42,33,57,35,30,54,70,82,42,30}

代表値を求める

Mean[math]//N
Out[7]=
65.1
Median[math]//N
Out[8]=
63.5
Commonest[math]//N
Out[9]=
{67.,42.,55.,87.,92.,60.,35.,46.,72.,95.}
{Min[math],Max[math]}
Out[10]=
{35,95}

散布度(散らばり)を調べる

Histogram[math,{10}]
Out[11]=
Variance[math]//N
Out[12]=
453.433
StandardDeviation[math]//N
Out[13]=
21.294

7-5 2つのデータの関係

散布図からデータの関係を可視化する

pairMJ=Transpose[{math,japanese}]
Out[14]=
{{67,55},{42,50},{55,42},{87,82},{92,84},{60,70},{35,40},{46,32},{72,68},{95,98}}
ListPlot[pairMJ,AxesLabel"数学","国語"]
Out[15]=

相関と相関係数

相関係数を求めてみよう
Correlation[math,japanese]//N
Out[16]=
0.91361
ListPlot[Transpose[{math,english}],AxesLabel"数学","英語"]
Out[17]=

線形回帰式を求めて可視化する

7-6 データの可視化(データビジュアライゼーション)

グラフに騙されない

​