平方和、分散、標準偏差の違いは?


うぱうぱ~!今回は平方和と分散と標準偏差の違いについて話します。

それぞれの公式

平方和の公式

 \displaystyle \sum_{i=1}^{n}{(x_i-\overline{x})}^2

平方和はもう一つ公式があり、 S=\displaystyle\sum_{i=1}^{n}{x^{2}_{i}}-\dfrac{(\displaystyle\sum_{i=1}^{n}{x_{i})}^{2}}{n} となる。言葉でいうと、個々のデータの二乗の和からデータの和の2乗の平均を引いたものである。

分散の公式

 V=\dfrac{S}{n-1}

標準偏差の公式

 s=\sqrt{V}

それぞれの概念の違い

それぞれの違いについて説明する。

分散は見ての通り、データと平均の差を二乗した和のことである。なのでデータ数が増えるほど値が大きくなってしまう。そのため分散が生れた。分散では平方和の平均であるのでデータ数が増えたとしても平均化によって値が大きくなっていくことがなくなる。さらにもっと直観的に分かるように標準偏差が生れた。平方和や分散はデータの二乗により単位が二乗になっている。そこで標準偏差によりルートを付けることで直観的になる。

まとめると

平方和は同じデータ数なら比較するのは可能である。しかし、データ数が増えると値が大きくなる。

分散は平方和を平均にするのでデータ数に依存することはない。しかし、元のデータ単位の二乗となっている。

標準偏差は分散の平方根なのでデータの単位と一致する。分散よりも直観的に分かりやすいのは、以下の具体例が分かりやすいです。

例えば、身長のデータを考えてみる。以下の2つのグループの身長データを比較すると:
グループA: 160 cm, 165 cm, 170 cm, 175 cm, 180 cm
グループB: 140 cm, 150 cm, 160 cm, 170 cm, 180 cm

これらのグループの分散と標準偏差を計算してみよう。
グループAの分散 = 100 グループAの標準偏差 = 10
グループBの分散 = 200 グループBの標準偏差 = 14.14

この例では、グループAとグループBの分散は異なるが、標準偏差を見るとグループBの方がグループAよりも身長データがより広がっていることが分かる。標準偏差はデータのばらつきを直感的に理解しやすく、単位が元のデータと同じであるため、比較や解釈が容易。
一方、分散は単位が元のデータの単位の二乗となるため、直接的な比較が難しくなる。例えば、分散が100と200の場合、その差がどれだけ大きいのか、実際のデータのばらつきの程度を直感的に把握するのは難しい。
したがって、標準偏差はデータのばらつきを直感的に理解しやすい尺度と言える。データのばらつきを比較する際には、標準偏差を使用することで、データの範囲や散らばり具合をより直感的に把握することができる。

 

最後まで読んでくれてありがとう!

今後は新しいIT大学生ブログを展開

ウパウパ~。



今日は宣言の為にブログを書いてまーす。

このブログをどんなアウトプットに使おうかなと思っており、考えた結果、3つの柱を発信していこうと決めました!

1つ目「react-three-fiber」に関すること。2つ目「統計学機械学習」に関すること。3つ目は「大学の学びやIT」に関することです。

react-three-fiberは自分が3Dが好きということで独学で勉強していることです。ドキュメントが充実しており、簡単に3D技術を楽しむことができます。

統計学機械学習では自分のアウトプットに使うので、どこかの誰かの為になればいいと思っています。週2本、それぞれ1つずつ発信できればいいと思います!

react-three-fiberのドキュメント

どうぞよろしくお願いします

IDEとは?分かりやすく解説

IDEとは、、、、??

IDEとは

IDE(英語:Intelligent Development Environment 日本語:統合開発環境)とは一言でいうと、「プログラムを書く際にめんどくさい準備が無くてもできちゃうよ!」っていうものです。扱う言語にも関係しますが、基本的にプログラムを書く際に必要なものがあります。例えば、エディタやコンパイラがあります。

つまりIDEはコンピュータープログラムを開発するうえで便利なツールであり、プログラムの作成、編集、テスト、およびデバッグを支援します。

IDEがなかったら

IDEがなかったら開発環境を整えるところから始めなければなりません。エディタの準備や、コンパイラインタープリター、デバッカーの準備が必要になります。IDEがない場合は苦労が多いので、IDEを使うのが一般的です。

エディターには、プログラミング用に特別に設計されたものがあります。例えば、Notepad++、Sublime Text、AtomVisual Studio Codeなどが挙げられます。これらのエディターには、自動補完機能、シンタックスハイライト機能、コードのデバッグ機能、バージョン管理機能などが含まれています。 また、コンパイラインタープリターなどの開発環境も別途用意する必要があります。開発環境には、プログラミング言語に合わせたコンパイラインタープリターが必要です。例えば、PHPの場合、PHPコンパイラをインストールする必要があります。 さらに、プログラムのデバッグには、デバッガーを使用することができます。デバッガーは、プログラムの実行過程を追跡し、プログラムのエラーを特定するためのツールです。

(非)基底変数とは?分かりやすく解説


(非)基底変数とは?事例を用いて考える!

はじめに

このサイトで解説している基底変数はオペレーションズリサーチにおいてシンプレックス法を行う際に利用するものです。シンプレックス法の内容は以下の内容を見てください。

Wikipediaシンプレックス法とは

シンプレックス法の解き方はこのサイトが分かりやすかったです

単体法を例題を用いて解説

(非)基底変数とは?

一言で表すと、非基底変数は0の値と(仮定)するものであり、その値によって定まるのが基底変数である。基底変数は英語で「Basic Variable」、非基底変数は「Nonbasic Variable」なので、添え字にB,Nを用いることが多いので覚えておくと良いです。自分なりの解釈を入れて説明すると、

例えば、方程式2つに対して、変数が2つあれば変数がなにか分かることができます(連立方程式)。しかし、方程式2つに対して変数が3つあると解くことができません。

以下の連立方程式を考える。
\( \begin{cases} x_1 + x_2 + x_3 = 1 \\\\ x_1 + 3x_2 + 2x_3 = 5 \end{cases} \)

上記の式を解くことはできません。しかし、ここで\(x_3=0\)としたとき、この方程式を解くことができます。このとき\(x_3\)を非基底変数、残りの2つを基底変数と呼びます。

事例を用いて必要性を解説

実際に事例を用いて考えてみます。


min\(z=-2x_1-3x_2 \\ x_1+x_2+x_3=4 \\ x_1+2x_2+x_4=6 \\\ x_1,x_2,x_3,x_4>=0 \)

解く際はシンプレックス法を使ってほしいですが、これを解くと次の3つの段階を踏みます。


\(c_B=[0,0],x_B=[x_3,x_4], C_N=[-2,-3], x_N=[x_1,x_2]\)


\(c_B=[0,-3],x_B=[x_3,x_2], C_N=[-2,-0], x_N=[x_1,x_4]\)


\(c_B=[-1/2,0],x_B=[x_1,x_2], C_N=[0,3/2], x_N=[x_3,x_4]\)

ここで非基底変数と基底変数がどれかは分かると思います。このように非基底変数と基底変数を交互に入れ替えて最適解を見つけていきます!

Excelで解くとこうなります。