化学徒の備忘録(かがろく)|化学系ブログ

理系の筆者が化学系の用語や論文、動画、ノウハウなどを紹介する化学ブログ

【科学基礎】数値の有効数字と誤差の計算方法

数値の取り扱いについて

科学実験において有効数字と誤差ほ非常に重要です。学生実験などでは、数値の正しい扱い方ができるかどうかは、大きく評価される部分です。測定によって得られた数字から計算し、表記するということは研究者の理解度が表れているといえます。

数値において、最終的に示す必要があるものは「最確値」と「信頼度」です。

例えば1.632×102 ±0.006×102と記入する場合、1.632×102が最確値であり、±0.006×102が誤差です。

f:id:syerox:20220305083206p:plain

有効数字について

レポートや論文を書くためには、この数値の有効数字と誤差の取り扱いからが重要になります。

まずは、有効数字から説明していきます。

有効数字では、数値の表示は確実な数字の1つ下の桁まで記入するようにします。目盛りを読む場合は、最小目盛りの1/10を目で読みとり、記入するということが、確実な数字の1つ下の桁まで読むということです。

不確実性は、目分に関する量だけが影響するわけではありません。ホールピペットの許容誤差が±0.02 mLの10 mLホールピペットを用いた場合、小数点以下二桁目には不確実性が表れるので、10.00 mLとなります。

四則演算による数値計算の有効数字の取り扱いに注意が必要です。

加算と減算(足し算と引き算)の場合には、最高位の桁にあわせます。

乗算と除算(かけ算とわり算)の場合には、最低の桁数にあわせます。

以下に例を示します。

加算はすべての数値の末尾の中で一番大きい桁にあわせます。

f:id:syerox:20220305163459j:plain

 

乗算の場合は、最低の桁数の方の数字に合わせます。

f:id:syerox:20220305164117j:plain

最確値について

一般的に、測定値の算術平均(標本平均)を最確値とします。この時、算術平均を算出において、加算と乗算が使われる¥ます。この加算と乗算を行う際には上の有効数字に注意する必要があります。

有効数字の桁数が決まると、有効数字以下の桁を四捨五入することはよくあります。ここでの注意点として、各計算を行うごとに四捨五入をしないことです。これは何度も四捨五入を繰り返すことで、その誤差の影響が残っていき、最終的に誤差の影響が大きくなってしまうからです。

誤差について

実際の実験では、計算の間違えなどの過失誤差や、装置や測定者の技術レベルによる系統誤差(系統的誤差)を検算や補正によって取り除くことで、最も確実な技術を確立して測定を行っていくことになります。

しかしながらその場合でも、同じ測定を行ったときに、全く同じ結果が得られるという結果は少なくなります。例えば、有機化合物を合成したときに、その収率が毎回完全に一致するかというと、そうはなかなかうまくいきません。これは偶然誤差(統計的誤差)が含まれるためです。

誤差とは測定値から真の値を引いた値です。しかしながら、真の値は、測定を繰り返し行うことで推測ができるだけで何かしらの誤差を含んでいるため、真の値自体はわからるわけではありません。

誤差の表現方法

誤差を表現する方法はいくつか存在します。

標本平均(x̄) ± 公算誤差(ε)

公算の誤差(ε, 標準誤差)の定義は最確値(標本平均)に対する交差誤差内(標本平均±ε)の測定値と、それから外れる測定値の数が等しく(50%信頼区間)なるような値である。

具体的には

 \displaystyle  \epsilon = 0.4385  \sqrt{ (d_1^2 + d_2^2 + d_3^2+\cdots +d_N^2  / N / (N-1) }

 = 0.675\times 平均値の不偏標準偏差

 = 0.6745 \sqrt{N} \times 不偏標準偏差

d1= (x_1 - 平均値)

となる。

標本平均(x̄) ±平均値の標準偏差

最確値を標本平均として、誤差は平均値の標準偏差を使って示す方法がよく行われます。

標本平均(x̄) ±2×平均値の標準偏差

も使われます。標本平均(x̄) ±平均値の標準偏差は測定値が68.3%となる範囲(68.3%信頼区間)を示し標本平均(x̄) ±2×平均値の標準偏差は測定値が95.4%となる範囲(95.4%信頼区間)を表しています。

正規分布が適用できない場合

ここまでで紹介した、表示方法は、正規分布をそのまま適用できる場合の手法です。しかしながら例えば学生実験のように、測定点が少ない場合など、実際にはこの方法で記述しないほうが良い場合もあります。

その場合にはstudentのt分布を用いた考察を行うとよいです。

学生実験など測定回数が少ない場合

測定数が30以下の場合には正規分布によらないと考えられるのが一般的です。そこで、このような場合には、studentのt分布を適用することが統計学によって示されています。測定点が多い場合には、studentのt分布は正規分布となります。

信頼区間を示す場合

最確値(標本平均(x̄)) ±信頼区間

数値データを最確値に信頼区間をつけて表示する方法があります。統計の場合では、95%か90%信頼区間を示す場合が多いが、68%という場合もあります。

実際の計算式

標本平均( \bar{x} )、公算誤差( \epsilon)、測定値の(不偏)標準偏差( \sigma)、平均値の(不偏標準偏差) \sigma _\bar{x}の式を示します。

ここでデータx、添え字i、測定数Nとします。

標本平均

 \displaystyle \bar{x} = \frac{\sum_1^N x_i}{N}

公算誤差

 \displaystyle \epsilon = 0.6745 \times\sqrt{ \frac{\sum_1^N (x_i- \bar{x})^2}{N(N-1)}}

測定値の(不偏)標準偏差

 \displaystyle \sigma = \sqrt{ \frac{\sum_1^N (x_i- \bar{x})^2}{N-1}}

平均値の(不偏)標準偏差

 \displaystyle \sigma_s = \sqrt{ \frac{\sum_1^N (x_i- \bar{x})^2}{N(N-1)}}

studentのt分布に基づく信頼区間

  \displaystyle t_{N-1}(z \%) \times  = \sqrt{ \frac{\sum_1^N (x_i- \bar{x})^2}{N(N-1)}}