2019年01月17日更新
【平均値】計算の仕方から平均値のとりうる範囲まで徹底解説!【問題付き】
「平均値はどうやって出すの?」「平均値のとりうる範囲って何?」「中央値や最頻値との違いは?」「平均値を扱う問題はどんなの?」これらの疑問について本記事で分かりやすく解説していきます。

平均値って…?

平均値は調査するデータの総和をデータの個数で割って出します。


さっそく例をみていきましょう。

生徒Aが英語、数学、国語、理科、社会の5教科のテストを受けたとします。

各教科の得点は以下の表のようになりました。


英語82点、数学70点、国語90点、理科65点、社会88点です。


このデータの平均値を出すため、まずデータの総和、つまり5教科の合計得点を求めます。


82+70+90+65+88=395(点)


次に、データの総和をデータの個数で割ります。

ここでは5教科のデータを使ったので、データの個数は5つです。


395÷5=79(点)


以上の計算から、生徒Aの5教科平均は79点ということがわかりました。


このように、データ全体の総和をデータの個数で割って平均値を出す計算を式を一般化すると、次のような式になります。

$$\begin{align}平均値=\frac{1}{n}(x_{1}+x_{2}+\cdot\cdot\cdot+x_{n})\end{align}$$
$$\begin{align}(n:データの個数、x:データの値)\end{align}$$

平均値のとりうる範囲

ここまでは1つ1つの値がわかっているデータから平均値を求めてきましたが、データの最小値と最大値、個数が分かっていれば、平均値がどこからどこまでの値を取るか(平均値のとりうる範囲)を算出することもできます。


では、平均値のとりうる範囲の出し方をみていきましょう。


上の表は30人の生徒のテスト結果から作った度数分布表です。


このデータの平均値がとりうる範囲を出すためには、30人全員が各階級の最小値、最大値をとった時の平均値をそれぞれ考える必要があります。


まず、全員が各階級の最小値を取った場合の平均値を出します。

各階級の最小値は赤丸で囲った数字です。


平均値が最小となるのは、5人が50点、8人が60点、11人が70点、4人が80点、2人が90点をとった時です。


この時の全体の合計得点(総和)は

5×50+8×60+11×70+4×80+2×90

そして、データ全体の個数は30です。


以上の情報から平均値がとりうる最小値を計算すると、次のようになります。

$$\begin{align}\frac{1}{30}(5×50+8×60+11×70+4×80+2×90)\end{align}$$
$$\begin{align}≒66.67\end{align}$$

次に、最大値を取った場合の平均値を出します。

各階級の最大値は青丸で囲った数字です。


平均値が最大となるのは、5人が59点、8人が69点、11人が79点、4人が89点、2人が99点をとった時です。


この時の全体の合計得点(総和)は

5×59+8×69+11×79+4×89+2×99

データ全体の個数は30なので、平均値がとりうる最大値は

$$\begin{align}\frac{1}{30}(5×59+8×69+11×79+4×89+2×99)\end{align}$$
$$\begin{align}≒75.67\end{align}$$

よって、30人の生徒のテスト結果の平均値がとりうる値は

66.67以上75.67以下

となります。


「平均値のとりうる範囲」の文字だけを見ると難しそうですが、やっていることは簡単でしたね?


度数分布表にある各階級の最小値、最小値から平均値のとりうる範囲を出すという流れを覚えておきましょう。

平均値の長所・短所

平均値の長所

平均値は調査対象のデータを全部使用して求めるので、調査対象全体の特徴、おおよその傾向がわかります。


例えば、とある試験で10,000人の5教科のテスト結果について分析したいとしましょう。


10,000人全員の点数をずらーっと並べただけのデータを想像してください。


データの個数は全部で10,000×5で50,000個…そんな膨大のデータを見比べて傾向をみようとしても大変ですよね?


しかし、その50,000個のデータを教科別に平均を算出して、次の表のようにまとめたらどうでしょうか。


数学の平均値が最も高く、英語の平均値が最も低いということが一目でわかりますね。


この平均値から、「今回の模試は数学が簡単だった」とか「調査対象の学生は英語を苦手とする傾向がある」といったように分析することも、データを個別に見るより簡単にできます。

平均値の短所

平均値の短所はデータ内にある「極端な値(外れ値)」に影響を受けやすい点です。


まず、次の文を読んでみてください。


①生徒Aの5教科平均値は79点である。

②生徒Bの5教科平均値は72点である。


この情報だけを見たら、単純に生徒Aの方がより良い点数をとっているといえます。


しかし、次の表で生徒A、Bの各教科の点数を比較してみるとどうでしょうか。


生徒Bは数学、理科、社会の3教科で生徒Aよりも高い点数をとっていますが、英語、国語の2教科の点数は生徒Aよりかなり低いです。


これらのデータから、生徒Bは2教科で極端に低い点数をとったために、生徒Aよりも平均値がさがってしまったということがわかります。


平均値だけの比較ではわからなかったことですよね?


ですので、平均値について考える時は極端な値があるかないか、その影響をどれだけ受けているか注意しなければなりません。

平均値、中央値、最頻値の違い

平均値以外にも、データ分析の参考となる値(代表値)には中央値、最頻値があります。


【中央値】

データを小さい順に並べたとき、全体の中央に位置する値。

データが偶数個の場合:全体の真ん中2つの平均値

データが奇数個の場合:全体の真ん中にあたる値

【最頻値】

データの中で最も頻繁に出てくる(集中)している値。


それぞれの代表値の違いを次のデータでみていきましょう。

ある生徒7人が10点満点のテストを受けた結果です。


[平均値]

生徒7人の点数の総和は

5+10+7+7+7+5+3=44

データ個数は7つなので

44÷7≒6(※小数点以下切り捨て)


よって、平均値は6です。


[中央値]

生徒7人の点数を小さい順に並べると次のようになります。

「3,5,5,7,7,7,10」

データは7つあるので、左から数えても右から数えても真ん中に位置するのは4番目のデータです。


よって、中央値は7です。


[最頻値]

中央値を出す際に並べたデータをもう一度みてみましょう。

「3,5,5,7,7,7,10」

7つのデータのうち、「3」は1回、「5」は2回、「7」は3回、「10」は1回でてきます。

このなかで最も頻繁に出てくるのは「7」ですね。


よって、最頻値は「7」です。


3つの代表値をあらためて確認すると…


平均値:6

中央値:7

最頻値:7


平均値と中央値、最頻値にはちょっと違いが出ていますね。


このように3つの代表値はそれぞれ同じになることもあれば違ってくることもあります。


この3つの代表値の違いをテーマとして試験問題が作られることもあるので、それぞれの代表値の出し方、特徴を理解して使い分けられるようにしておきましょう。

平均値を扱う問題を解いてみよう

例題1

【問題】

7個の数2,8,5,3,12,a,bからなるデータの平均値が6であるとき、a,bを求めよ。

ただし、a=2bとする。


【解き方&解説】

まず、与えられているデータの総和を求めます。

2+8+5+3+12+a+b=30+a+b

a=2bを代入すると

30+a+b=30+3b

つまり、30+3bが総和です。

データの個数は7、平均値が6なので、

6=(30+3b)÷7

42=30+3b

∴b=4

a=2bにb=4を代入すると、

a=2×4=8

よって、a=8、b=4ということがわかりました。


平均値の式から逆算してデータa,bを求められましたね。

この逆算の方法も試験では役立つので、しっかり覚えておいてください。

例題2

【問題】

あるクラスの身長を調査すると、最小値がm=130cm、最大値がM=190cmであった。

さらに調査すると、データの中央値はX=160cm、ちょうど半数のデータはm以上X以下の値、残る半数のデータはX以上M以下とわかった。

以上から、平均値のとりうる範囲Aを求めよ。

【解き方&解説】

なんだか難しそうな問題にみえますね。

しかし、この問題は本記事の前半で触れた「平均値のとりうる範囲」の解き方の流れと同じです。


より理解しやすいように、全体のデータ個数を2nとして与えられた情報を度数分布表にまとめてみましょう。


どうでしょうか?

文字で理解するよりも分かりやすくなりましたね。


平均値のとりうる範囲を出すため、まず、平均値の最小を考えたいと思います。


m~Xの階級でn人が身長m、X~Mの階級でn人が身長Xの場合に平均値は最小となるので、


平均値の最小は

$$\begin{align}\frac{1}{2n}(n\cdot m +n\cdot X)\end{align}$$

そして、m~Xの階級でn人が身長X、X~Mの階級でn人が身長Mの場合に平均値は最大となるので、


平均値の最大は

$$\begin{align}\frac{1}{2n}(n\cdot X +n\cdot M)\end{align}$$

よって平均値のとりうる範囲Aは

$$\begin{align}\frac{1}{2n}(n\cdot m +n\cdot X)≦A≦\frac{1}{2n}(n\cdot X +n\cdot M)\end{align}$$
$$\begin{align}∴\frac{m+X}{2}≦A≦\frac{X+M}{2}\end{align}$$

あとはそれぞれの文字に数字を代入すればいいので

$$\begin{align}\frac{130+160}{2}≦A≦\frac{160+190}{2}\end{align}$$
$$\begin{align}∴145≦A≦175\end{align}$$

以上より、平均値のとりうる範囲は145cm以上175cm以下とわかりました。


今回のように文章題で平均値のとりうる範囲が問題となっているときは、一度自分で度数分布表を書いてみるといいでしょう。

文章では理解できなかったことが表を見れば分かることもありますからね。

まとめ

「平均値は大学入試でほとんど出ないだろうから勉強しなくても大丈夫」

と思っている方も多いかもしれませんが、実は2016年の福岡大学や山梨大学の医学部試験で出題されたことがあるんです。


平均値を扱う問題は単純なので大きな配点にはなりづらいでしょう。

しかし、小さな配点の問題を甘く見てはいけません。

大学入試は1点の差が合否を分けるシビアな世界です。


平均値を扱う問題が出たら確実に解けるよう、ぜひ本記事の内容を参考にしてください!

この記事の執筆者
スタモ編集部
最高の学習をもっと身近に、どこでも。スタモ編集部は、大学受験や日々の勉強に役立つ記事を発信しています。予備校講師や塾講師の経験のある東大、京大、早慶の卒業者メンバーが中心に、どこよりも詳しく、どこよりも丁寧な内容をお届けいたします。
関連記事
数学的帰納法はこれでマスター!基本から大学入試レベルの問題の解き方まで徹底解説!
証明が苦手な方なら数学的帰納法はすごい難しいことをしているように見えるのではないでしょうか?しかし、その仕組みを理解すれば意外と簡単なんですよ。本記事では、数学的帰納法の基本や仕組み、問題の解き方について分かりやすく解説していきます。
反比例について徹底解説!基礎からからグラフの描き方まで初学者にもわかりやすく解説します
「反比例って苦手だったな…」「反比例のグラフの描き方忘れちゃった!」「日常生活で反比例の関係にあるものって?」本記事では反比例が苦手な方に向けて、今さら聞けない基本から徹底的に解説していきます。
0から分かる特性方程式!数列の漸化式の問題での使い方を詳しく解説
本記事では特性方程式の内容と証明、その使い方を詳しく解説していきます。特性方程式と、その元となる数列の漸化式(ぜんかしき)とは何かを理解し、さまざまな漸化式の問題をとおして特性方程式の使い方を身につけていきましょう。
0から分かる2倍角の公式!導出から公式を用いた計算まで徹底解説
この記事では、加法定理から2倍角の公式を導出します。また公式を用いた計算まで例題を解いて確認しましょう!
【等差数列】基礎から学んで3つの公式を使いこなそう!
等差数列は数列の基礎、土台です。数列は大学入試において頻出テーマなので、等差数列が苦手であっては大学合格は厳しいと言っても過言ではないでしょう。本記事では等差数列の3つの公式について分かりやすく解説していきます。
切片とは?傾き・2点の座標がわかっている時の求め方、切片の範囲についても解説!
切片とはなんでしょうか。切片とは直線に置いてy軸と交わっている点のことを指し、直線の式を求める際に傾きとともに最も大切な要素の一つです。本記事では切片とその求め方について解説します。
© 2018 スタモ.