宗教戦争の丸め(Microsoft Excel)
Help Wantedの質問に答えて_ExcelTips_サブスクライバー(Chuck)が行ったステートメントは、他の多くの_ExcelTips_サブスクライバーからいくつかの興味深いコメントを引き起こしました。 Chuckは、統計的に、値.5は、2つの値全体のちょうど真ん中にあるため、半分の時間で切り上げ、残りの半分の時間で切り下げる必要があると述べました。テニスボールがネット上でバランスが取れている場合、統計的には、ボールは半分の時間で左に、残りの半分の時間で右に落ちるはずであるというアナロジーが提供されました。
他の統計学者の間でさえ、そのような声明についていくつかの強い感情があるようです。 (すべての分野で、感情が高まるさまざまな宗教戦争があるようです。)ある特派員が述べたように、これは「数字の間隔を数える際の古い「フェンス対フェンスポスト」の問題」です。議論は、それがフェンスポストのすぐ上にあるときに何かが「落ちる」場所です。テニスボールとネットのアナロジー(またはフェンスとフェンスポスト)の問題は、コートの真ん中にあるネットだけが正確な境界線ではないということです。
たとえば、テニスコートの左端に「4.0」とマークされた線があり、もう一方の端に「5.0」とマークされた線があるとします。これは、ネットが「4.5」とマークされていることを意味します。テニスボールは4.5マークでバランスを取り、どちらの方向にも落ちる可能性がありますが、理論的には、ボールはコートの両端(4.0と5.0)のラインでバランスを取り、どちらの方向にも落ちる可能性があります。
ある特派員は、.5を上または下(一方の半分ともう一方の半分)に丸めることは、データにバイアスを導入するため、不適切であると感じていると述べました。小数点の右側の1桁を扱っている状況を考えてみましょう。つまり、7.0、7.1、7.2などの数字が7.9まであります。これらの数値を四捨五入すると、5つの値は常に切り捨てられ(7.0から7.4)、1つの値はどちらの方向にも四捨五入され(7.5)、4つの値は常に切り上げられます(7.6から7.9)。つまり、時間の経過とともに5.5の値は切り捨てられ、4.5の値は切り上げられます。統計的確率の真の均等な適用では、5つの値は切り捨て、5は切り上げる必要がありますが、中央の値(7.5)の「ワッフル」は、切り下げを支持し、切り上げに反対するバイアスを作ります。
では、どの丸め理論が正しいのでしょうか? 7.5は半分の時間で切り上げ、半分の時間で切り下げる必要がありますか、それとも常に切り上げる必要がありますか? Microsoftは、常に7.5を切り上げるため、明らかに決心しました(テニスボールは、正の値の場合は常に右に、負の値の場合は左に落ちます)。 Microsoftの決定は、常に.5を切り上げることが正しいことを意味しますか?丸める宗教戦争におけるあなたの立場があなたの答えを決定します。
まあ、おそらく別のデータポイントが役立つでしょう。この問題全体にANSI規格があるようです。ある加入者は、彼が常に標準ASTME29およびANSIZ25.1に従っていることを示しました。これらは両方とも、0.5の正確な小数値を偶数で終わる最も近い数値に丸める必要があることを指定しています。このタイプの丸めを行う必要がある場合、使用する適切な式は次のとおりです。
=IF(A1-INT(A1)-0.5,EVEN(ROUNDDOWN(A1,0)),ROUND(A1,0))
これが丸めの結果にどのように影響するかを確認するために、1から100までの一連の25,000の乱数を生成しました。各結果には、小数点以下2桁まであります。次に、1つの列で通常のROUND関数を使用して値を全体の値に丸め、次の列で上記の式を使用して数値を丸めました。次に、各列を合計して、どの丸め方法で元の合計に近い結果が得られたかを確認しました。私のテストでは、ExcelのROUND関数だけではなく、上記の式を使用した結果は、元の合計に50%以上近づいていました。
次に、小数点以下3桁までの25,000個の乱数を生成しましたが、結果は同じでした。式は一般的なROUNDよりも近かったのです。小数点以下4桁と5桁の数値についても同じことが言えます。
テストで気付いたのは、最初のテストデータセット(小数点以下第2位までの乱数)に、正確に.5であるという基準に正確に一致する(したがって、切り上げまたは切り下げの対象となる)234個の値があったことです。 )。小数点以下3桁のリストでは、一致数は14値に減少し、小数点以下4桁の場合は2値、小数点以下5桁の場合は0値でした。 .5で終わる基準を満たす値が少ないほど、「切り上げまたは切り下げ」を適用する必要性が少なくなるのは当然のことです
論理。したがって、上記の丸め式は、正確な中心の一致があるため、小数点の右側に4桁、5桁、6桁、またはそれ以上の桁がある数値を扱い始めると、その効果を失います。
もちろん、丸めについての議論では、以前に丸められた値ではなく、生の値を丸めていると想定する必要があります。たとえば、生の値が14.46で、それを14.5に丸める場合、後で14.5を15に丸めるのは不適切です。正しい手順は、元の14.46を調べて、14に切り下げることです。数値を操作する最後のステップの1つとして、最初のステップとしてではなく、常にROUNDを使用する必要があります。つまり、SUMやAVERAGEなどの集計関数を使用する場合は、すでに丸められている値にそれらを適用しないでください。代わりに、生の値をSUMまたはAVERAGEしてから、SUMまたはAVERAGEで丸めを行う必要があります。このヒントを覚えておくことで、より正確な結果を得ることができます。
_ExcelTips_は、費用効果の高いMicrosoftExcelトレーニングのソースです。
このヒント(2829)は、Microsoft Excel 2007、2010、2013、および2016に適用されます。