반올림 종교 전쟁 (Microsoft Excel)
Help Wanted 질문에 대한 ExcelTips 구독자 (Chuck)가 작성한 진술은 다른 많은 ExcelTips 구독자로부터 흥미로운 의견을 불러 일으켰습니다. Chuck은 통계적으로 .5 값이 정확히 두 전체 값의 중간에 있기 때문에 시간의 절반은 반올림하고 나머지 절반은 반올림해야한다고 진술했습니다. 테니스 공이 네트에서 균형 잡힌 경우 통계적으로 볼은 시간의 절반은 왼쪽으로, 나머지 절반은 오른쪽으로 떨어질 것이라는 비유가 제공되었습니다.
다른 통계 학자들 사이에서도 그러한 진술에 대해 강한 감정이있는 것 같습니다. (모든 학문은 감정이 고조되는 다양한 종교 전쟁이있는 것 같습니다.) 한 특파원이 언급했듯이 이것은 “숫자 간격을 세는 데있어 오래된 ‘울타리 대 울타리 기둥’문제”입니다. 논증은 무언가가 울타리 기둥 바로 위에있을 때 “떨어지는”곳입니다. 테니스 공과 네트 비유 (또는 펜스와 펜스 포스트)의 문제점은 코트 중앙에있는 네트 만이 정확한 분할 선이 아니라는 것입니다.
예를 들어 테니스 코트의 왼쪽 끝에 “4.0”으로 표시된 선이 있고 다른 쪽 끝에 “5.0”으로 표시된 선이 있다고 가정 해 보겠습니다. 이것은 넷이 “4.5”로 표시되어 있음을 의미합니다. 테니스 공은 4.5 마크에서 균형을 잡고 어느 방향 으로든 떨어질 수 있지만 이론적으로 공은 코트 양쪽 끝 (4.0 및 5.0)의 라인에서 균형을 유지하고 양쪽으로 떨어질 수도 있습니다.
한 특파원은 .5를 반올림하거나 반올림하는 것이 데이터에 편향을 도입하기 때문에 부적절하다고 말했습니다. 소수점 오른쪽에있는 한 자리 숫자를 다루는 상황을 생각해보십시오. 7.0, 7.1, 7.2 등의 숫자가 7.9까지 있습니다. 이 수치를 반올림 할 때 5 개의 값은 항상 반올림 (7.0 ~ 7.4), 하나의 값은 반올림 (7.5), 4 개의 값은 항상 반올림됩니다 (7.6 ~ 7.9). 즉, 시간이 지남에 따라 5.5 값은 반올림되고 4.5 값은 반올림됩니다. 통계적 확률의 진정한 균등 적용에서 5 개의 값은 반올림하고 5는 반올림해야하지만, 중앙 값 (7.5)의 “와플 링”은 반올림 및 반올림에 대한 편향을 만듭니다.
그렇다면 어떤 반올림 이론이 맞습니까? 7.5는 시간의 절반은 반올림하고 반은 반올림해야합니까, 아니면 항상 반올림해야합니까? Microsoft는 항상 7.5를 반올림하기 때문에 분명히 마음을 정했습니다 (테니스 공은 항상 양수 값의 경우 오른쪽으로, 음수 값의 경우 왼쪽으로 떨어집니다). Microsoft의 결정은 항상 .5를 반올림하는 것이 옳다는 것을 의미합니까? 둥근 종교 전쟁에서 당신의 입장이 당신의 대답을 결정할 것입니다.
글쎄, 아마도 다른 데이터 포인트가 도움이 될 것입니다. 이 모든 문제에 ANSI 표준이있는 것으로 보입니다. 한 구독자는 항상 ASTM E29 및 ANSI Z25.1 표준을 따랐으며, 둘 다 .5의 정확한 분수 값을 짝수로 끝나는 가장 가까운 숫자로 반올림해야한다고 지정했습니다. 이러한 유형의 반올림을 수행해야하는 경우 사용할 적절한 공식은 다음과 같습니다.
=IF(A1-INT(A1)-0.5,EVEN(ROUNDDOWN(A1,0)),ROUND(A1,0))
이것이 반올림 결과에 어떤 영향을 미칠 수 있는지 알아보기 위해 1에서 100 사이의 25,000 개의 난수를 생성했습니다. 여기서 각 결과에는 소수점 이하 두 자리까지 있습니다. 그런 다음 한 열에서 일반 ROUND 함수를 사용하여 값을 전체 값으로 반올림하고 다음 열에서 위의 수식을 사용하여 숫자를 반올림했습니다. 그런 다음 각 열을 합산하여 어떤 반올림 방법이 원래 합계에 더 가까운 결과를 산출했는지 확인했습니다. 내 테스트에서는 Excel의 ROUND 함수 만 사용하는 대신 위의 공식을 사용하여 결과가 원래 합계에 50 % 이상 가까웠습니다.
그런 다음 소수점 세 자리까지 25,000 개의 난수를 생성했고 결과는 동일했습니다. 공식은 일반 ROUND보다 가까웠습니다. 소수점 이하 4 자리와 5 자리의 숫자도 마찬가지입니다.
테스트에서 알아 차린 한 가지는 첫 번째 테스트 데이터 세트 (소수점 2 자리까지의 난수)에 정확히 .5라는 기준과 정확히 일치하는 234 개의 값이 있다는 것입니다 (따라서 반올림 또는 반올림 할 수 있음). ). 소수점 세 자리가있는 목록에서 일치 항목 수는 14 개 값으로, 소수점 네 자리는 2 개 값, 소수점 다섯 자리는 0 개 값으로 떨어졌습니다. .5로 끝나는 기준을 충족하는 값이 적을수록 “반올림 또는 내림”을 적용 할 필요성이 줄어 듭니다.
논리. 따라서 위의 반올림 공식은 정확한 중심 일치가 있다는 사실로 인해 소수점 오른쪽에 4 자리, 5 자리, 6 자리 또는 그 이상의 숫자를 처리하기 시작할 때 효율성을 잃습니다.
물론 반올림에 대한 모든 논의에서는 이전에 반올림 한 값이 아니라 원시 값을 반올림한다고 가정해야합니다. 예를 들어, 원시 값이 14.46이고이를 14.5로 반올림하면 나중에 14.5에서 15로 반올림하는 것은 부적절합니다. 올바른 절차는 14.46으로 반 내림해야하는 원본 14.46을 검사하는 것입니다. 따라서, 항상 ROUND를 숫자 작업의 마지막 단계 중 하나로 사용해야합니다. 즉, SUM 또는 AVERAGE와 같은 집계 함수를 사용할 때 이미 반올림 된 값에 적용해서는 안됩니다. 대신 원시 값을 SUM 또는 AVERAGE 한 다음 SUM 또는 AVERAGE에서 반올림해야합니다. 이 팁을 기억하면보다 정확한 결과를 얻을 수 있습니다.
_ExcelTips_는 비용 효율적인 Microsoft Excel 교육을위한 소스입니다.
이 팁 (2829)은 Microsoft Excel 2007, 2010, 2013 및 2016에 적용됩니다.