Rundung der Religionskriege (Microsoft Excel)
Eine Aussage eines ExcelTips-Abonnenten (Chuck) als Antwort auf eine Frage „Hilfe gesucht“ löste einige interessante Kommentare von vielen anderen ExcelTips-Abonnenten aus. Chuck machte die Aussage, dass der Wert .5 statistisch gesehen die Hälfte der Zeit aufgerundet und die andere Hälfte der Zeit abgerundet werden sollte, da er genau in der Mitte von zwei ganzen Werten liegt. Die Analogie war, dass, wenn ein Tennisball auf einem Netz balanciert wurde, der Ball statistisch gesehen die Hälfte der Zeit nach links und die andere Hälfte der Zeit nach rechts fallen sollte.
Es scheint, dass solche Aussagen auch unter anderen Statistikern starke Gefühle haben. (Alle Disziplinen scheinen ihre verschiedenen Religionskriege zu haben, in denen die Gefühle hoch sind.) Wie ein Korrespondent erwähnte, ist dies „das alte Problem von Zäunen gegen Zaunpfosten beim Zählen von Intervallen zwischen Zahlen“. Das Argument ist, wo etwas „fallen“ wird, wenn es sich direkt auf einem Zaunpfosten befindet. Das Problem mit der Tennisball- und Netzanalogie (oder Zäunen und Zaunpfosten) ist, dass das Netz in der Mitte des Platzes nicht die einzige genaue Trennlinie ist.
Nehmen wir zum Beispiel an, das linke Ende eines Tennisplatzes hat eine Linie mit der Aufschrift „4.0“ und das andere Ende eine Linie mit der Aufschrift „5.0“. Dies bedeutet, dass das Netz mit „4.5“ markiert ist. Während ein Tennisball auf der 4,5-Marke balancieren und in beide Richtungen fallen könnte, könnte der Ball theoretisch auch auf der Linie an beiden Enden des Platzes balancieren (4,0 und 5,0) und auch in beide Richtungen von ihnen fallen.
Ein Korrespondent äußerte das Gefühl, dass eine Rundung von 0,5 nach oben oder unten (halb in die eine und halb in die andere Richtung) unangemessen ist, da dies zu einer Verzerrung der Daten führt. Stellen Sie sich die Situation vor, in der es sich um eine Ziffer rechts vom Dezimalpunkt handelt: Sie haben die Zahlen 7.0, 7.1, 7.2 usw. bis 7.9. Beim Runden dieser Zahlen würden immer fünf Werte abgerundet (7,0 bis 7,4), ein Wert könnte in beide Richtungen gerundet werden (7,5) und vier Werte würden immer gerundet (7,6 bis 7,9). Mit anderen Worten, im Laufe der Zeit würden 5,5 Werte abgerundet und 4,5 Werte aufgerundet. Bei einer wirklich gleichmäßigen Anwendung der statistischen Wahrscheinlichkeit sollten 5 Werte abgerundet und 5 aufgerundet werden, aber das „Waffeln“ des Mittelwerts (7,5) führt zu einer Tendenz zugunsten des Abrundens und gegen das Aufrunden.
Welche Rundungstheorie ist also richtig? Sollte 7.5 die Hälfte der Zeit aufrunden und die Hälfte der Zeit abrunden, oder sollte es immer aufrunden? Microsoft hat sich offensichtlich entschieden, da es immer 7,5 aufrundet (der Tennisball fällt bei positiven Werten immer nach rechts und bei negativen Werten nach links). Bedeutet die Entscheidung von Microsoft, dass es immer richtig ist, .5 aufzurunden? Ihre Position im runden Religionskrieg wird Ihre Antwort bestimmen.
Nun, vielleicht hilft ein anderer Datenpunkt. Es scheint, dass es zu diesem Thema einen ANSI-Standard gibt. Ein Teilnehmer gab an, immer die Standards ASTM E29 und ANSI Z25.1 befolgt zu haben, die beide festlegen, dass ein exakter Bruchwert von 0,5 auf die nächste Zahl gerundet werden soll, die mit einer geraden Ziffer endet. Wenn Sie diese Art der Rundung durchführen müssen, lautet die richtige Formel:
=IF(A1-INT(A1)-0.5,EVEN(ROUNDDOWN(A1,0)),ROUND(A1,0))
Um zu sehen, wie sich dies auf das Ergebnis der Rundung auswirken kann, habe ich eine Reihe von 25.000 Zufallszahlen zwischen 1 und 100 generiert, wobei jedes Ergebnis bis zu zwei Dezimalstellen hatte. Ich habe dann die Werte mit der regulären ROUND-Funktion in einer Spalte auf einen ganzen Wert gerundet, und in der nächsten Spalte habe ich die Zahlen mit der obigen Formel gerundet. Ich habe dann jede Spalte summiert, um zu sehen, welche Rundungsmethode zu Ergebnissen führt, die näher an der ursprünglichen Summe liegen. In meinem Test lagen die Ergebnisse über 50% näher an der ursprünglichen Summe, wenn die obige Formel anstelle der RUNDEN Funktion von Excel allein verwendet wurde.
Ich habe dann 25.000 Zufallszahlen mit bis zu drei Dezimalstellen generiert, und die Ergebnisse waren dieselben – die Formel war näher als eine generische RUNDE. Gleiches gilt auch für Zahlen mit vier und fünf Dezimalstellen.
Eine Sache, die ich bei meinen Tests bemerkt habe, war, dass es im ersten Satz von Testdaten (Zufallszahlen mit bis zu zwei Dezimalstellen) 234 Werte gab, die genau den Kriterien von genau 0,5 entsprachen (und daher zum Auf- oder Abrunden geeignet waren) ). In der Liste mit drei Dezimalstellen sank die Anzahl der Übereinstimmungen auf 14 Werte, bei vier Dezimalstellen waren es 2 Werte und bei fünf Dezimalstellen waren es 0 Werte. Es liegt auf der Hand, dass je weniger Werte vorhanden sind, die die Kriterien für die Endung mit 0,5 erfüllen, desto weniger Notwendigkeit besteht, die „Auf- oder Abrundung“
anzuwenden Logik. Daher verliert die obige Rundungsformel ihre Wirksamkeit, wenn Sie mit Zahlen mit vier, fünf, sechs oder mehr Ziffern rechts vom Dezimalpunkt beginnen, da es Übereinstimmungen mit genauem Zentrum gibt.
Bei jeder Diskussion über Rundungen muss natürlich davon ausgegangen werden, dass Sie Rohwerte runden, nicht zuvor gerundete Werte. Wenn zum Beispiel ein Rohwert 14,46 ist und Sie ihn auf 14,5 runden, wäre es unangemessen, die 14,5 auf 15 zu runden. Das richtige Verfahren wäre, die ursprüngliche 14,46 zu untersuchen, die auf 14 abgerundet werden sollte Verwenden Sie ROUND immer als einen Ihrer letzten Schritte beim Arbeiten mit Zahlen, nicht als einen der ersten. Dies bedeutet, dass Sie bei Verwendung von Aggregatfunktionen wie SUM oder AVERAGE diese nicht auf Werte anwenden sollten, die bereits gerundet wurden. Stattdessen sollten Sie die Rohwerte SUMMEN oder DURCHSCHNITTEN und dann die Rundung auf SUMME oder DURCHSCHNITTLICH durchführen. Sie erhalten genauere Ergebnisse, wenn Sie sich an diesen Tipp erinnern.
ExcelTips ist Ihre Quelle für kostengünstige Microsoft Excel-Schulungen.
Dieser Tipp (2829) gilt für Microsoft Excel 2007, 2010, 2013 und 2016.