Das Benfordsche Gesetz
Das Gesetz der führenden Ziffern
Von Susanne Lack im Rahmen ihrer Bachelorarbeit
Betreuung: Prof. Dr. Brigitte Forster-Heinlein
Führende Ziffern kommen nicht mit gleicher Wahrscheinlichkeit vor, wie man vielleicht vermuten könnte, sondern unterliegen einer speziellen logarithmischen Verteilung.
Mit führender Ziffer ist immer die erste Ziffer einer Zahl gemeint, die ungleich 0 ist.
Zum Beispiel: Die 1 in 1234 bzw. die 1 in 0, 01234.
Das Benfordsche Gesetz besagt:
Die Wahrscheinlichkeit, dass die führende Ziffer einer Zahl gleich d ist, lässt sich berechnen durch
wobei man für d die Ziffern 1, 2, . . . , 9 einsetzen kann.
Dieses Gesetz ist näherungsweise für sehr viele Datensätze korrekt. D.h. in diesen Datensätzen ist der relative Anteil von Zahlen mit führender Ziffer d näherungsweise gleich der obigen Formel.
Reale Datensätze, die genügend umfangreich sind und Werte über mehrere Größenordnungen umfassen (z.B. 1 bis 105) , erfüllen diese Voraussetzungen oft sehr genau. Z.B. Bevölkerungszahlen aller Länder der Erde, Börsenkurse, Besucherzahlen von Webseiten sind - wenn sie nicht manipuliert wurden - näherungsweise Benford-verteilt.
Die nachfolgende Abbildung zeigt die berechneten Wahrscheinlichkeiten für die führenden Ziffern in Prozent. Man sieht, dass niedrigere Anfangsziffern häufiger vorkommen, als höhere Anfangsziffern.
Das besondere an der Benford-Verteilung ist, dass sie Skalen- und Basen-invariant ist.
- Werden die Zahlen eines Bernford-verteilten Datensatzes skaliert, also mit einer Konstanten multipliziert, dann ist der skalierte Datensatz immer noch Benford-verteilt.
- Wenn die Zahlen in einem anderen Zahlsystem, also nicht mit Basis 10 sondern etwa binär mit Basis 2 dargestellt werden, dann gilt weiterhin eine logarithmische Benford-Verteilung zur neuen Basis.
- Die Benford-Verteilung ist einzigartig mit diesen beiden Eigenschaften.
Im Passauer Mathe-Museum kann das Gesetz anhand großer empirischer Datensätze selbst erkundet werden. Frau Susanne Lack hat hierfür einen Benford-Kamm gebaut und uns viele große Datensätze zum Ausprobieren bereitgelegt.
Bereits vor Benford machte der Mathematiker S. Newcomb im Jahr 1881 diese Entdeckung über die führenden Ziffern. Bei seiner Arbeit mit Logarithmenbüchern stellte er fest, dass die vorderen Seiten stärker abgenutzt waren als die hinteren. Logarithmenbücher sind so aufgebaut, dass vorne die Logarithmen von Zahlen mit niedrigen Anfangsziffern stehen und weiter hinten die der Zahlen mit hohen Anfangsziffern. Er schloss daraus, dass Zahlen mit niedrigen Anfangsziffern häufiger vorkommen müssen als mit hohen Anfangsziffern.
57 Jahre später, im Jahr 1938, machte der Physiker F. Benford dieselbe Entdeckung mit den Logarithmenbüchern. Fasziniert von diesem Phänomen sammelte er eine große Menge von Daten aus den unterschiedlichsten Bereichen und bestätigte damit die Existenz einer logarithmischen Verteilungsfunktion für die führenden Ziffern.
Einen exakten mathematischen Beweis lieferte jedoch keiner von Beiden. Der erste Beweis stammt aus dem Jahr 1961 von R. Pinkham.
Aufdeckung von Betrug
Der US-Wissenschaftler Mark Nigrini entdeckte, dass die Zahlen in Steuererklärungen und Bilanzen dem Benfordschen Gesetz genügen – unter der Voraussetzung, dass sie nicht gefälscht sind. Er untersuchte rund 200.000 Steuererklärungen und stellte fest, dass tatsächlich fast ein Drittel der aufgeführten Beträge mit einer Eins beginnt. Davon ausgehend entwickelte er eine Software, mit deren Hilfe Datensätze auf Übereinstimmungen und Abweichungen von Benfords Gesetz hin überprüft werden können. Dabei werden nicht nur die ersten Ziffern, sondern auch die zweiten untersucht. Nigrini bezeichnet diese Technik selbst als ”digital analysis“.
Die Bedenken, dass Betrüger, wenn sie um das Gesetz wissen, gezielt ihre Bilanzen und Steuererklärungen fälschen könnten und damit das Verfahren an Wirksamkeit verlieren könnte, weist Nigrini zurück. Zum einen sagt er, dass es nicht so einfach sei, Daten so zu manipulieren, dass sowohl die ersten als auch die zweiten Ziffern mit dem Gesetz in Einklang stehen, zum anderen wissen die Betrüger nicht genau, wie der Test angewendet wird, quartalsweise oder nach Ressorts gruppiert.
Kommt es bei einem Test zu Abweichungen, ist es noch kein Beweis für einen Betrug. Die Daten sollten aber einer genaueren Untersuchung unterzogen werden. Unstimmigkeiten können beispielsweise auch durch gewöhnliches Auf- und Abrunden entstehen.
Mit der Methode von Nigrini konnten beispielsweise die Bilanzfälschungen eines US-Energiekonzerns aufgedeckt werden. Auch gelang es nachzuweisen, dass manche EU-Staaten ihre Wirtschaftsdaten gefälscht hatten.
Anwendung in der Informatik
Beispielsweise kann das Benfordsche Gesetz nach Donald Knuth zur Optimierung von Algorithmen für Fließkomma-Operationen herangezogen werden. Wenn gewisse Ziffern häufiger als führende Ziffern auftreten als andere, dann entstehen bei Rechenoperationen wie Addition und Multiplikation gewisse Überträge häufiger als andere. Die hat zur Folge, dass gewisse Register-Operationen häufiger auftreten als andere. Algorithmen können also beschleunigt werden, wenn man dies bei geschickter Programmierung und cleverer Architektur der Prozessoren ausnutzt.
Überprüfung von Prognosemethoden
Nach Theodore Hill kann Benfords Gesetz auch als ”reality check“ für mathematische Modelle, zum Beispiel im Bereich der Prognose der Bevölkerungsentwicklung, herangezogen werden. Nigrini zeigte, dass die Einwohnerzahlen von Bezirken mit mehr als 3000 Einwohnern in den USA sehr genau dem Benfordschen Gesetz folgen. Daher scheint es möglich, Modelle, die die Populationsentwicklung prognostizieren, zu testen, ob sie ebenfalls Benford-verteilte Zahlen liefern. Andernfalls können diese Modelle nochmals überarbeitet werden.
Susanne Lack: Das Benfordsche Gesetz. Bachelorarbeit. Universität Passau. 2016
Weitere Literatur:
- G. Brähler et al. Wissenschaftler der TU Ilmenau weist Zahlenschummelei Griechenlands nach. www.tu-ilmenau.de/journalisten/pressemeldungen/einzelnachricht/newsbeitrag/ 8547/, 2011.
- F. Benford. The Law of Anomalous Numbers. Proceedings of the American Philosophical Society, 78(4):551–572, 1938.
- J. Baumeister and T. Garfias Macedo. Von den Zufallszahlen und ihrem Gebrauch. www.math.uni-frankfurt.de numerik/lehre/Vorlesungen/pros-12/Zufallszahlen und Benford/ran-shell.pdf, August 2011.
- A. Berger and T.H. Hill. An Introduction to Benford’s Law. Princton University Press, New Jersey, 2015.
- P. Diaconis. The distribution of leading digits and uniform distribution mod 1. The Annals of Probability, 5(1):72–81, 1977.
- M. Dworschak. Weiter Weg zur Zwei, Ein kurioses Gesetz der Wahr- scheinlichkeitstheorie kann Finanzbeamten helfen, Steuersu ̈nder aufzu- spu ̈ren. Der Spiegel, 47:228–229, 1998.
- B. J. Flehinger. On the Probability that an Random Integer has Initial D. The American Mathematical Monthly, 73(10):1056–1061, 1966.
- M. Glück. Die Benford-Verteilung – Mathematische Grundlagen und Anwendungsmöglichkeiten in der Marktforschung. Diplomica Verlag, Hamburg, 2014.
- N. Hüngerbühler. Benfords Gesetz über führende Ziffern: Wie die Mathematik Steuersündern das Fürchten lehrt. www.educeth.ch/unt/um/mathe/ana/benford, März 2007.
- T. P. Hill. A Statistical Derivation of the Significant-Digit Law. Statistical Science, 10(4):354–363, 1995.
- T. P. Hill. Base-invariance implies Benford’s Law. Proceedings of the American Mathematical Society, 123(3):887–895, 1995.
- H. Humenberger. Das Benford-Gesetz - warum ist die Eins als führende Ziffer von Zahlen bevorzugt? ISTRON-Materialien für einen realitätsbezogenen Mathematikunterricht, 6:138–150, 2000.
- H. Humenberger. Eine elementarmathematische Begründung des Benford-Gesetzes. Der Mathematikunterricht, 54(1):24–34, 2008.
- G.H. Hardy and E.M. Wright. An introduction to the Theory of Numbers. Oxford Press, Oxford, 1954.
- L. Kuipers and H. Niederreiter. Uniform Distribution of Sequencecs. John Wiley and Sons, New York, 1974.
- N. Kusolitsch. Maß- und Wahrscheinlichkeitstheorie. Springer-Verlag, Wien, 2. edition, 2014.
- R. Matthews. The power of one. New Scientist, (10 July 1999) 1999.
- S. Newcomb. Note on the Frequency of Use of the Different Digits in Natural Numbers. American Journal of Mathematics, 4(1):39–40, 1881.
- M. J. Nigrini. Benford’s law – applications for forensic accounting, auditing, and fraud detection. Wiley, Hoboken, NJ, 2012.
- R.S. Pinkham. On the distribution of first significant digits. Annals of Mathematical Statistics, 32(4):1223–1230, 1961.
- A. R. Raimi. Mean values and Banach limits. Proceedings of the Ame- rican Mathematical Society, 8:1029–1036, 1957.
- R. A. Raimi. On the Distribution of First Significant Figures. The American Mathematical Monthly, 76(4):342–348, 1969.
- B. F. Roukema. Benford’s law anomalies in the 2009 Iranian presiden- tial election. 128.84.21.199/pdf/0906.2789v2.pdf, 2009.
- S. Tappe. Einführung in die Wahrscheinlichkeitstheorie. Springer Verlag, Berlin Heidelberg, 2013.