Vollständigkeit (Statistik)

Statistik

Als Vollständigkeit bezeichnet man in der Schätztheorie, einem Teilgebiet der mathematischen Statistik, eine Eigenschaft von Verteilungsklassen, σ-Algebren oder messbaren Funktionen. Im Allgemeinen sind vollständige Verteilungsklassen „groß“, wohingegen vollständige σ-Algebren „klein“ sind.

Die Vollständigkeit spielt meist in Verbindung mit der Suffizienz eine Rolle. So liefert sie Kriterien für die Minimalsuffizienz oder die Existenz gleichmäßig bester erwartungstreuer Schätzer mittels des Satzes von Lehmann-Scheffé.

Definition

Bearbeiten

Für Verteilungsklassen

Bearbeiten

Gegeben sei ein Messraum   und eine Menge   von Wahrscheinlichkeitsmaßen auf diesem Messraum. Dann heißt   vollständig, wenn die Menge der  -Nullschätzer  -trivial ist. Sprich für alle

 

gilt

 .

Dabei bezeichnet   den Raum aller  -integrierbaren Funktionen (siehe Lp-Raum).

Für σ-Algebren

Bearbeiten

Eine Unter-σ-Algebra   von   heißt vollständig für  , wenn   vollständig auf dem Messraum   ist. Dabei bedeutet  , dass man den Definitionsbereich aller Wahrscheinlichkeitsmaße in   auf die kleinere σ-Algebra   einschränkt.

Für Statistiken

Bearbeiten

Eine Statistik

 

heißt vollständig, wenn die von ihr erzeugte σ-Algebra   vollständig ist bzw.   vollständig ist.

Häufig wird die Verteilungsklasse   mit einem Index   versehen, man schreibt dann  . Formuliert man in dieser Schreibweise die Vollständigkeit aus, so erhält man die gängige Definition:

Eine Statistik   heißt vollständig, wenn für alle integrierbaren   mit

 

immer folgt, dass

 .

Erläuterung

Bearbeiten

Intuitiv zugänglicher ist die folgende Definition der Vollständigkeit einer Verteilungsklasse: Eine Verteilungsklasse ist vollständig, genau dann wenn sie eine trennende Familie für   ist. Das heißt, für beliebige   mit

 

folgt

 

Die Verteilungsklasse   ist also groß genug, um alle Funktionen aus   unterscheiden zu können.

Gegenbeispiele

Bearbeiten

Seien   unabhängig und identisch verteilte Zufallsvariablen mit Erwartungswert   und beschränkter Varianz.

Dann ist  . Die Funktion   ist also ein erwartungstreuer Schätzer von 0 und der Integrand ist nicht die Nullfunktion.

Präzisierungen

Bearbeiten

Beschränkte Vollständigkeit

Bearbeiten

Sei   die Menge der beschränkten Funktionen auf  . Eine Verteilungsklasse   heißt beschränkt vollständig, wenn sie vollständig für   ist. Die Definitionen einer beschränkt vollständigen σ-Algebra und einer beschränkt vollständigen Statistik folgen wie oben.

L-Vollständigkeit

Bearbeiten

Für eine gegebene Menge von Funktionen   heißt eine Verteilungsklasse  -vollständig, wenn sie vollständig für   ist. Die Definitionen einer  -vollständigen σ-Algebra und einer  -vollständigen Statistik folgen wie oben.

Beschränkte L-Vollständigkeit

Bearbeiten

Die beiden obigen Begriffe lassen sich auch kombinieren: Eine Verteilungsklasse heißt beschränkt  -vollständig, wenn sie vollständig für   ist. Die Definitionen einer beschränkt  -vollständigen σ-Algebra und einer beschränkt  -vollständigen Statistik folgen wie oben.

Anwendung

Bearbeiten

Statistische Vollständigkeit ist eine Voraussetzung für den Satz von Lehmann-Scheffé, in diesem Zusammenhang wurde der Begriff von E. L. Lehmann und H. Scheffé auch in die Statistik eingeführt. Die Sätze von Basu stellen einen Zusammenhang zwischen der Vollständigkeit, der Suffizienz und der Verteilungsfreiheit her.

Literatur

Bearbeiten
  • Ludger Rüschendorf: Mathematische Statistik. Springer Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-41996-6, doi:10.1007/978-3-642-41997-3.
  • Claudia Czado, Thorsten Schmidt: Mathematische Statistik. Springer-Verlag, Berlin Heidelberg 2011, ISBN 978-3-642-17260-1, doi:10.1007/978-3-642-17261-8.
  • E.L. Lehmann, H. Scheffé: Completeness, similar regions, and unbiased estimation. I. In: Sankhyā. 10, Nr. 4, 1950, S. 305–340.
  • E.L. Lehmann, H. Scheffé: Completeness, similar regions, and unbiased estimation. II. In: Sankhyā. 15, Nr. 3, 1955, S. 219–236.
  • Helmut Pruscha: Vorlesungen über Mathematische Statistik. B. G. Teubner, Stuttgart 2000, ISBN 3-519-02393-8, Abschnitt II.3.