




























































































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Libro sobre análisis multivariado
Tipo: Apuntes
1 / 536
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!





























































































SPIN Springer’s internal project number, if known
V
F¨ur Claudia und Fabian
VIII Vorwort
fallsvariablen. Die im Buch ben¨otigte Theorie mehrdimensionaler Zufallsvari- ablen wird in Kapitel 3 detailliert herausgearbeitet. Um diese und weitere Kapitel verstehen zu k¨onnen, ben¨otigt man Kenntnisse aus der Linearen Al- gebra. Deshalb werden im Anhang A.1 die zentralen Begriffe und Zusam- menh¨ange der Linearen Algebra beschrieben und exemplarisch verdeutlicht. Außerdem ist Literatur angegeben, in der die Beweise und Zusammenh¨ange ausf¨uhrlich betrachtet werden. Es ist unm¨oglich, alle multivariaten Verfahren in einem Buch darzustellen. Ich habe die Verfahren so ausgew¨ahlt, dass ein ¨Uberblick ¨uber die breiten Anwendungsm¨oglichkeiten multivariater Verfahren gegeben wird. Dabei ver- suche ich die Verfahren so darzustellen, dass anschließend die Spezialliteratur zu jedem der Gebiete gelesen werden kann. Das Buch besteht aus 4 Teilen. Im ersten Teil werden die Grundlagen gelegt, w¨ahrend in den anderen Teilen un- terschiedliche Anwendungsaspekte ber¨ucksichtigt werden. Bei einem hochdi- mensionalen Datensatz kann man an den Objekten oder den Merkmalen interessiert sein. Im zweiten Teil werden deshalb Verfahren vorgestellt, die dazu dienen, die Objekte in einem Raum niedriger Dimension darzustellen. Außerdem wird die Procrustes-Analyse beschrieben, die einen Vergleich un- terschiedlicher Konfigurationen erlaubt. Der dritte Teil besch¨aftigt sich mit Abh¨angigkeitsstrukturen zwischen Variablen. Hier ist das Modell der bed- ingten Unabh¨angigkeit von großer Bedeutung. Im letzten Teil des Buches werden Daten mit Gruppenstruktur betrachtet. Am Ende fast aller Kapitel sind Aufgaben zu finden. Die L¨osungen zu den Aufgaben sowie die im Buch verwendeten Datens¨atze und S-PLUS-Funktionen sind auf der Internet-Seite des Springer-Verlages zu finden. In diesem Buch spielt der Einsatz des Rechners bei der Datenanalyse eine wichtige Rolle. Programmpakete entwickeln sich sehr schnell, sodass das heute Geschriebene oft schon morgen veraltet ist. Um dies zu vermei- den, beschr¨anke ich mich auf den Kern von S-PLUS, wie er schon in der Version 3 vorhanden war. Den Output habe ich mit Version 4.5 erstellt. Ich stelle also alles im Befehlsmodus dar. Dies hat aus meiner Sicht einige Vorteile. Zum einen lernt man so, wie man das System schnell um eigene Funktionen erweitern kann. Zum anderen kann man die Funktionen in na- hezu allen F¨allen auch in R ausf¨uhren, das man sich kostenlos im Inter- net unter http://cran.r-project.org/ herunterladen kann. Informatio- nen zum Bezug von S-Plus f¨ur Studenten findet man im Internet unter http://elms03.e-academy.com/splus/. Das Buch enth¨alt keine getrennte Einf¨uhrung in S-PLUS. Vielmehr werden im Kapitel 2.3 anhand der ele- mentaren Datenbehandlung die ersten Schritte in S-PLUS gezeigt. Dieses Konzept hat sich in Lehrveranstaltungen als erfolgreich erwiesen. Nachdem man dieses Kapitel durchgearbeitet hat, sollte man sich dann Kapitel A. widmen, in dem gezeigt wird, wie man die Matrizenrechnung in S-PLUS um- setzt. Bei der Erstellung eigener Funktionen ben¨otigt man diese Kenntnisse. Ansonsten bietet es sich an, einen Blick in die Lehrbuchliteratur zu werfen.
Vorwort IX
Hier sind S¨uselbeck (1993), Krause & Olson (2000) und Venables & Ripley (1999) zu empfehlen. Das Buch ist aus Skripten entstanden, die ich seit Mitte der Achtziger Jahre zu Vorlesungen an der Freien Universit¨at Berlin und der Universit¨at Bielefeld angefertigt habe. Ich danke an erster Stelle Herrn Prof. Dr. Her- bert B¨uning von der Freien Universit¨at Berlin, der mich ermutigt und un- terst¨utzt hat, aus meinem Skript ein Lehrbuch zu erstellen. Er hat Teile des Manuskripts gelesen und korrigiert und mir sehr viele wertvolle Hin- weise gegeben. Dankbar bin ich auch Herrn Dipl.-Volkswirt Wolfgang Lemke von der Universit¨at Bielefeld, der die Kapitel ¨uber Regressionsanalyse und insbesondere Faktorenanalyse durch seine klugen Fragen und Anmerkungen bereichert hat. Ebenfalls danken m¨ochte ich Herrn Dr. Stefan Niermann, der das Skript schon seit einigen Jahren in seinen Lehrveranstaltungen an der Universit¨at Hannover verwendet und einer kritischen W¨urdigung unterzogen hat. Herrn Andreas Schleicher von der OECD in Paris danke ich f¨ur die Genehmigung, die Daten der PISA-Studie zu verwenden. Herrn Prof. Dr. Wolfgang H¨ardle von der Humboldt-Universit¨at zu Berlin und Herrn Prof. Dr. Holger Dette von der Ruhr-Universit¨at Bochum danke ich, dass sie das Buch in ihre Reihe aufgenommen haben. Vom Springer-Verlag erhielt ich jede nur denkbare Hilfe bei der Erstellung der druckreifen Version. Herr Holzwarth vom Springer-Verlag fand f¨ur jedes meiner LATEX-Probleme so- fort eine L¨osung und Frau Kehl gab mir viele wichtige Hinweise in Bezug auf das Layout. Abschließend m¨ochte ich an Herrn Professor Dr. Bernd Streitberg erin- nern, der ein großartiger Lehrer war. Er konnte schwierige Zusammenh¨ange einfach veranschaulichen und verstand es, Studenten und Mitarbeiter f¨ur die Datenanalyse zu begeistern. Auch ihm habe ich sehr viel zu verdanken.
Bielefeld, im Juni 2002 Andreas Handl
4.5 Ubungen.............................................. 112¨
Part II Darstellung hochdimensionaler Daten in niedrigdimen-
Part I
Grundlagen
4 1 Beispiele multivariater Datens¨atze
Table 1.1. Mittelwerte der Punkte in den Bereichen Lesekompetenz, Mathematis- che Grundbildung und Naturwissenschaftliche Grundbildung im Rahmen der PISA- Studie, vgl. Deutsches PISA-Konsortium (Hrsg.) (2001), S. 107, 173, 229
Land Lesekompetenz Mathematische Naturwissenschaftliche Grundbildung Grundbildung Australien 528 533 528 Belgien 507 520 496 Brasilien 396 334 375 D¨anemark 497 514 481 Deutschland 484 490 487 Finnland 546 536 538 Frankreich 505 517 500 Griechenland 474 447 461 Großbritannien 523 529 532 Irland 527 503 513 Island 507 514 496 Italien 487 457 478 Japan 522 557 550 Kanada 534 533 529 Korea 525 547 552 Lettland 458 463 460 Liechtenstein 483 514 476 Luxemburg 441 446 443 Mexiko 422 387 422 Neuseeland 529 537 528 Norwegen 505 499 500 Osterreich¨ 507 515 519 Polen 479 470 483 Portugal 470 454 459 Russland 462 478 460 Schweden 516 510 512 Schweiz 494 529 496 Spanien 493 476 491 Tschechien 492 498 511 Ungarn 480 488 496 USA 504 493 499
mit den Auspr¨agungsm¨oglichkeiten w und m wurde noch eine Reihe weiterer Merkmale erhoben. Die Studenten wurden gefragt, ob sie den Leistungskurs Mathematik besucht haben und ob sie im Jahr 1988 das Abitur gemacht haben. Diese Merkmale bezeichnen wir mit MatheLK und Abitur88. Bei bei- den Merkmalen gibt es die Auspr¨agungsm¨oglichkeiten j und n. Außerdem sollten sie ihre Abiturnote in Mathematik angeben. Dieses Merkmal bezeich- nen wir mit MatheNote. Das Merkmal Punkte gibt die Anzahl der im Test richtig gel¨osten Aufgaben an. Die Daten sind in Tabelle 1.2 zu finden.
1 Beispiele multivariater Datens¨atze 5
Table 1.2. Ergebnisse von Studienanf¨angern bei einem Mathematik-Test
Geschlecht MatheLK MatheNote Abitur88 Punkte m n 3 n 8 m n 4 n 7 m n 4 n 4 m n 4 n 2 m n 3 n 7 w n 3 n 6 w n 4 j 3 w n 3 j 7 w n 4 j 14 m j 3 n 19 m j 3 n 15 m j 2 n 17 m j 3 n 10 w j 3 n 22 w j 2 n 23 w j 2 n 15 m j 1 j 21 w j 2 j 10 w j 2 j 12 w j 4 j 17
ut
Dieser Datensatz enth¨alt auch qualitative Merkmale. Diese wollen wir eben- falls im Kapitel 2 geeignet darstellen. Außerdem hat der Datensatz wesentliche Bedeutung im Rahmen des Kapitels 12.
Example 3. Im Wintersemester 1996/97 wurden an der Fakult¨at f¨ur Wirtschaftswis- senschaften der Universit¨at Bielefeld 265 Erstsemesterstudenten in der Statis- tik I Vorlesung befragt. Neben dem Merkmal Geschlecht mit den Auspr¨agungsm¨oglichkeiten w und m wurden die Merkmale Gewicht, Alter und Gr¨oße erhoben. Außerdem wurden die Studenten gefragt, ob sie rauchen und ob sie ein Auto besitzen. Diese Merkmale bezeichnen wir mit Raucher und Auto. Auf einer Notenskala von 1 bis 5 sollten sie angeben, wie ihnen Cola schmeckt. Das Merkmal beze- ichnen wir mit Cola. Als letztes wurde noch gefragt, ob die Studenten den Leistungskurs Mathematik besucht haben. Dieses Merkmal bezeichnen wir mit MatheLK. Tabelle 1.3 gibt die Ergebnisse von 5 Studenten wieder. ut
Ziel einer multivariaten Analyse dieses Datensatzes wird es sein, ¨Ahnlichkeiten zwischen den Studenten festzustellen. Wir wollen uns mit solchen ¨Ahnlichkeits- und Distanzmaßen im Kapitel 4 besch¨aftigen.