Datenanalyse und Regressionsdiagnostik


Last edited on 20th April, 2004 by gs/ gs . - Host home page: http://www.statlab.uni-heidelberg.de

Postgraduelle Ausbildung
Medizinische Biometrie
Datenanalyse und Regressionsdiagnostik
Heidelberg, 5.-7. Oktober 2000
G. Sawitzki
StatLab Heidelberg


Ort: Universität Heidelberg, Theoretikum, Seminarraum 18, Im Neuenheimer feld 306, 1. OG
Zeitplan
Do. 5. Okt Fr. 6. Okt. Sa. 7. Okt.
09:00 - 10:30 Klassische Modelle und Residuen Binäre Respons und Klassifikation Kategorielle Daten, Kontingenztafeln
Ereignisdaten und Überlebenszeit
10:30 - 11:00      
11:00 - 12:30 Verteilungsdiagnostik, Resampling Lokale Modelle, Regression und Glättung
Nichtlineare Regression
Anwendungen in SAS und S
12:30 - 14:00     Fragen
14:00 - 15:00 Regressionsdiagnostik für einfache lineare Regression Datenanalyse für höhere Dimensionen  
15:00 - 15:30      
15:30 - 16:30 Anwendungen in SAS und S Anwendungen in SAS und S  
16:30 - 17:00 Fragen Fragen  

Klassische Modelle und Residuen

Lehrbuch-Literatur:

R.D.Cook, S. Weisberg: Residuals and Influence in Regression.
Chapman and Hall: London 1982.

Weitere Literatur:

E. Mammen:
Empirical Process of Residuals for High-Dimensional Linear Models. Annals of Statistics 24.1 (1996) 307-335.

Verteilungsdiagnostik, Resampling

Lehrbuch-Literatur:

Zur robusten Statistik:

Hampel, F.; Ronchetti, E.M.; Rousseuw, P.; Stahel, W.: Robust Statistics.
NewYork: Wiley 1986. ISBN 0-471-63284-4 (pbk.)
Rousseuw, P.; Leroy, A.M.: Robust Regression& Outlier Detection.
NewYork: Wiley 1987. ISBN 0-471-85233-3

Weitere Literatur:

Sawitzki, G. : Diagnostic Plots for One-Dimensional Data.
Published in: Computational Statistics. Papers collected on the Occasion of the 25 th Conference on Statistical Computing at Schloss Reisensburg. (Edited by P. Dirschedl & R.Ostermann for the Working Groups ... ... ) Heidelberg, Physica, 1994, isbn 3-7908-0813-x, p. 237-258. PostScript. Die zugehörige Software ist in http://www.statlab.uni-heidelberg.de/projects/onedim/.

Zusätzliche Hinweise:

Zur Korrektur für Gruppierungs-/Diskretisierungseffekte:

Heitjan, D.F.: Inference From Grouped Continuous Data: A Review.
Statistical Science 4 (1989) 164-183.

Regressionsdiagnostik für einfache lineare Regression

Lehrbuch-Literatur:

Chatterjee, S.; Hadi, A.S.: Sensitivity Analysis in Linear Regression.
NewYork: Wiley 1988.
Cook, R.D.; Weisberg, S: Residuals and Influence in Regression.
Chapman and Hall: London 1982. Ch. 2: Residuals.
Cook, R.D.; Weisberg, S: An Introduction to Regression Graphics.
NewYork: Wiley 1994. (inc. R-Code)
Ryan, T.R. Modern Regression Methods.
NewYork: Wiley 1997. (Ch. 2: Diagnostics and Remedial Measures. Ch. 11: Robust Regression)

Weitere Literatur:

Mammen, E.: When Does Bootstrap Work?
Heidelberg: Springer 1992 (Lecture Notes in Statistics 77)

Lokale Modelle; Regression und Glättung

Lehrbuch-Literatur:

Simonoff, J.S.: Smoothing Methods in Statistics
Heidelberg: Springer 1996

Weitere Literatur:

Falguerolles, A. de; Friedrich, F.; Sawitzki, G.: A Tribute to J. Bertin's Graphical Data Analysis.
In W. Bandilla, F. Faulbaum (eds.) Advances in Statistical Software 6. Lucius&Lucius Stuttgart 1997 ISBN 3-8282-0032-X pp. 11 - 20. PostScript

Binäre Respons; Klassifikation

Lehrbuch-Literatur:

R.D.Cook, S. Weisberg: Residuals and Influence in Regression.
Chapman and Hall: London 1982. Ch. 5.4 Logistic Regression.
Ryan, T.R. Modern Regression Methods.
NewYork: Wiley 1997. (Ch. 9: Logistic Regression)

Zusätzliche Hinweise:

Klassifikationsbäume als alternativer Modellierungsansatz

Breiman, L.; Friedman, J.H.; Olshen, R.A.; Stone, Ch. J.: Classification and Regression Trees.
Belmont: Wadsworth 1984

Diagnostik für Kontingenztafeln und Klassifikationsprobleme

Lehrbuch-Literatur:

Christensen, R.: Log-Linear Models.
Heidelberg: Springer 1990. Ch. IV.9: Residuals and Influential Information.
Haberman, S.J.: Analysis of Qualitative Data
London: Academic Press 1978.

Weitere Literatur:

Friendly, M.: Graphical Models for Categorical Data.
SUGI 1992. Postscript-Version (Siebdiagramm/Parkettdiagramm, Mosaikdisplay).

Zusätzliche Hinweise:

Michael Friendly
Über Mosaik-Plots und verwandte Themen
Michael Friendly's Kurs
Categorical Data Analysis with Graphics
Universität Augsburg
Software für die Analyse kategorieller Daten Manet und Turner

Regressionsdiagnostik für allgemeine lineare Modelle

Siehe auch: Einfache lineare Regression.

Lehrbuch-Literatur:

R.D.Cook, S. Weisberg:
Residuals and Influence in Regression. Chapman and Hall: London 1982. Ch. 2.3.2: Added variable plots. Ch. 2.3.3: Partial residual plot.
Ryan, T.R. Modern Regression Methods.
NewYork: Wiley 1997. (Ch. 5: Plots in Multiple Regression)

Nichtlineare Regression und Korrelation

Lehrbuch-Literatur:

J. D. Hart: Nonparametric Smoothing and Lack of Fit.
Springer: Heidelberg 1997.
Huet, S.; Bouvier, A.; Gruet, M.-A.; Jolivet, E.: Statistical Tools for Nonlinear Regression.
Springer: Heidelberg 1996.
Ryan, T.R. Modern Regression Methods.
NewYork: Wiley 1997. (Ch. 2.3: Transformations. Ch. 6: Transformations in Multiple Regression. Ch. 10: Nonparametric Regression. Ch. 11: Nonlinear Regression. )
Simonoff, J.S.: Smoothing Methods in Statistics
Heidelberg: Springer 1996

Weitere Literatur:

Breiman, L.; Friedman, J.H.: Estimating Optimal Transformations for Multiple Regression and Correlation (with Discussion).
Journal of the American Statistical Association 80 (1985) 580-619 (ACE-Algorithmus)
S-PLUS 4 Guide to Statistics.
Data Analysis Products Division, Mathsoft, Seattle 1997 (Ch. 7.11 Smoothing: Loess-Algorithmus)

Ereignisdaten und Überlebenszeit

Lehrbuch-Literatur:

Klein, J.P.; Moeschberger, M.L.: Survival Analysis
Heidelberg: Springer 1997. (Ch. 11: Regression Diagnostics)
W.N.Venables, B.D. Ripley:
Modern Applied Statistics with S-Plus. Heidelberg: Springer 1997 (2nd ed). ISBN 0-387-98214-0. Ch. 12: Survival Analysis.

Software:

S:
survival4 from statlib

Fallstudien

Krabben-Daten
weitere Beispiele

Software-Hinweise

Die im Kurs benutzten SAS-Programme finden Sie hier.

Eine Einführung in S und Hinweise zu R (= GNU S) finden Sie hier.

  Platform, Status Quelle Mirror User-Group etc.
DataDesk Windows, Macintosh www.datadesk.com www.statlab.uni-heidelberg.de/mirrors/datadesk/ datadeskboard-L@datadesk.com
R Public domain-Implementierung von S. Windows, Macintosh, UNIX siehe http://www.statlab.uni-heidelberg.de/projects/s/ www.statlab.uni-heidelberg.de/mirrors/auckland/R/ r-help@stat.math.ethz.ch
S-Plus Kommerzielle Implementierung von S. Windows, UNIX www.mathsoft.com Tutorial s-news@wubios.wustl.edu
SAS Kommerziell. Windows, UNIX www.sas.com Hinweise auf Macros etc. SAS newsgroup sas-L@uga.cc.uga.edu
SPSS Kommerziell. Windows, UNIX www.spss.com   spss-L@uga.cc.uga.edu
Voyager Experimentell. Windows, Macintosh, UNIX www.statlab.uni-heidelberg.de/projects/voyager/   voyager@statlab.uni-heidelberg.de
Public domain software wird täglich gespiegelt auf http://www.statlab.uni-heidelberg.de/mirrors/.

Software-Unterstützung, Makros etc.

Erste Quelle ist die statlib-Bibliothek, täglich gespiegelt auf http://www.statlab.uni-heidelberg.de//mirrors/statlib/.