*** Diese Tipps bitte als HTML-Datei pflegen.
*** Ergänzungen/Korrekturen bitte an g.sawitzki@uni-heidelberg.de ***  

Diese CVS- Identifikation wird automatisch erstellt:
        $Date: 2014/10/23 16:34:24 $
        $Revision: 1.25 $
        $Source: /u/math/sa3/cvswww/www/www.statlab.uni-heidelberg.de/users/gs/seminartipps.html,v $

Tipps zu Seminar- und Examensarbeiten

Inhalt:
Dies ist eine Zusammenstellung von Tipps für Seminar- und Examensarbeiten, die von mir (gs) betreut werden. Andere Arbeitsgruppen, oder andere Betreuer haben andere Tipps - bitte wenden Sie sich jeweils an Ihren Betreuer.

Generell

Dateiaustausch

Für alle Angehörigen der Universität gibt es die Möglichkeiten, Dateien über das Internet bereit zu stellen: mit der Uni-ID sind automatisch Zugangsberechtigungen zu den Netz-Resourcen verbunden.
new Der einfachste Weg ist es, die Dateien über WWW zugänglich machen. Falls noch nicht geschehen, sollten Sie für sich WWW freischalten. Detaillierte Hinweise finden Sie auf http://www.urz.uni-heidelberg.de/internet/www/homepage.html. Sie müssen Ihre Information nicht als WWW-Seiten aufbereiten. Sie können beliebige Dateien in den WWW-Bereich kopieren. Die einfachste Technik dazu ist es, den WWW-Bereich als zusätzliches Netzwerk anzuschliessen. Details sind rechnerabhängig - schlagen Sie ggf. unter "WebDAV mount" nach, wie es bei Ihrem Rechner geht.

Auf Kommando-Ebene können Sie Dateien ohne WebDAV mit scp kopieren. Dazu müssen Sie den Pfad kennen. Auf den Rechnern der Universität sind Ihre WWW-Seiten im Verzeichnis ~/afs/WWW. Auf den meisten Systemen gibt es Front-Ends für scp. Die abgekürzte Syntax ist

scp  [[user@]host1:]file1 ... [[user@]host2:]file2

new Ohne zusätzliche Massnahmen sind alle Dateien im Verzeichnis ~/afs/WWW öffentlich sichtbar. Bitte denken Sie daran. Keine persönliche oder sicherheitsrelevante Information auf diesem Weg! Auch sonst keine kritische Information.
In Kooperation mit ihren Partnern können Sie Dateien verschlüsseln, und so das Problem entschärfen. Suchen Sie unter "file encryption" nach geeigneter Software.

Ernsthafte Arbeit verlangt einen besseren Zugang. Die Universität bietet AFS als verteiltes File-System an. Mit dem AFS-System können Sie transparent auf alle Information zugreifen, und diese bei Bedarf gezielt für andere zugänglich machen. Details sind wieder rechnerabhängig - schlagen Sie ggf. unter "AFS mount" nach, wie es bei Ihrem Rechner geht.
Alle im URZ gespeicherte Information wird in der Regel vom AFS verwaltet. Machen Sie das Verzeichnis zugreifbar für
        sa3   G. Sawitzki
damit sie für mich lesbar ist, und nach Bedarf für andere.
new Die notwendigen Berechtigungen setzen Sie auf Kommando-Ebene mit

fs sa <directory> sa3 all
z.B.
fs sa . sa3 all
für das aktuelle Verzeichnis.

Die Zugriffsrechte werden auch hier mit AFS verwaltet.
Information
URZ Info zu AFS
Weitere Information und Software
www.openafs.org

new Bei Problemen mit den URZ-Diensten können Sie sich an den URZ-Service-Point (Raum 1 im URZ) wenden. Wenn der Service nicht hilft, senden Sie bitte eine mail an it-service@uni-heidelberg.de mit einer Kopie an mich. Bitte vermerken Sie auch Datum/Zeit und den Namen des Mitarbeiters, der versucht hat, Ihnen zu helfen.

Positive Rückmeldungen sind natürlich auch immer willkommen.

Version-Management

In der Regel - Genies ausgenommen - wird sich Ihre Arbeit über mehrere Versionen entwickeln. Die Möglichkeiten, und daraus resultierenden Probleme, sind lange diskutiert. Es ist bessere, hier auf bekannte Lösungen zurück zu greifen, anstelle noch einmal das Rad zu erfinden.
Als Minimum: Wenn Sie Versionen mit Datum speichern, sollten Sie im Datei- bzw. Verzeichnis-Namen das Datum im ISO-Format
    yyyy-mm-dd
benutzen.

Besser ist es aber, ein Version-Management-System zu benutzen. Gängige Systeme sind etwa CVS, SVN, git, …
Im URZ steht Ihnen  dafür  CVS  zur  Verfügung.  Bei Problemen mit den URZ-Diensten können Sie sich an den URZ-Service-Point (Raum 1 im URZ) wenden.
Für Windows kann man unter anderem TortoiseCVS benutzen (Anleitung z. B. : http://www.bottles-ahead.de/index.php?/archives/5-Tortoise-CVS-Anleitung-und-Installation.html).

Wenn  Sie lokal arbeiten, ist SVN vorzuziehen, weil SVN  auch Binär-Dateien (wie z.B. pdf) effektiv verarbeitet.

Arbeitsmaterial

Pflegen Sie eine Literaturliste

Sie bekommen eine kleine Zahl von Ausgangsartikeln genannt. In der Regel sind in den Artikeln Stichworte (Key Words) angegeben.
Schlagen Sie diese Stichworte in der Encyclopedia Of Statistical Sciences (Handbibliothek) nach und ergänzen Sie evtl. weitere Stichworte.

new Aktuelle Literatur erscheint in Zeitschriften. Viel wichtige Zeitschriften finden Sie in der Mathematik-Bibliothek (INF 294, EG). Weiter Zeitschriften finden sie über die elektronische Zeitschriftenbibliothek

new Eine (persönliche) Auswahl von Zeitschriften habe ich in einer Liste zusammen gestellt. Benutzen Sie diese Liste als Ausgangspunkt, um sich selbst eine kleine Auswahl zusammen zu stellen. Ihre Auswahl sollten Sie dann regelmässig inspizieren. Sie sollten nicht zu hohe Erwartungen haben: machen Sie sich darauf gefasst, dass Sie zu Anfang vielleicht nur bei einem von zehn Artikeln auch nur den Titel verstehen.

Benutzen Sie die Stichworte und die Referenzen in den Ausgangsartikeln, um eine Literaturliste aufzubauen und zu pflegen. Die Standard-Routine ist:

Die Literaturliste sollten sie im Bibtex-Format führen. Für meine Veranstaltungen steht den Teilnehmern in der Regel meine private Literaturliste als Bibtex-Datei zur Verfügung. Falls nicht: bitte sprechen Sie mich darauf an.

Es gibt verschiedene BibTex-Editoren, die das Verwalten der Literaturliste vereinfachen. Auf allen Plattformen läuft zum Beispiel der JabRef reference manager. Viele Datenbanken und Zeitschriften bieten die Möglichkeit, Literatur im BibTex-Format zu exportieren (z. B. HEIDI, Web of Science, Jstor, …). Dies kann einiges an Tipparbeit ersparen.
Als Format für Referenzen (d.h. die internen cite-keys) empfohlen:
 <autor><jahr><stichwort>
z.B.
 gauss1847kq

Folgende Datenbanken/Suchmaschinen können zum Beispiel für die Literaturrecherche genutzt werden:
new Einen Schwerpunkt auf mathematischer Literatur haben
     zbMath (<https://zbmath.org/>)
     MathSciNet (<http://www.ams.org/mathscinet>)
     Mr Lookup (<http://www.ams.org/mrlookup>)

Allgemeine wissenschaftliche Literaturbanken sind
     BibSys (<http://www.bibsys.no>)
     Library of Congress (Bücher) (<http://catalog.loc.gov/>)
     LIDOS (<http://www.dfki.de/imedia/lidos/bibtex/>)
     CiteSeer.IST (wie Web of Science) (<http://citeseer.ist.psu.edu/>)
     ACM Portal (<http://portal.acm.org/portal.cfm>)
Statlab Links zu Journals etc. (http://www.statlab.uni-heidelberg.de/links/)

Über HEIDI oder die Bibliothek der Fakultät bekommt man Zugang zu:
    Web of Science
    Current Index of Statistics
    versch.Zeitschriften, …
Die Datenbanken des Deutschen Krebsforschungs-Zentrums in Heidelberg sind teilweise viel größer als diejenigen, auf die man über die UB Zugriff hat. Es lohnt sich daher unter Umständen, seine Literaturrecherche in der Bibliothek des DKFZs zu machen, von deren Computer man freien Zugriff auf ihre Datenbanken hat.

Vorsicht

Bitte denken Sie daran: die angegebene Literatur ist keine Bibel. In der Schule haben Sie gelernt, den Schulbücheren zu vertrauen. Bitte vergessen Sie diese Lektion. In der Universität ist es Ihre Aufgabe, das vorliegende Material kritisch zu nutzen. "Das steht im Buch" gilt nicht in der akademischen Diskussion.  Entweder die Argumentation ist für Sie nachvollziehbar. Oder sie ist für Sie zunächst eine unbewiesene Behauptung.

new Sie können durch vorsichtige Formulierung signalisieren, wie weit Sie mit der Überprüfung gegangen sind. "abc (xxx, yyyy)" gibt xxx als verlässliche Quelle für Behauptung abc an. "xxx vermutet/sagt in (xxx, yyyy) daß abc" gibt xxx nur als Verweis.

Software

Wenn Sie auf Algorithmen Bezug nehmen, sollten Sie frühzeitig dafür sorgen, dass die entsprechende Software für Sie verfügbar ist.

Empfohlene Basis ist die R-Software.

Wenn Sie Software benutzen oder entwickeln: wir sind aus dem Stadium der Software-Steinzeit heraus. Benutzung von Profilern und Code-Analysern gehört zum Standard, wenn es über eine rudimentäre Software-Nutzung hinaus geht.

Daten und Beispiele

Analog zur Literatur-Liste sollten Sie Beispiel-Datensätze und theoretische Beispiele pflegen. Für jedes wesentliche Daten-Beispiel sollten Sie, unabhängig von der Nutzung in Ihrer Arbeit, eine geschlossenen Datenanalyse bereit stellen.
Wenn Sie spezielle Verteilungen zur Illustration nutzen, sollten Sie ein Implementierung entsprechend den R-Konventionen bereitstellen.

Werkzeuge

Sie finden Hinweise und Links zu den häufig von mir benutzen Werkzeugen in meiner Link-Sammlung.

Ausarbeitung

L'information est la résponse à une question. (J. Bertin, 1977)

Denken Sie gleich in zwei Versionen: einer Arbeitsversion, die auch Notizen, Nebenrechnungen und Fragen enthält, und einer Abgabeversion, die bereinigt ist.
Bitte kennzeichnen Sie die Ausarbeitung mit Titel, Namen, email, und Hinweis auf den Kontext (z.B. Seminar). Die Quelldatei sollte als Kommentar auch die Angaben Matr. Nummer, Studienziel, Geburtstag, Geburtsort enthalten.

Ihre Ausarbeitungen und Beiträge können anderen Studierenden als Ausgangsbasis oder Beispiel dienen. Zusammenarbeit sollte hier die Regel sein, und ich gehe von Ihrer Zustimmung aus. Wenn Sie es nicht wünschen, dass Ihre Ausarbeitungen weiter gegeben werden, so informieren Sie mich bitte frühzeitig und versehen Sie Ihre Materialien mit einem entsprechenden Hinweis.

Latex-Tipps

Versuchen Sie nicht, das Rad neu zu erfinden. Wenn Sie irgendwo eine brauchbare Formatierung finden: fragen Sie, ob der Autor ihnen die entsprechenden Stil-Definitionen gibt. Die von mir benutzen Stil-Definitionen können Sie (ohne Garantie, auf dem jeweiligen Stand) auf Anfrage von mir haben.
In LATEX können Sie bedingten Code verwenden, um Arbeitsversion und Abgabeversion in einer Quelldatei zu halten.
Bsp:
\ifx\private\undefined%
    \newcommand{\privnote}[1]{}
\else
    \newcommand{\privnote}[1]{\marginpar{\textcolor{red}{#1}}}
\fi
Benutzt als
\privnote{This is my private note.}
Wenn die Variable private z.B. durch
\def\private{true}
im Dokument definiert ist, wird "This is my private note." im pdf-Dokument angezeigt.

Man kann also mit einem Zeichen (das Auskommentieren einer Zeile) alle Notizen, Nebenrechnungen und Fragen die wie im diesem Beispiel definiert sind ausblenden und hat somit zwei Versionen in einem.

Es empfiehlt sich, nicht die ganze Arbeit in eine Datei zu schreiben, sondern mehrere Dateien anzulegen (z. B. kann man Kapitel als einzelne Einheiten zum Abspeichern  wählen) und diese dann zu einem Gesamtdokument zusammen zu fügen. Verwenden Sie dafür die LaTeX-Befehle \include{} und \insert{}. Unter Verwendung des Befehls \includeonly{} können Sie anstatt des ganzen Dokumentes einzelne Einheiten (z. B. Kapitel) bearbeiten lassen.
Bsp.:
 Datei zur Bearbeitung eines vollständigen Dokuments completeDocument.tex:

\insert{Präambel}
\begin{document}
\include{Introduction}
\include{chapters/Chap1}
\include{chapters/Chap2}
...
\end{document}
  Datei zur Ausgabe einzelner Einheiten (hier des ersten Kapitels) in einem Auszug partDocument.tex:
% \includeonly{Introduction}
\includeonly{chapters/Chap1}
%\includeonly{chapters/Chap2}
...

Beachten Sie dabei, die Pfade zu den einzelnen Dateien richtig anzugeben.

Das Definieren von einzelnen Befehlen für häufig vorkommende Ausdrücke erleichtert die Arbeit mit LaTeX. Benutzen Sie \newcommand{} oder \newenvironment{}. In manchen Fällen ist es auch günstig, einen neuen Befehl für eine Variable zu definieren. Falls man nachträglich Variablen umbenennen möchte, muss man nur eine Zeile umändern, anstatt das ganze Dokument durchzugehen.

Wenn Sie mit R erzeugte Grafiken oder R-Code in Ihre Arbeit einfügen möchten, verwenden Sie am besten Sweave. Sweave ist Standard-Bestandteil von R. Siehe
	help(Sweave)
new Unter "See also" finden sie in der Help-Information auch einen Verweis auf das "Sweave User Manual" mit ausführlicherer Information.
Empfohlene Parameter:
oldopt <- options(width=64)
setwd("dddd/")
Sweave("../Rnw/xxx.Rnw",output="../tex/xxx.tex", keep.source=TRUE, debug=TRUE, eps=FALSE)

Grafiken

Grafiken sollten in sich abgeschlossen sein.
Sie sollten eine klare Überschrift tragen.
Die Achsen sollten eine Beschriftung haben, mit der Inhalt und Skalen eindeutig erkennbar sind.
Eine Bildunterschrift sollte den Inhalt (und die wichtige Information) kurz in Worten erklären.

Thema und Einleitung

Nehmen Sie sich Zeit für die Einleitung. Denken Sie an die Leser. Hier ein Beispiel für eine Liste von Fragen, die Sie beantworten sollten:
Orientieren Sie sich an diesen Fragen schon bei Ihren ersten Vorträgen über das Thema.

Hauptteil

Hier nur ein paar generelle Tipps und Regeln:
"define before use"
Es gibt Ausnahmen von dieser Regel. Es kann sein, dass ein Begriff eine umfangreiche Motivation braucht. Dann kann er vorher benutzt werden und erst danach als "Und jetzt definieren wir …" definiert werden. Aber als Grundlage  "define before use".
"remove dead matter"
Definitionen und Lemmata, die nicht benutzt werden, sollten eliminiert werden. Dies gilt auch für Voraussetzungen von Theoremen und Beweisen.
"separation of concerns"
Nicht zuviel zusammen packen. Getrenntes sollte getrennt diskutiert werden.

Zitate und Copyright

Insbesondere bei Examensarbeiten ist es erforderlich, dass Ihr eigener Beitrag klar erkennbar ist. Im Gegenzug: wenn Sie Material benutzen, so sollten Sie stets die Quelle zitieren.
Wenn Sie einen Seminarvortrag über Literatur-Resultate halten, sollten Sie zu Beginn die Quelle angeben.

new Datenanalysen

  1. Wenn Sie Daten analysieren, sollten Sie mit einer Quellangabe und einer Kurzbeschreibung beginnen.
  2. Darauf sollte eine Inventarliste folgen, die die Abkürzungen und Variablen definiert und die Maßeinheit angibt, sowie für jede Variable bekannte Eigenschaften (z.B. Wertebereich) und Angaben, die für Konsistenzchecks genutzt werden können.
  3. Falls angebracht sollte ein Abschnitt mit modellunabhängiger beschreibender Statistik folgen.
  4. Die eigentlichen Analysen folgen. Geben Sie hier genug Information, um die Analysen reproduzierbar zu machen.
  5. Abschliessend folgt eine Zusammenfassung der Analyse und Ihre Schlußfolgerungen, sowie ggf. Anschlußfragen.

Zeit-Management

Hand-Outs

Wenn Sie einen Vortrag machen: lohnt es sich für die  Zuhörer,  sich Notizen  zu machen?  Wenn  ja, bereiten Sie  einen "Hand  Out"  vor  (eine  oder zwei  Seiten). 
Bei  "work in  progress"-Berichten  ist  das  nicht nötig.

Für Seminarvorträge: sie können auch handgeschriebene Notizen einscannen (Scan-Funktion am Kopierer INF 294, R. 203) und als PDF-Dateien für die Projektion nutzen.