Theses

We are pleased that you would like to write your bachelor/master thesis at our institute. On this website you may find information about topics, registration and general guidelines. We wish you much success!

BACHELOR THESES

Bachelor theses in Statistics consist of a description of new statistical methods and their application on specific data.

  • Registration

    We would like to ensure that all students of the Economics and Management bachelor receive a topic for their theses within standard period of study. Therefore, allocation is made by the Office of the Dean of Studies via a centralized application procedure. Afterwards, the Office of the Dean of Studies will inform you about the institute which you were assigned to.

  • Assignment of Topics

    We have prepared a selection of topics for students who were assigned to our institute. Topics for summer term 2020 as well as winter term 2020/21 will be assigned within a online meeting, which took place on Wednesday, 6th May 2020 at 16.15. Students who could not participate may find a list with current topics on our website.

TOPICS

We have arranged a selection of 27th topics from different areas.

In the following, you may find a list of currently available topics which may help for your choice. If a topic is no longer available, we will remove it from our website.

The descriptions of content as well as liturature references can be taken from the general overview which is linked above.

  • Models of Descriptive Statistics and Stochastics

    Modellierung von Extremwerten mit Extremwertverteilungen

    In vielen Anwendungsgebieten spielt die Modellierung extremer Ereignisse eine besondere Rolle. Mithilfe der Extremwerttheorie kann z.B. das Risiko auf Finanzmärkten oder die Wahrscheinlichkeit für Überflutung eines Deichs abgebildet werden. Eine übliche Herangehensweise ist das Aufteilen des Datensatzes in Blöcke, deren Maxima bestimmten Extremwertverteilungen folgen. Dies sind die Gumbel-, Fréchet- und Weibullverteilung, die in der allgemeinen Extremwertverteilung zusammengefasst werden.

    Einstiegsliteratur:

    • Stuart Coles u. a. 2001. An introduction to statistical modeling of extreme values. Springer (Kap. 3)
    • Rolf-Dieter Reiss und Michael Thomas. 2007. Statistical analysis of extreme values. Springer (Kap. 4)

    Modellierung von Extremwerten mit der Peaks-Over-Threshold-Methode

    Bei einer anderen Herangehensweise zum Modellieren extremer Ereignisse wird ein Grenzwert festgelegt, dessen Überschreitungen betrachtet werden. Nach dem Satz von Pickands können diese Werte bei richtiger Wahl des Grenzwerts als unabhängige Realisationen einer Zufallsvariablen betrachtet werden, die der allgemeinen Pareto-Verteilung folgt. Der Grenzwert wird mit graphischen Entscheidungshilfen bestimmt, sodass anschließend mit der Maximum-Likelihood-Methode die Verteilung angepasst werden kann.

    Einstiegsliteratur:

    • Stuart Coles u. a. 2001. An introduction to statistical modeling of extreme values. Springer (Kap. 4)
    • Rolf-Dieter Reiss und Michael Thomas. 2007. Statistical analysis of extreme values. Springer (Kap. 5)
  • Limits of Classic Linear Regression

    Heteroscedasticity

    In the least squares method it is assumed that the variance of the disturbance terms is constant. However, if the variance of the disturbance varies, the LS estimator is no longer
    efficient. This can be proven with tests such as White-Test or Godfrey LM Test. Solutions are o ffered by heteroscedasticity-resistant standard errors or the weighted LS method. If autocorrelation is also present, HAC (heteroscedasticity and autocorrelation consistent) estimators must be used. (This thesis is supervised in English).

    Introductory Literature:

    • Je ffrey M. Wooldridge. 2013. Introductory econometrics: A modern approach. Nelson Education (Chap. 8 + 12)
    • William H. Greene. 2012. Econometric analysis. Pearson Education (Chap. 9)

    Specification tests: RESET

    Consider the model speci cation of a linear regression model, where the independent regressors x_i are linearly related to the dependent variable y. This assumption about the functional form of a regression can be tested and these tests should be content of this work. The best-known test is the so-called RESET test. In addition, for example, the Rainbow and the Harvey-Collier Test can be presented. (This thesis is supervised in English).

    Introductory Literature:

    • Walter Krämer und Harald Sonnberger. 1986. The linear regression model under test. Physica-Verlag Heidelberg (Chap. 4)

    Endogeneity: Instrumental Variables

    Consider a linear regression model, where a prerequisite for the consistency of the OLS estimator is that the independent variable x and the error term e are uncorrelated. If this assumption is violated, there is so-called endogeneity. One consequence is that the OLS estimator has a bias. The presence of endogeneity can be resolved through so-called instrumental variables, which are used in the Two Stage Least Squares (2SLS) in order to obtain a consistent estimate of the e ffect ß . (This thesis is supervised in English).

    Introductory Literature:

    • Jeff rey M. Wooldridge. 2013. Introductory econometrics: A modern approach. Nelson Education (Chap. 15)
    • James H. Stock und Mark W. Watson. 2011. Introduction to Econometrics. Pearson Education (Chap. 12)

    Simultaneous systems of equations

    Consider a simple simultaneous system of equations, where it is characteristic is that y_1,t and y_2,t appear both on the left in an equation and on the right in an equation. Therefore, an endogeneity problem arises. Two problems should be explained in detail in this work: First, the problem of identification, i.e. under which circumstances gamma_1 and gamma_2 can be estimated. Second, one should introduce an estimator that works under endogeneity and estimates the coefficients of the system equation by equation. (This thesis is supervised in English).

    Introductory Literature:

    • William H. Greene. 2012. Econometric analysis. Pearson Education (Chap. 10)
    • Fumio Hayashi. 2000. "Econometrics". Princeton University Press (Chap. 8)
    • Je ffrey M. Wooldridge. 2010. Econometric analysis of cross section and panel data. MIT Press (Chap. 8 + 9)

    Endogeneity: Generalized Method of Moments (GMM)

    Endogeneity bias can lead to inconsistent estimates and incorrect inferences, which may provide misleading conclusions and inappropriate theoretical interpretations. GMM is a statistical method that combines economic data with the information in population moment conditions and is able to estimate all coefficients simultaneously. The idea behind GMM must be explained and then applied to solve the system. (This thesis is supervised in English).

    Introductory Literature:

    • William H. Greene. 2012. Econometric analysis. Pearson Education (Chap. 13)
    • Je ffrey M. Wooldridge. 2010. Econometric analysis of cross section and panel data. MIT Press (Chap. 8)
    • Fumio Hayashi. 2000. "Econometrics". Princeton University Press (Chap. 8)
    • Jeffrey M. Wooldridge. 2001. "Applications of generalized method of moments estimation". Journal of Economic perspectives 15 (4): 87-100

    Paneldaten: Hausmann Test

    Paneldaten liegen vor, wenn für jede Beobachtung i = 1,...,N Beobachtungen zu verschiedenen Zeitpunkten t = 1,...,T vorliegen, d.h. die abhängige Variable y besitzt zwei Indizes. Nun nehmen wir an, dass jede Beobachtung y einen eigenen Achsenabschnitt a besitzt, d.h. y = x'b + a + u. Es gibt nun zwei Fälle: Falls a eine Konstante ist, so liegt ein fi xed eff ect vor. Falls a eine Zufallsvariable ohne Korrelation mit x ist, so liegt ein random e ffect vor. In dieser Arbeit soll vorgestellt werden, wie mittels eines statistischen Tests entschieden werden kann, welche Art von Achsenabschnitt vorliegt.

    Einstiegsliteratur:

    • James H. Stock und Mark W. Watson. 2011. Introduction to Econometrics. Pearson Education (Kap. 10)
    • Jeff rey M. Wooldridge. 2013. Introductory econometrics: A modern approach. Nelson Education (Kap. 13)
  • Specific Regression Models

    Modelle für kategoriale Variablen: Multinomial Logit

    Eine kategoriale, oder auch nominale, Variable ist eine Variable, die in eine bestimmte Kategorie fällt und keine sinnvolle Ordnung aufweist. Das multinomiale Logit Modell wird verwendet, um eine Wahrscheinlichkeit einer bestimmten Entscheidung unter zwei oder mehr Alternativen zuzuweisen. Zum Beispiel ist die Wahl des Verkehrsmittels, um zur Arbeit zu gelangen, gegeben durch: das Auto, den Bus, den Zug oder das Fahrrad. In dieser Arbeit sollen das standard Logit sowie die Erweiterung zum multinomialen Modell definiert werden. Des Weiteren sollen die Interpretation dieser Modelle und auch Tests vorgestellt werden. Eine Erweiterung bezüglich des Nested Logits ist auch möglich.

    Einstiegsliteratur:

    • William H. Greene. 2012. Econometric analysis. Pearson Education (Kap. 18)
    • Je ffrey M. Wooldridge. 2010. Econometric analysis of cross section and panel data. MIT Press (Kap. 16)

    Modelle für zensierte Daten: Das Lognormal Hurdle Modell

    Zensierte Daten sind Daten, die "abgeschnitten" sind. Wenn wir Daten y über Arbeitsentgelte erheben, so sind die Daten nicht-negativ, d.h. sie sind am Wert y = 0 abgeschnitten. Das Lognormal Hurdle Modell modelliert Auswirkungen von unabhängigen Variablen x auf die beobachtete Variable y. Es interpretiert den Prozess der Erzeugung von y als zweiteiliges Modell: y = sw, wobei s entweder 0 oder 1 und w > 0 ist. Die Variable s (die Hurdle) zeigt an, ob y zensiert wird, während die Variable w (die lognormalverteilte Größe) anzeigt, wie groß das nicht-zeniserte y ist.

    Einstiegsliteratur:

    • Jeff rey M. Wooldridge. 2010. Econometric analysis of cross section and panel data. MIT Press (Kap. 17)
    • William H. Greene. 2012. Econometric analysis. Pearson Education (Kap. 19)

    Treatment Effects: Matching-Schätzer

    Mit Average Treatment E ffects versuchen Sozialwissenschaftler, die Auswirkungen von Maßnahmen wie z.B. der Teilnahme an einem Job- Training für Arbeitslose zu messen. Insbesondere stellt sich die Frage, wie diese Auswirkungen gemessen werden können, wenn kein randomisiertes Experiment vorliegt, d.h. die teilnehmende von der nicht-teilnehmenden Gruppe unterschiedlich sein kann. Mit Matching-Schätzern wird versucht, dennoch eine Vergleichbarkeit dieser beiden Gruppen herzustellen, indem auf die äußeren Merkmale abgestellt wird. In dieser Arbeit soll das Covariate Matching vorgestellt werden. Verschiedene Matching-Funktionen und Abstandsmaße sollen verglichen werden.

    Einstiegsliteratur:

    • Giovanni Cerulli. 2015. Econometric evaluation of socio- economic programs. Springer (Kap. 2)
    • Jeff rey M. Wooldridge. 2010. Econometric analysis of cross section and panel data. MIT Press. (Kap. 21)

    Treatment Effects: Propensity Score

    Mit Average Treatment Effects versuchen Sozialwissenschaftler, die Auswirkungen von Maßnahmen wie z.B. der Teilnahme an einem Job-Training für Arbeitslose zu messen. Insbesondere stellt sich die Frage, wie diese Auswirkungen gemessen werden können, wenn kein randomisiertes Experiment vorliegt, d.h. die teilnehmende von der nicht-teilnehmenden Gruppe unterschiedlich sein kann. Mit dem Propensity Score wird versucht, dennoch eine Vergleichbarkeit dieser beiden Gruppen herzustellen, indem auf den sogenannten Propensity Score abgestellt wird, der die Wahrscheinlichkeit, zu einer Gruppe zu gehören, angibt. In dieser Arbeit soll das Propensity-Score Matching vorgestellt werden. Verschiedene Eigenschaften des Propensity-Scores sollen beschrieben werden.

    Einstiegsliteratur:

    • Giovanni Cerulli. 2015. Econometric Evaluation of Socio- Economic Programs. Springer (Kap. 2)
    • Je ffrey M. Wooldridge. 2010. Econometric analysis of cross section and panel data. MIT Press. (Kap. 21)

    Treatment Effects: Sample Selection Schätzer

    Mit Average Treatment Effects versuchen Sozialwissenschaftler, die Auswirkungen von Maßnahmen wie z.B. der Teilnahme an einem Job-Training für Arbeitslose zu messen. Insbesondere stellt sich die Frage, wie diese Auswirkungen gemessen werden können, wenn kein randomisiertes Experiment vorliegt, d.h. die teilnehmende von der nicht-teilnehmenden Gruppe unterschiedlich sein kann. Der Ansatz des Sample Selection Schätzers ist es, die sogenannte Selbstauswahl in eine dieser Gruppen explizit zu modellieren und damit die Schätzung des Effekts von dieser Selbstauswahl zu trennen. In dieser Arbeit soll das 2-Stufen Modell bestehend aus Probit und OLS-Schätzung vorgestellt werden.

    Einstiegsliteratur:

    • Giovanni Cerulli. 2015. Econometric evaluation of socio- economic programs. Springer (Kap. 3)
    • Je ffrey M. Wooldridge. 2010. Econometric analysis of cross section and panel data. MIT Press. (Kap. 19)
  • Multivariate Methods

    Analysis of Variance (ANOVA)

    ANOVA is the extension of the t- and z-tests where the means of two samples (or a sample and population) are compared relative to the standard error of the mean or pooled standard deviation. ANOVA is best applied where more than two populations are meant to be compared. The di fferent test procedures as well as the motivation of the various test statistics should be presented. (This thesis is supervised in English).

    Introductory Literature:

    • Alvin C. Rencher und William F. Christensen. 2012. Methods of Multivariate Analysis. John Wiley & Sons, Inc. (Chap. 6)
    • Joseph F. Hair u. a. 2014. Multivariate Data Analysis. Pearson Education Limited (Chap. 14)

    Factor Analysis

    In factor analysis, we represent the p elements of the vector y as linear combinations of a smaller number of m random variables, where m< p, called factors. Like the original variables, the factors vary from individual to individual; but unlike the variables, the factors cannot be measured or observed. The existence of these hypothetical variables is therefore open to question. If the p elements of vector y are at least moderately correlated, the basic dimensionality of the system is less than p. The goal of factor analysis is to reduce the redundancy (needlessness) among the variables by using a smaller number of factors. Motivation for factor models, model defi nition and assumptions as well as the estimation procedure should be covered. (This thesis is supervised in English).

    Introductory Literature:

    • Alvin C. Rencher und William F. Christensen. 2012. Methods of Multivariate Analysis. John Wiley & Sons, Inc. (Chap. 13)
    • Joseph F. Hair u. a. 2014. Multivariate Data Analysis. Pearson Education Limited (Chap. 3)

    Cluster Analysis

    In cluster analysis we search for patterns in a data set by grouping the (multivariate) observations into clusters. The goal is to find an optimal grouping for which the observations or objects within each cluster are similar, but the clusters are dissimilar to each other. To group the observations into clusters, many techniques begin with similarities between all pairs of observations. In many cases the similarities are based on some measure of distance. Other cluster methods use a preliminary choice for cluster centers or a comparison of within- and between-cluster variability. The techniques of cluster analysis have been extensively applied to data in many fields, such as medicine, psychiatry, sociology, criminology, anthropology, archaeology, geology, geography, remote sensing, market research, economics, and engineering. (This thesis is supervised in English).

    Introductory Literature:

    • Alvin C. Rencher und William F. Christensen. 2012. Methods of Multivariate Analysis. John Wiley & Sons, Inc. (Chap. 15)
    • Joseph F. Hair u. a. 2014. Multivariate Data Analysis. Pearson Education Limited (Chap. 8)

MASTER THESES

Master Theses in Statistics consists of a description of new statistical methods and their application on specific data. This is similar to bachelor theses. Furthermore, new statistical methods could be described in detail and more critically. Another option is to do an empirical study on a statistical problem.

  • Registration

    For master theses allocation is made on student's requests. If you would like to write your master thesis at our institute, you may contact Prof. Dr. Sibbertsen by email.

  • Topic Assignment

    Topics for master theses are very diverse. They range from methodical work (method presentation, method comparison, method development) to own empirical work (data collection and analysis) with references to all other economic elective courses.

    Topic assignment takes place in coordination with you. We will gladly consider your suggested topics.


NOTES FOR THESES

Below you may find informationen about requirements for bachelor theses as well as a template for LaTeX.

CONTACT FOR GENERAL QUESTIONS ABOUT YOUR THESIS

Non-public person