Mehrebenenmodelle für diskrete Kriteriumsvariablen am Beispiel

Transcrição

Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse -
WiSe 2001/2002
1
Mehrebenenmodelle für diskrete Kriteriumsvariablen am Beispiel
des Einsatzes eines 2-Ebenen-Logitmodells in der amerikanischen
Viktimisierungsforschung
Gliederung:
1.
Die theoretischen Ansätze des Seattle-Viktim-Surveys
2
2.
Das Erhebungsdesign der Seattle Telephone Survey und die Operationalisierung der theoretischen Begriffe
12
3.
3.1
3.2
Die Dokumentation des für WHLM 5 aufbereiteten MIETHEWHLM-Datensatzes 19
Die erhobenen Individual- und Nachbarschaftsmerkmale
19
Makrosoziale Erklärungsfaktoren der Viktimisierung auf der Census-Tract-Ebene 29
4.
Die statistischen Grundlagen „Hierarchischer Verallgemeinerter Linearer
Modelle“ am Beispiel der binären logistischen Regression für Individualdaten
35
5.
Entwicklung eines Auswertungsdesigns
43
6.
6.1
6.2
1. Arbeitsschritt: Explorative, hypothesengeleitete Analysen
45
Explorative Analyse des Viktimisierungsrisikos innerhalb der Nachbarschaften
45
Explorativen Analysen der Viktimisierungsraten durch Gewaltdelikte
auf der Nachbarschaftsebene
53
Entwicklung eines Mehrebenenmodells für die Erklärung des Viktimisierungsrisikos
durch Gewaltdelikte
60
6.3
7.
7.1
7.2
7.3
7.4
7.5
8.
Die Schätzung des Generalized Hierarchical Linear Model mit HLM 5
Das Importieren von SPSS-Daten in HLM 5
Arbeitsschritt 2: Die Schätzung des Random-Intercept-Only-Logit-Model
Arbeitsschritt 3: Schätzung Random-Intercept-Logit-Model mitexogenen
Individualmerkmalen
Arbeitsschritt 4: Schätzung des Random-Logit-Intercept-Random-Logit-SlopeModel
Arbeitsschritt 5: Schätzung der Coefficient-as-Outcome-Logit-Models
63
63
71
82
87
91
8.1
8.2
8.3
8.4
8.5
Schätzung des logistischen Zweiebenenmodells mit dem Freeware-Programm
MIXOR
Aufbereitung der Miethe-Viktimisierungsdaten in SPSS
Schätzung des Fixed-Logit-Intercept-Modells mit MIXOR
Schätzung des Random-Intercept-Only-Logit-Modell mit MIXOR
Schätzung des Random-Intercept-/Random-Slope-Logit-Modell mit MIXOR
Schätzung des Coefficient-as-Outcome-Logit-Modells mit MIXOR
114
116
119
125
129
136
9.
Literaturverzeichnis
145
1.
WiSe 2001/2002
2
Die theoretischen Ansätze des Seattle-Viktim-Surveys
Miethe und sein Projektteam führten 1990 einen Telefonsurvey in Seattle durch, dessen Forschungsschwerpunkt auf den Opferfahrungen der Befragten, ihrer Kriminalitätsfurcht sowie
ihrem subjektiven Sicherheitsgefühl lag. Als besonders innovativ erwies sich ihr Forschungsdesign im Hinblick auf die Integration „ökologischer Erklärungsfaktoren“ für die Viktimisierungserfahrungen und die Kriminalitätsfurcht. Um das differentielle Viktimisierungsrisiko
unterschiedlicher Bevölkerungsgruppen zu erklären, verwendeten Miethe&Meier (1994) zwei
theoretische Ansätze, die den Viktimisierungsprozeß sowohl aus der Sicht des Opfer als auch
des Täter beleuchten. Zum einen griffen sie auf den von Hindelang, Gottfredson&Garofalo
(1978) entwickelten „Lifestyle“-Ansatz zurück, der die unterschiedlichen Viktimisierungsrisiken bei Gewaltdelikten auf einen „risikoträchtigen“ Lebenstyle des Opfers zurückführt. Zum
anderen verwendeten sie den von Hough (1987) vorgeschlagenen Rational-Choice-Ansatz, um
aus der Sicht des Täters, die Auswahl eines spezifischen Opfers zu erklären.
Miethe&Meier (1994, S. 32ff.) fassen den von Hindelang, Gottfredson&Garofalo (1978)
entwickelten „Lifestyle“-Ansatz folgendermaßen zusammen:
„THE LIFESTYLE-EXPOSURE THEORY OF VICTIMIZATION
One of the first systematic theories of criminal victimization was the lifestyle-exposure approach developed by Hindelang, (Gottfredsem, and Garofalo ( 1978). This theory was originally proposed to account for differences in the risks of violent victimization across different social
groups, but has been extended to include property crime, and forms the basis for more elaborate theories of target-selection processes (see Hough 1987; Miethe and Meier 1990).
The basic premise underlying the lifestyle-exposure theory is that demographic differences in
the likelihood of victimization are attributed to differences in lifestyles. Variations in lifestyles
are important because they are related to the differential exposure to dangerous places, times,
and others-i.e., situations in which there are high risks of victimization. A graphic representation of this theoretical perspective is presented in Figure 3.1.
From this perspective, an individual's lifestyle is the critical factor that determines risks of
criminal victimization. Lifestyle is defined in this context as "routine daily activities, both
vocational activities (work, school, keeping house, etc.) and leisure activities" (Hindelang et al.
1978, 241 ). Differences in lifestyles arc socially determined by individuals' collective responses
or adaptations to various role expectations and structural constraints (see Figure 3.1 ). Under
this theoretical model, both ascribed and achieved status characteristics (e.g., age, gender,
race, income, marital status, education, occupation) are important correlates of predatory
crime because these starts attributes carry with them shared expectations about appropriate
behavior and structural obstacles that both enable and constrain one's behavioral choices.
Adherence to these cultural and structural expectations leads to the establishment of routine
activity patterns and associations with others similarly situated. These lifestyles and associations arc expected to enhance one's exposure to risky or vulnerable situations that, in turn,
increase an individual's chances of victimization. Several examples will clarity the basic logic
underlying this lifestyle-exposure model.
WiSe 2001/2002
3
Despite major efforts to promote greater gender equality in American society, there remain
fundamental differences in role expectations and structural opportunities for men and women.
Gender stereotyping; results in gender differences in such basic activities as where and with
whom time is spent, the degree of supervision in daily activities, the likelihood of contact with
strangers, and the exposure to risky and dangerous public places. For example, females spend
a greater proportion of their time inside the home because as adolescents they are more closely
supervised than males, and as adults they arc more likely to assume housekeeping; and childrearing responsibilities (Hindelang et al. 1978). Greater familial responsibilities and the
systematic denial of educational and economic opportunities may severely impede women's
participation in public life. Furthermore, even when engaged in public activity, women's routine
activities arc more likely than men's to take place in the presence of friends and intimate others,
rather than in isolation. These role expectations and structural impediments are assumed to
increase private domestic activities among women, increase supervision of their public behavior, decrease their exposure to high risk persons and places, and subsequently decrease their
relative risks of criminal victimization. Men, on the other hand, are traditionally socialized to
be active in the public domain, assertive and aggressive in social situations, have fewer restrictions on their daily lives, and spend more time away from a protective home environment.
Accordingly, gender differences in traditional lifestyles are said to explain the higher victimization risks of men.
Other strong determinants of lifestyle and exposure to crime are economic resources and family
income. As a fundamental aspect of stratification, income determines whether structural
conditions either enable or constrain various aspects of social life. For persons who are
economically disadvantaged, low income severely restricts choices with regard to housing,
transportation, associations with others, and leisure activities. Individuals' abilities to move out
of crime-prone environments, live in apartments or homes with elaborate security measures
(e.g., security guards, video surveillance, burglar alarms), avoid contact with potential offenders, and undertake leisure activities in safer areas arc limited when living under conditions of
economic despair. As family income increases, there is greater flexibility to adjust one's lifestyle
to select the area in which to live, the mode of transportation the daily activities, the amount of
time spent in private versus public places, and the type of leisure activities (Hindelang et al.
WiSe 2001/2002
4
1978). The greater choices afforded persons with higher economic resources allow them to
more easily avoid risky and vulnerable situations. Thus, by patterning the nature of social life,
income is a lifestyle characteristic that is expected to lead to differential risks of victimization.
From a lifestyle-exposure perspective, differences in risks of violent victimization by gender,
income, and other status characteristics are attributed to differences in lifestyles that increase
individuals' exposure to risky and vulnerable situations. Given that victimization risks arc not
uniformly distributed across time and space, lifestyles are assumed to affect the probability of
victimization because different lifestyles are associated with differential risks of being in
particular places, at particular times, under particular circumstances, and interacting with
particular kinds of people. Accordingly, persons who arc between 18 and 30 years old, male,
not married, low income and black should have higher risks of violent victimization than their
counterparts because each group is thought to engage in more public activity (especially at
night), spend less time with family members, and/or associate more frequently with persons who
have offender characteristics. Under this theoretical model, individuals' risks of property theft
from their dwelling should also he higher among those social groups (e.g., young, malt, single
persons) who spend more time engaged in public activity because such persons would be less
able to protect their property from crime.
If a lifestyle-exposure theory is an adequate explanation for differential risks of predatory
victimization, several outcomes would be expected. First, if demographic differences in victimization risks are due to differences in lifestyles and routine activities, the impact of each demographic variable (e.g., age, gender, race, social class) should decrease in importance once
separate measures of lifestyles and routine activities are included as control variables. Second,
persons with the configuration of status characteristics commonly recognized as having the
most vulnerable lifestyles (i.e., young, single, low income, black males) should have a greater
risk of victimization than any other configuration, and their exact opposites (i.e., older, married,
high income, white, females) should have the lowest relative risks. Third, given increases in
efforts to promote gender and racial equality in all institutional domains over the last two
decades, differences in victimization risks by these factors should decrease over time. In other
words, smaller differences in victimization risks by gender and race would be expected over
time if there were fewer groupspecific role expectations and fewer structural obstacles that
impede the daily activities of persons within each of these groups.“
Den von Hough (1987) entwickelten täterorientierten Rational-Choice Ansatz fassen sie
folgendermaßen zusammen:
„Conceptualizing Target-Selection Processes
Both routine activity and lifestyle-exposure theories attempt to explain crime rates and clarify
why particular groups of individuals have higher risks of victimization than others. Differences
in victimization risks for different demographic groups (e.g., males, young persons, non-whites,
low income) are attributed to differences in lifestyles and routine activities that enhance
individuals' exposure to risky times, places, and potential offenders. However, neither approach
develops an adequate micro-level theory to account for the selection of particular crime targets
within a particular socio-spatial context. This is the case because both theories pay little
attention to factors associated with criminality and offender motivation. Offender motivation,
in these theories, is either assumed to be constant or there is no explicit reference to what
WiSe 2001/2002
5
motivates people to commit crime (sec Cohen and Land 1987).
A closer examination of these theories, however, reveals two specific images of criminality.
First, an implicit assumption underlying criminal opportunity theories is that offender motivation is at least partially caused by the lack of external physical restraints. Criminal intentions
are translated into actions when there is a suitable person or object for victimization, and "an
absence of ordinary physical restraints such as the presence of other people or objects that
inhibit, or are perceived to inhibit, the successful completion of direct contact predatory crime"
(Cohen and Land 1987: 51 ). Second, offenders are assumed to make choices, no matter how
rudimentary, in the selection of targets for victimization. In fact, it is this rational conception of
criminal behavior underlying current victimization theories which offers the most premise in
explaining target-selection processes.
From the perspective of a "reasoning criminal" (Cornish and Clarke 1986), offenders seek to
benefit themselves by their criminal behavior and select victims who offer a. high payoff with
little effort or risk of detection. The decision to get involved in crime, and the subsequent choice
of particular crime victims, are influenced by the constraints of time, ability, energy, limited
information, and the availabiliy of alternatives. Nonetheless, offenders are assumed to engage
in some level of planning and foresight, and adapt their behavior to account for situational
contingencies (Cornish and Clarke 1986). Through selective filtering and processing of information, the rational offender is believed to select from a pool of potential victims those targets
thought to offer the greatest net rewards.
Interviews with convicted offenders reveal that many personal and situational factors are
considered in the selection of crime targets. Burglars, for example, report that the risks of
detection (i.e., the likelihood of getting caught), the potential yield or reward, and the relative
ease at which the home can be entered are the critical factors in selecting targets for victimization (see Bennett and Wright 1984). Similar aspects of the physical environment and victim
characteristics are considered by other offenders (e.g., robbers, muggers) when selecting crime
targets (see Cornish and Clarke 1986).
Hough (1987) has developed a conceptual framework to explain target selection which clarifies
the importance of routine activities and lifestyles in this process. According to Hough (1987:
359), this conceptual scheme considers it axiomatic that if members of one group are selected
as crime targets more frequently than another, they must meet at least one of three conditions:
(a) exposed more frequently to motivated offenders (proximity), (b) more attractive as targets in
that they afford a better "yield" to the offender (reward), or (c) more attractive in that they are
more accessible or less defended against victimization (absence of capable guardians). This
theoretical approach is graphically represented in Figure 3.2. The value of this perspective for
understanding criminal victimization is that it clearly states that differences in proximity,
attractiveness, or guardianship can account for differences in individuals' risks of victimization,
and that persons who possess each of these characteristics are especially vulnerable to crime.
Consistent with both routine activity and lifestyle-exposure theory, these differences in targetselection factors are determined by individuals' routine activities and lifestyles.
WiSe 2001/2002
6
Although this revised model clarifies the role of routine activities and lifestyles in targetselection processes, it is still limited in several respects. First, victimization most likely occurs
under conditions of proximity, reward and no guardianship, but the model does not specify
which factor is most important. Second, while interviews with convicted offenders suggest that
target-selection factors may vary widely for different types of predatory crime (see Bennett and
Wright 1984; Carroll and Weaver 1986; Cornish and Clarke 1986; Feeney 1986; Walsh 1986),
this theoretical perspective does not capture these crime-specific differences. Third, even within
particular types of crime (e.g., muggings), there appear to be major differences in factors
associated with target selection between novice and seasoned offenders (Cornish and Clarke
1986). These within-crime differences are also not directly incorporated in the model. Nonetheless, the conceptual framework outlined by Haugh (1987) is a major improvement over the
original formulations of routine activity and lifestyle-exposure theories.“ (A.a.O., S. 41ff.)
Miethe&Meier(1994) diskutieren ausführlich die zentralen Kontrukte der von ihnen referierten
Viktimisierungstheorien. Aus ihrer Sicht bilden die Begriffe „Proximity to Crime“, „Exposure
to Crime“, „Target Attractiveness“ sowie „Capable Guardianship“ das gemeinsame Fundament
der von ihnen dargestellten Ansätze:
„MAJOR CONCEPTS IN VICTIMIZATION THEORIES
Although the terminology differs across studies, the central concepts underlying criminal
opportunity theories of victimization are proximity to crime, exposure, target attractiveness, and
guardianship. The measurement of these concepts and their empirical validity in previous
studies arc outlined below.
Proximity to Crime
One major factor that is presumed to increase the likelihood of victimization is physical
proximity to high-crime areas.. Following Cohen et al. (1981: 507), proximity is best represented as the physical distance between areas where potential targets of crime reside and areas
WiSe 2001/2002
7
where relatively large populations of potential offenders are found. Living in a high-crime area
increases the likelihood of frequent contact with offenders, and thus increases one's risks of
victimization. The fact that persons spend a majority of their time around the home, and that
offenders tend to select targets in close proximity to their residence (see Hindelang et al. 1978)
further indicates the adverse consequences of living in a high-crime area.
Both theories of criminality and research in the spatial ecology of crime identify characteristics
of high-crime areas.. Macro-sociological theories of criminality (e.g., social disorganization,
anomie, differential social organization) suggest that high-crime geographical areas have high
levels of population turnover, ethnic heterogeneity, and low socio-economic status. However,
the work on deviant places and "hot spots" (Stark 1987; Sherman et al. 1989) indicates that
even within a large geographical area with a high crime rate (e.g., neighborhood, subdivision,
a side of town) there is enormous variation in the amount of crime. From this perspective, some
places (e.g., bars, convenience stores" adult bookstores, apartment complexes) are more
dangerous than others because they attract deviant and crime-prone people, provide more
targets for victimization, and have a diminished capacity for social control.. Living near major
transportation arteries, fast-food restaurants, bus stops, schools, and other places which attract
a larger number of strangers would also increase one's vulnerability to crime for similar
reasons.
Common measures of physical proximity used in previous research include place of residence
(e.g., rural or urban resident), socio-economic characteristics of the area (e.g., income level,
unemployment rate, racial composition) and the perceived safety of the immediate neighborhood (see Cohen et al. 1981; Hough 1987; Lynch 1987; Sampson and Wooldredge 1987;
Miethe and Meier 1990). The average rate of offending in an individual's immediate neighborhood is probably the best single indicator of proximity, but selt-report and official measures of
offending are rarely available at the neighborhood level. Studies using the British Crime Survey
(Sampson and Wooldredge 1987; Miethe and Meier 1990) are the exception to this rule. The
absence of multi-level research designs has been a major impediment to the development of
measures of offending rates in models of victimization risks.
Previous empirical studies generally find that measures of proximity are associated with
increased risks of victimization. For example, we found in our study of British residents (Miethe
and Meier 1990) that persons who lived in inner city areas, perceived their neighborhood to be
unsafe at night, and lived in areas with higher levels of offending had higher risks of burglary,
personal theft, and assault victimization. Using a seven-category variable based on the income
of neighborhoods and the size of the population, Cohen et al. (1981) found that persons who
lived in central cities and low-income areas had higher risks of assault, burglary, and personal
larceny than persons who lived in other types of areas. Given the high levels of residential
segregation in the United States based on status characteristics, the observed association
between particular demographic factors (e.g., low income, being single, non-white, high
residential mobility) and individuals' risks of victimization may also be attributed to the proximity of these social groups to pools of motivated offenders (see Hindelang et al. 1978; Miethe
et al. 1987; Smith and Jarjoura 1989). However, as will be discussed shortly, it is important to
note that such findings are also consistent with other major components of victimization
theories (i.e., exposure, target attractiveness, and low guardianship).
WiSe 2001/2002
8
Exposure to Crime
Contrary to proximity, which reflects the physical distance between large numbers of offenders
and victims, "exposure to crime" is indicative of one's visibility and accessibility to crime
(Cohen et al. 1981; Miethe and Meier 1990). Accordingly, a building or dwelling has higher
exposure to burglary if it is detached from other units, has multiple points of entry, and is
located on a corner lot. Persons are exposed to higher risks of personal theft and assault when
their routine activities and lifestyles place them in risky or vulnerable situations at particular
times, under particular circumstances, and with particular kinds of persons. For example, risks
of personal victimization are assumed to be directly related to the amount of time spent in
public places (e.g., streets, parks) and, especially, public places at night (Hindelang et al. 1978:
251). Furthermore, the research on "hot spots" suggests that frequent contact with drinking
establishments, bus depots, public transit, convenience stores, shopping malls, and other
dangerous public places would also increase one's exposure to crime (Sherman et al. 1989).
The primary means by which exposure has been measured in past studies involves the level and
nature of non-household activity. Several authors have used the individual's primary daily
activity as a measure of exposure (e.g., Cohen and Cantor 1980, 1981; Cohen et al. 1981;
Miethe et al. 1987), arguing that persons who are employed or in school have greater exposure
to crime because such persons spend more time away from home. More detailed indicators of
this concept include the average number of evenings per week spent outside the home for leisure
activities, and the average number of hours per week the dwelling is unoccupied during the day
or night (see Sampson and Wooldredge 1987; Masscy et al. 1989; Miethe and Meier 1990).
When applied to the study of crime rates, measures of exposure have included the household
activity ratio (see Cohen and Felson 1979), aggregate rates of television viewing, the supply of
entertainment establishments (e.g., commercial cinemas, profit-making sport activities, opera
and symphony orchestra companies), public transportation, female labor force participation,
and retail sales from eating and drinking establishments (see Messner and Blau 1987; Miethe,
Hughes and McDowall 1991).
Previous studies yield mixed results about the impact of exposure on individuals' risks and
aggregate rates of victimization. Increases in non-household activity are associated with higher
crime rates in some studies (e.g., Cohen and Felson 1979; Cohen et al. 1980; Felson and Cohen
1980) but not in others (Miethe et al. 1991). Increases over time in individuals' levels of daytime
and nighttime activity outside the home do not necessarily lead to increased risks of violent or
property victimization (Miethe, Stafford, and Sloane 1990), whereas cross-sectional analyses
generally reveal that victimization risks are higher for persons who have higher levels of
activity outside the home (Hough 1987; Sampson and Wooldredge 1987; Massey ct al. 1989;
Kennedy and Forde 1990; Miethe and Meier 1990). Studies of the physical characteristics of
burgled households and interviews with known offenders also suggest that the visibility and
accessibility of targets influence risks of victimization (see Reppetto 1974; Waller and Okihiro
1978; Walsh 1980; Bennett and Wright 1984; Hough 1987). Unfortunately, little research has
examined how active participation in particular types of routine activities (e.g., bar visits,
visiting places where teenagers "hang out") influences risks of violent victimization.
Target Attractiveness
A central assumption underlying current victimization theories is that particular targets arc
selected because they have symbolic or economic value to the offender. However, crime targets
WiSe 2001/2002
9
are also attractive to offenders when they are smaller in size (i.e., more portable) and offer less
physical resistance against attack or illegal removal (see Cohen et al. 1981). Under a
structural-choice model of victimization (Miethe and Meier 1990), it is the differential value or
subjective utility associated with crime targets that determines the source of victimization within
a social context.
A variety of indicators of target attractiveness have been used in past research. In the original
work on routine activity theory, Cohen and Felson (1979) compared the theft rate for portable
and movable durables (e.g., electronic components, television sets, radios, automobiles and
their accessories) with their overall circulation rate. The decreased size of these durable goods
from the early 1960s through the mid 1970s also corresponds with increases in official crime
rates in the United States. However, the supply of many of these portable durable goods (e.g.,
televisions, radios, car tape players, phonograph cartridges) may not be a good indicator of
target attractiveness for studies of crime rates over time when one considers that the reduced
costs and increased availability of many of these items may lead to their devaluation as "attractive" crime targets. As a general proxy for purchasing power and the supply of expensive
goods, median family income and the gross national product are aggregate measures of target
attractiveness that are not susceptible to such a devaluation over time.
The major measures of target attractiveness at the individual-level of analysis have been the
ownership of expensive and portable consumer goods (e.g., video-cassette recorders, color
television sets, bicycles, motorcycles), the possession of cash and jewelry in public, family
income and social class (see Sampson and Wooldredge 1987; Miethe and Meier 1990). As a
measure of economic attractiveness, family income should be a good indicator of this concept
because it can be recognized immediately by offenders in most cases (e.g., through the geographical location of a dwelling within a city, its exterior condition, or the general appearance of
the individual). However, in the case of expressive acts of interpersonal violence, it is difficult
to think of an unambiguous measure of target attractiveness.
The results of previous research provide mixed support for the importance of target attractiveness in explaining individuals' risks and aggregate rates of victimization. Greater risks of
victimization for persons with higher income are observed in some studies but not in others (see
Cohen and Cantor 1980, 1981; Cohen et al. 1981; Hough 1987; Miethe and Meier 1990;
Miethe, Stafford, and Sloane 1990). Persons who carry larger sums of money while in public
places have a greater net risk of assault victimization, but ownership of a video-cassette
recorder was found to either decrease or have no significant impact on individuals' risks of
burglary (Sampson and Wooldredge 1987; Miethe and Meier 1990). Studies of crime rates for
geographical areas also yield inconsistent results about the relationship between economic
conditions and crime rates (see Cohen et al. 1980; Cohen 1981; Stahura and Sloan 1988;
Miethe, Hughes, and McDowall 1991).
Capable Guardianship
The final major component of current victimization theories involves the ability of persons or
objects to prevent the occurrence of crime. Guardianship is usually conceptualized as having
both social (interpersonal) and physical dimensions. Social guardianship includes the number
of household members, the density of friendship networks in the neighborhood, and having
neighbors watch property or a dwelling when the home is unoccupied. The availability of others
(e.g., friends, neighbors, pedestrians, law enforcement officers) may prevent crime by their
presence alone or through the offering of assistance to ward off an attack. Physical guardians-
WiSe 2001/2002
10
hip involves target-hardening activities (e.g., door/window locks, window bars, burglar alarms,
guard dogs, ownership of firearms), other physical impediments to household theft (e.g., street
lighting, guarded public entrances), and participation in collective activities (e.g., Neighborhood Watch programs, home security surveys). Regardless of its particular form, the availability of capable guardianship is important because it indicates increased "costs" to would-be
offenders (e.g., greater effort, greater risk of detection and apprehension), and thus decreases
the opportunity for victimization.
A review of previous research on guardianship activities reveals several general trends. First,
target-hardening efforts are widespread in the United States. The majority of urban residents
take routine precautions against crime, including locking doors and windows, using exterior
lighting and having neighbors watch their property (Dubow 1979; Skogan and Maxfield 1981;
Miethe 1991). Collective crime prevention activities (e.g., property marking projects, Neighborhood Watch) have also been organized throughout the country (see Rosenbaum 1987, 1990).
Second, the success of guardianship activities has been mixed. Physical and social guardianship is associated with lower rates of victimization in several studies but not in others (see Scarr
1973; Reppetto 1974; Skogan and Maxfield 1981; Lavrakas et al. 1981; Winchester and
Jackson 1982; Yin 1986; Rosenbaum 1987, 1990; Miethe and Meier 1990). However, several
authors (Mayhew 1984; Miethe 1991 ) argue that the use of crosssectional designs and the lack
of a clear temporal ordering among variables have contributed to these inconsistent results due
to the "victimization effect" (i.e., the tendency for persons to take precautions as a consequence
of being victimized). Third, few studies of guardianship have exercised sufficient controls for
other factors influencing victimization risks. Under such conditions, it is impossible to ascertain
whether differences between protected and unprotected residents are due to the deterrent effect
of protective actions or to other factors (e.g., lifestyles, target attractiveness, proximity to highcrime areas) which also alter the likelihood of victimization (see Miethe 1991).“
Für ihre Level 1-Ebene der Befragten in ihrer Nachbarschaft haben Miethe und Meier auf der
Grundlage der von ihnen referierten Theorien mittlerer Reichweite die folgenden Hypothesen
aufgestellt:
„Our review of the literature on theories of victimization reveals seven major research hypotheses. Finding empirical support for each of them across different levels of analysis and
research designs would clearly document the importance of an opportunity perspective in
understanding predatory crime. Using various sources of data, the following research hypotheses will be addressed in the current study:
Hl.
Demographic differences (eg., age, gender, race, income, marital status, education) in
victimization risks should decrease in magnitude once controls are introduced for routine
activities and lifestyles. This hypothesis is based on the assumption that demographic
differences in victimization risks are due to differences in routine activities and lifestyles
(Hindelang et al. 1978; Miethe et al. 1987).
H2. Persons with the configuration of status characteristics commonly recognized as having
the most vulnerable lifestyles (i.e., young males, lowincome young males) should have a
greater risk of victimization than any other status configuration. These differences in
victimization risks should also be explained by differences in the level of non-household
activity for each group.
WiSe 2001/2002
11
H3. Differences in victimization risks by status characteristics should dissipate over time.
Such an outcome would be expected if role expectations and structural constraints based
on status attributes have weakened in the United States over the last three decades. Given
the specific efforts to promote gender and racial equality in all institutional domains,
differences in victimization risks by either gender or race should exhibit the greatest
decrease in magnitude over time.
H4. The greater the proximity to motivated offenders, the higher the risks of victimization. This
expected positive relationship should hold true with and without controls for other
variables that influence criminality and victimization risks.
H5. The greater the exposure to risky and vulnerable situations, the higher the risks of victimization. This expected positive relationship should hold true with and without controls for
other variables that influence criminality and victimization risks.
H6. The greater the attractiveness of the crime target, the higher the risks of victimization.
This relationship should hold true with and without controls for other variables that
influence criminality and victimization risks.
H7. The greater the level of guardianship, the lower the risks of victimization. This relationship should hold true with and without controls for other variables that influence criminality and victimization risks.
In addition to these basic relationships, we will also examine whether criminal opportunity
theories are better able to predict victimization risks for some types of crimes than others, and
whether the impact of each theoretical component varies across different social contexts.“
(A.a.O., S. 57f.)
2.
WiSe 2001/2002
12
Das Erhebungsdesign der Seattle Telephone Survey und die Operationalisierung der theoretischen Begriffe
Miethe und seine Mitarbeiter entwickelten einen speziellen Stichprobenplan, der drei Ebenen
umfaßt. Innerhalb der 100 Census Tracts (Volkszählungsbezirke mit im Durchschnitt 5.000
Bewohnern), deren Grenzen sich seit 1960 nicht geändert hatten, wählten sie drei Straßenblöcke
als zweite Ebene aus. Jedes dieser Triple setzt sich zusammen zunächst aus einem Block, in
dessen zugehörigen Straßen die Polizei Seattles 1989 einen Einbruch registriert hat. Beim
zweiten Block handelt es sich jeweils um den unmittelbar an den Viktimisierungsstraße angrenzenden Block. Der dritte Block dient als Kontrolleinheit und wurde unter den vier angrenzenden Straßenblocks nach dem Zufallsprinzip ausgewählt. Aus unmittelbar benachbarten
Wohngebäuden wurden innerhalb jedes Blocks 18 Haushalte gezogen, die im Bedarfsfall bei
häufigen Interviewverweigerungen um weitere Haushalte ergänzt wurden. Ingesamt realisierte
das Projektteam 5.302 Interviews mit den erwachsenen Anschlußinhabern in 300 Nachbarschaften, die sich gleichmäßig auf die 100 Volkszählungsbezirke verteilen.
Zusätzlich haben die Autoren für die dritte Ebene der 100 Volkszählungsbezirke weitere
Indikatoren zur Einkommensarmut, Bevölkerungsmobilität, ethnischen Heterogenität, zur
familialen Desorganisation und zur Kriminalitätsbelastung aus den amerikanischen Volkszählungen von 1960, 1970 und 1980 sowie dem Uniform Crime Report entnommen.
Miethe und Meier (1994, S. 79ff.) beschreiben ihr spezielles Untersuchungsdesign folgendermaßen:
„The primary data source used in this study to evaluate the theories of victimization involves a
telephone survey of 5,302 residents of Seattle, Washington The interviews were conducted from
February to May of 1990. The telephone survey was part of a large study of crime in Seattle
over the last three decades, and was funded by a grant from the National Science Foundation.
Three research questions underlie this larger project: ( 1) Do the major components of criminal
opportunity theories of victimization (i.e., proximity, exposure, target attractiveness, guardianship) adequately account for individuals' risks and neighborhood rates of violent crime and
property victimization?, (2) Do socio-economic changes in geographical areas explain the
changes in their crime rates over time?, and (3) How does the target-hardening efforts of
residents and their immediate neighbors influence individuals' risks of victimization?
To evaluate how the wider social context of crime control activities influences individuals' risks
of victimization, a complex sampling design was used to select immediate neighbors and
bordering city blocks. 'The final sample involves 5,302 residents who live on 600 city blocks in
100 of the 121 census tracts in Seattle. Stratifying the sample by both census tract and city
blocks within tracts insured a sufficient number of respondents for each of these aggregate
units. The 100 census tracts used here represent a random subsample of the 114 census tracts
which had not changed their geographical boundaries since 1960.
After selecting census tracts, the next stage of sampling involved identifying three pairs of city
blocks per census tract.' One block per pair contained a street address in which a burglary was
reported to the police during 1989, whereas the other block per pair involved a street segment
which was bordering the street on which the burglary occurred. The selection of a city block
with a known burglary was made to increase the number of victimized households in the
WiSe 2001/2002
13
sample. Once these 300 blocks with known burglaries were identified, a detailed city map was
used to select, at random, one of the four adjoining city blocks for each pair. This aspect of the
sampling design was important in the original study because it allowed for an assessment of
how the wider social context of safety precautions influences victimization risks across adjoining city blocks.
A reverse telephone directory (organized sequentially by street address) was used to select
adjacent housing units on each city block. A maximum of eighteen households were initially
selected per block, however additional households were also chosen when large rates of
"disconnects," "no answers," or "wrong addresses" were observed on a block. Replacement
sampling was done to insure a sufficient number of respondents for deriving aggregate rates for
each block. For each household in the sampling frame, a maximum of five call-backs were made
to contact respondents. Special efforts were made to interview a particular person (the one
listed in the directory), but another adult in the same household was interviewed when the
primary person was not available. No interviews were completed when an adult was not present
or when an adult did not feel qualified to answer questions about the household. Identical
procedures were used to select respondents on blocks with and without known burglaries.
Overall, there were 12,303 phone numbers dialed by the interviewers which resulted in contact
with 9,250 residential households. Noncontact phone numbers included "no answer" (n =
1,548), "disconnects" (n = 1,355), and business (n = 150). 'The sample size was reduced further
because the primary respondent or another knowledgeable adult in the household was not
available (n = 742), changed addresses (n = 940), or the respondent was hearing impaired or
did not speak English (n = 409). Of the remaining 7,159 eligible households, 5,302 interviews
were completed, resulting in a response rate of 74.1 percent. The number of complete interviews
per city block ranged from four to twelve, with 99.2 percent (595/600) having six or more
respondents per block. The number of completed interviews per pair of city blocks ranged from
thirteen to twenty-one, and from forty-five to fifty-seven respondents per census tract.
Detailed field observations were also made on each housing unit in order to evaluate the
proximity of the sample units on a city block and the validity of collapsing observations to form
neighborhood rates. Information was recorded on the characteristics of each city block (e.g., its
length, number of cross-streets, traffic flow) and each housing unit (e.g., security equipment on
premises, the dwelling's physical condition, visibility of front yard, its location on the block).
Although a vacant lot or another dwelling not included in the sample separated housing units
in many cases, the field observations clearly confirmed the physical proximity of neighbors, and
supported the aggregation of individual responses to derive rates per block and rates per
census tract.
Several additional comments about the sampling design are worth noting. First, telephone
directories arc limited because they do not include persons with unlisted phone numbers (about
28 percent in Seattle households) and are particularly unrepresentative of recent movers. Only
7.3 percent of our sample respondents had moved in the last year, compared to a national rate
of about 18 percent. Nonetheless, telephone directories were used because they are the best
available source for drawing a comprehensive sample of immediate neighbors and adjoining
blocks across an entire city. Second, the sampling design and the survey results limit generalizations that can be made about the entire city of Seattle. This is the case due to the use of the
telephone directories, the sampling of only "stable" census tracts (i.e., those that had not
changed their boundaries since 1960), the deliberate oversampling of 300 city blocks with
known burglaries, a 9 percent higher response rate for street addresses with known burglaries
over housing units in which it was unknown, in advance, whether a burglary had occurred, and
WiSe 2001/2002
14
the relatively high rates of home ownership (65 percent) and college education (71 percent had
at least "some college") in the survey sample. When the Seattle respondents are compared with
the household respondents in the 1989 NCS data (see Table 5.1 ), it is easy to see that the
Seattle sample is older, more educated, less transient (i.e., Iess frequent movers, higher rates of
home ownership), and more evenly distributed with regard to gender than the NCS sample.
If our interest was in generating city-wide estimates of demographic characteristics and
victimization rates, the sampling limitations of the Seattle survey would severely question the
validity of these inferences. The differential composition of the Seattle and NCS samples also
hampers comparisons of bivariate relationships across samples. When samples have different
characteristics, it cannot be easily determined whether differences in substantive findings arc
due to unreliable results or differences in sample composition. On the other hand, comparisons
of the relative risks of victimization within categories of demographic attributes (e.g., gender,
race, or age differences) arc Icss affected than city-wide estimates by the problems with the
sampling design. Given that our primary interest is to examine how relative differences in
routine activity patterns and lifestyles alter individuals' risks of victimization, the sampling bias
against lower income, transient, and young persons in the Seattle data is less bothersome than
would be true in other studies.
The multi-level sampling design, and the type of information coIlected in the Seattle survey,
contribute to its uniqueness as a data source for testing theories of victimization. Specifically,
each of the potential aggregate units (e.g., city block, pairs of city blocks, census tracts) is
physically well defined and contains a sufficient number of respondents to provide stable
estimates of aggregate parameters. In contrast to other data sources for multi-level and contextual analyses (e.g., the NCS files, the British Crime Surveys), the independent confirmation,
through field observations of the physical proximity of residents on city blocks and within
census tracts, provides unique validation for the merits of these aggregate units. Given that the
primary goal of the Seattle study was to evaluate theories of victimization, the survey was also
designed to collect a rich array of measures on the routine activities and lifestyles of the
respondents. As described in the next section, these measures provide multiple indicators of
each of the major concepts underlying theories of victimization.“
Miethe und Meier (1994, S. 95ff.) operationalisieren ihre zentralen theoretischen Konzepte
folgendermaßen. Zusätzlich geben sie für die einzelnen Ebenen die zugehörigen Mittelwerte und
Standardabweichungen an:
„MEASURES OF CONCEPTS AND DESCRIPTIVE STATISTICS
Low Socio-Economic Conditon
1.
Median Family Income:
Census Tracts [ mean = $22,536.1; sd = 6,145.4]
Cities [ mean = $21,041.6; sd = 5,221.6]
SMSA [mean = $10,021.7; sd = 1,322.4]
Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse 2.
WiSe 2001/2002
15
Unemployment Rate:
Census Tracts [ mean = 7.4 percent; sd = 4.6 ]
Cities [mean = 5.5 percent; sd = 2.4]
SMSA [ mean = 4.3 percent; sd = 1.4 percent]
Population Mobility
Measured as the percent of the population that has moved in the previous five years. This
variable is not available for SMSAs. Census tract [mean = 51.8 percent; sd = 10.9 ]. City
[ mean = 49.4 percent; sd = 9.8 ].
Ethnic Hetereogeneity
Computed as the product of the percent black and non-black in the particular census tract, city,
or SMSA. For each aggregate unit, the descriptive statistics on this variable are: (a) census
tract [ mean = 0.048; sd = 0.072 ], (b) city [ mean = 0.083; sd = 0.080 ], and (c) SMSA
[ mean = 0.083; sd = 0.061 ].
Single-Parent Families
Measured as the percent of the children under 18 years oId that live with both parents. Census
tract [ mean = 78.5 percent; sd = 14.6 ]. City [ mean = 79.4 percent; sd = l0.3 ]. SMSA
[ mean = 82.9 percent; sd = 4.1 ].“ (A.a.O., S. 95)
„Proximity to High Crime Areas
1.
Property Victimization Rate: The average victimization rate for property offenses (i.e.,
burglary, household theft, and motor vehicle theft within four blocks of home) from 1988
to 1990. Pairs of city blocks [mean = 33.1 percent; sd = 14.5]. Census Tracts [mean =
33.1 percent; sd = 10.6].
2.
Violent Victimization Rate: The average victimization rate for violent offenses (i.e.,
stranger assault, robbery) within four blocks of the resident's home from 1988 to 1990.
Pairs of city blocks [mean = 2.8 percent; sd = 5.3]. Census Tracts [mean = 2.8 percent;
sd = 4.2].
3.
Perceived Safety of Neighborhood: Average rating of individual scores ( 1 = very safe; 2
= somewhat safe; 3 = somewhat unsafe; 4 = very unsafe). Pairs of city blocks [mean =
2.11; sd = 0.38]. Census Tracts [mean = 2.11; sd = 0.33].
4.
Neighborhood Decay/Deterioration: Five-item scale representing the average number of
different signs of incivility within three blocks of each resident's home. Calculated by
averaging individual scores. Items include: (a) groups of teenagers "hanging around" the
street, (b) litter/garbage/trash on the street, (c) abandoned houses and run-down buildings, (d) poor street lighting, and (e) vandalism-like broken windows or writing on walls.
Scale values range from 0 to 5. Pairs of city blocks [ mean = 1.34; sd = 0.71 ]. Census
Tracts [mean = 1.34; sd = 0.60].“ (A.a.O., S. 95f.)
WiSe 2001/2002
16
„Exposure to Risky and Dangerous Situations
1.
Female Labor Force Rate: The percent of the civilian labor force that is female. Available
for U.S. cities and Seattle census tracts from 1960 to 1980. Census Tracts [ mean = 38.0
percent; sd = 7.1 ]. U.S. Cities [mean = 40.1 percent; sd = 5.0].
2.
Public Transportation Rate: The percent of workers who use public transportation.
Available for U.S. cities and Seattle census tracts from 1960 to 1980, and SMSAs for
1970. Seattle Census Tracts [ mean = 18.8 percent; sd = 8.0 ]. Cities [ mean = 8.1 percent; sd = 8.3]. SMSAs [mean = 6.1 percent; sd = 6.1 ].
3.
Sales from Eating/Drinking Establishments: The average retail sales from caring and
drinking establishments per population member. U.S. cities from 1960 to 1980 [ mean =
$433.04; sd = 204.4]. For SMSA.s, the item represents the percent of total retail sales
from eating and drinking establishments. SMSAs [mean = 7.5 percent; sd = 1.4].
4.
Nights Out: The number of nights, in the previous week, that the respondent was outside
the home for work, leisure, and social activities. Values range from "0" to "7" nights.
Available for individuals in the Seattle survey and can also be aggregated by pairs of city
blocks and census tracts. Individuals [mean = 2.43; sd = 2.0 ].
5.
Home Unoccupied at Night: The number of evenings, in the previous week, that the home
was unoccupied for some time at night. Values range tom "0" to "7" nights. Available for
individuals in the Seattle survey and can also be aggregated by pairs of city blocks and
census tracts. Individuals [ mean = 1.78; sd = 1.97].
6.
Dangerous Activities: Three-item scale of the number of different types of dangerous
public activities undertaken by the respondents. Items include: (a) going to bars or nightclubs that serve alcohol, during the previous week, (b) being in a public place, in the
previous week, where groups of teenagers or young adults were "hanging out" on the
street, and (c) taking a city bus or other types of public transportation. Scale ranges from
"0" to "3" activities. Available for individuals in the Seattle survey and can also be
aggregated by pairs of city blocks and census tracts. Individuals [ mean = 0.88; sd = 0.81
].
7.
Busy Public Places: Eight-item scale of the number of different types of public places,
within three blocks of the resident's home, that attract strangers. Items include: (a) high
schools or junior high schools, (b) convenience stores or gas stations, (c) bar or nightclub
that serves alcohol, (d) fast food restaurant, (e) bank or office building, (t) park or playground, (g) shopping center or mall, and (h) hotel or motel. Scale ranges from "0" to "8"
places. Available for individuals in the Seattle survey and can also be aggregated by hairs
of city blocks and census tracts. Individuals [ mean = 2.51; sd = 1.8 ].
8.
Times Felt in Danger: The number of times, in the previous month, that the respondent felt
at danger of a physical attack by a stranger. Values range from "0" to "5" (5 or more
times). Available for individuals in the Seattle survey and can also be aggregated by pairs
of city blocks and census tracts. Individuals [mean = 0.20; sd = 0.76 ]. 89.8 percent of the
WiSe 2001/2002
17
respondents said "0 times".“ (A.a.O., S. 96f.)
„Target Attractivenes
1.
Median Family Income: Census Tracts [mean = $22,536.1; sd = 6145.4]. Cities [mean =
$21,041.6; sd = 5,221.6]. SMSA [mean _ $10,021.7; sd = 1,322.4].
2.
Family Income: Categories of total family income before taxes in 1989. Values included
"1" (less than $10,000), "2" ($10,000 to $20,000), "3" ($20,000 to $30,000), "4" ($30,000
to $50,000), "5" ($50,000 to $75,000), "6" ($75,000 to $100,000), and "7"(over
$100,000). Available for individuals in the Seattle survey and can also be aggregated by
pairs of city blocks and census tracts. Individuals [mean = 3.37; sd = 1.36].
3.
Expensive Consumer Goods: Five-item scale of the number of different types of expensive
consumer goods owned by the resident. Items include: (a) portable color T.V., (b) videocassette recorder, (c) 35mm camera, (d) home computer, and (e) bicycle or motorcycle.
Values range from "0" to "5" items. Available for individuals in the Seattle survey and can
also be aggregated by pairs of city blocks and census tract. Individuals [mean = 2.53; sd
= 1.41 ].
4.
Carry Valuables in Public: The number of times, in the previous month, the respondent
either carried at least $50 in cash or wore jewelry worth over $100 when in a public
place. Values range from "0" to "8" (8 or more) times. Available for individuals in the
Seattle survey and can also be aggregated by pairs of city blocks and census tract. Individuals [mean = 3.24; sd = 2.63].“ (A.a.O., S. 98)
„Guardianship
1.
Average Household Size: The number of persons per occupied housing unit. Available for
U.S. cities and census tracts in Seattle from 1960 to 1980, and SMSAs for 1970. Census
Tracts [ mean=2.56; sd = 0.57]. Cities [mean = 3.03; sd = 0.37]. SMSA [ mean - 3.26;
sd = 0.19 ].
1 a. Household Crowding: The percent of occupied units with more than 1.01 persons per
room. Available for U.S. cities and census tracts from 1960 to 1980, and SMSAs for 1970.
Used as a control variable to isolate the net effects of household size due to guardianship
from the adverse impact of crowding on criminality. Census Tracts [mean = 3.6 percent;
sd = 2.8]. Cities [mean = 7.0 percent; sd = 4.4]. SMSAs [ mean = 7.6 percent; sd = 2.7
J.
2.
Persons over 16 years old: The number of persons in the household over 16 years old.
Values range tom "0" (live alone) to "3" (3 or more persons). Available for individuals in
the Seattle survey and can also be aggregated by pairs of city blocks and census tract.
Individuals [mean = 2.00; sd = 0.89].
3.
Friends/Relatives Live Nearby: Whether or not the resident has any good friends or
relatives who live on their city block. Values range from "0" (no) to "1" (yes). Available
WiSe 2001/2002
18
for individuals in the Seattle survey and can also be aggregated by pairs of city blocks
and census tract. Individuals [mean = 0.61; sd = 0.49].
4.
Social Integration: Five-item composite index of the number of different activities performed with neighbors which indicate neighborhood integration and internal social
control. Items include: (a) watching the neighbor's property when they are out of town, (b)
borrowing tools or small food items, (c) had dinner or lunch with a neighbor, (d) helped
a neighbor with a problem, and (e) participated in an organized block activity or neighborhood association. Scale values range from "0" to "5." Available for individuals in the
Seattle survey and can also be aggregated by pairs of city blocks and census tract. Individuals [mean = 2.79; sd = 1.57].
5.
Safety Precautions: Eight-item composite index of the number of different types of safety
precautions taken by the respondent "two years ago." Items include: (a) locking doors, (b)
leaving lights on, (c) belonging to a community crime prevention program [e.g., Neighborhood / Block Watch], (d) installing extra locks, (e) having a burglar alarm or other
electronic security devise, (f) owning a dog, (g) having neighbors watch the home when
the owner is out of town, and (h) having a weapon in the home for protection. Scale values
range from "0" to "8" precautions. Available for individuals in the Seattle survey and can
also be aggregated by pairs city blocks and census tract. Individuals [mean = 3.91; set =
1.47].
6.
Defending Self from Others : Self-rating of the perceived ability to physically defend self
or ward off an attack from another person. Values ranged from "0" (no, don't know) to
"1" (yes). Available for individuals in the Seattle survey and can also be aggregated by
pairs of city blocks and census trait. Individuals [mean = 0.47; sd = 0.50 ].“ (A.a.O.,
S.98f.)
„Types of Predatory Crime and Victimization
1.
Violent Crimes: UCR data provides rates of homicide, rape, aggravated assault, and
robbery for U.S. cities and Seattle census tracts from 1960 to 1980 and for SMSAs in
1970. Individuals' risks and aggregate rates of violent victimization for pairs of city
blocks are derived from the Seattle telephone survey. Violent crimes in the Seattle victimization survey include stranger assault and personal robbery (i.e., street mugging, purse
snatching, pocket picking).
2.
Property Crimes: UCR data provides rates of burglary and motor vehicle theft for U.S.
cities and Seattle census tracts from 1960 to 1980 and for SMSAs in 1970. Individuals'
risks and aggregate rates of property victimization for pairs of city blocks are derived
from the Seattle telephone survey. Property crimes in the victimization survey include
residential burglary, household theft (i.e., theft of property from outside the dwelling, in
the yard, or on a porch), and motor vehicle theft (i.e., theft of vehicle, illegal entry).“
(A.a.O, S.100)
WiSe 2001/2002
19
3. Die Dokumentation des für WHLM 5 aufbereiteten MIETHEWHLM-Datensatzes
Die SPSS-Datendatei „MIETHEWHLM.SAV“ enthält aus Platzgründen nicht alle Variablen
des CATI-Suverys sondern nur die bereits aufbereiteten Indizes, deren Wertebereiche und
Originalfragen jeweils dokumentiert werden.1
3.1 Die erhobenen Individual- und Nachbarschaftsmerkmale
Tab. 1: Übersicht der Identifikationsvariablen für die untersuchten Ebenen:
Variable:
Bedeutung:
PROBNR
Level 1- Kennung: Probandennummer (ni =5.302)
BLOCKICT
Level 2-Kennung:
Straßenblock/Nachbarschaft im CensusTract (Volkszählungsbezirk) (n j =300)
TRACTID
Level 3-Kennung:
Census-Tract-Identifikationsnummer
(n k =100)
DISTRICT
Stadtbezirk
N l = 12
ONE
Vektor mit Einsen (für die Regressionskonstante in MIXOR und
als Pseudo-Level-3 Variable in HLM)
Tab. 2: Übersicht der zentralen abhängigen Variablen und der zugehörigen Fragen
Variable:
Bedeutung / Indexbildung /Fragetext
PERCRISK
Perceived Crime Risk: Allgemeines Sicherheitsgefühl in der eigenen Nachbarschaft
„Q77:
Do you think your neighborhood is very safe,
somewhat safe, somewhat unsafe or very unsafe form
crime and criminals ?“
1) very safe (sehr sicher)
2) somewhat safe (ziemlich sicher)
3) somewhat unsafe (ziemlich unsicher)
4) very unsafe (sehr unsicher)
9) Keine Angabe
1
Den Originaldatensatz von Miethe kann der Leser über das Inter-University-Consortium
of Political and Social Science Research, Ann Arbor, unter der folgenden Internetadresse direkt
online beziehen: url: http://www.icpsr.umich.edu (ICPSR Study No. 9741)
WiSe 2001/2002
20
Variable:
FEARPATT
Furcht vor Gewaltgewaltkriminalität:
„Q166: How often do you worry or think about physically attacked
by a stranger? Would you say you worry or think about
this ....“
1) Weniger als einmal im Monat
2) Einmal im Monat
3) Jede Woche
4) Täglich
9) Keine Angabe
FEARBURG
Furcht vor Einbruchskriminalität:
„Q167: How about someone breaking into your home and stealing
your property? Would you say worry or think about this
...“
1) Weniger als einmal im Monat
2) Einmal im Monat
3) Jede Woche
4) Täglich
9) Keine Angabe
FEARWALK
Furcht vor „einsamen nächtlichem Spaziergang“:
„Q77:
Is there any place - within 3 blocks of your current home where you are afraid to walk alone a night ?“
0) Nein
1) Ja
9) Keine Angabe
WiSe 2001/2002
21
Variable:
DVICBURG
Viktimisierung durch (versuchten) Einbruch innerhalb der letzten 2
Jahre:
„The first set of questions involve your personal experience with
different kinds of crime:
Q13:
Q16:
Q23:
Q26:
First of all, has anyone ever broken into or illegally entered
your home, garage, or other building on your property ? ...
Has this happened within the last two years ? ...
(Other than the incident justed mentioned), have you ever
found a door jimmied, a lock forced, or any other signs of
an attempted break-in into your home ? ...
Has this happened within the last two years ?“
0) Kein Einbruchsopfer
1) Ja, Einbruchsopfer
9) Keine Angabe
DVICVIOL
Viktimisierung durch Gewaltkriminalität (Raub, Körperverletzung,
Taschendiebstahl) maximal 4 Blocks von der eigenen Wohnung
entfernt innerhalb der letzten 2 Jahre
„Q34:
Q36:
Q45:
Q48:
Q50:
Q56:
Have you ever been physically attacked, beaten up, or
threatend by a stranger ?...
Has this happened within the last two years ?...
Did (this attack) / (the last attack) occur within 4 blocks of
your current home ? ...
Have you ever had your (pocked picket) / (purse snatched)
or something stolen from you by force (stick-up mugging)
when in a public place ? ...
Has this happened within the last two years ? ...
Did (this act) / (the last theft) occure within 4 blocks of
your current home ?“
0) Kein Gewaltopfer
1) Ja, Gewaltopfer
9) Keine Angabe
WiSe 2001/2002
22
Tab. 3: Übersicht der unabhängigen Variablen und der zugehörigen Fragen
Variable:
Sozio-demographische Variablen:
ALTER
Alter in Dezimaljahren:
„Q171: What year were you born?“
AGEGR
Altersgruppenbildung von Miethe:
1)
2)
3)
4)
5)
6)
7)
9)
17-19
20-29
30-39
40-49
50-59
60-69
70 und älter
Fehlende Angabe
Geschlecht des Befragte:
FRAU
MANN
Frau (1) vs. Mann (0)
Mann (1) vs. Frau (0)
MINORITY
Minoritätenstatus:
„Do you consider yourself to be White, Black, Asian, American
Indian / Eskimo, Hispanic or Some other ethnic / racial group ?“
0) Weiße(r)
1) Minoritätenangehöriger (Farbige, Mexikaner, sonstige)
9) keine Angabe
WiSe 2001/2002
23
Variable:
INCOME
Haushaltsnettoeinkommensklasse:
„Q215: Which of the following broad categories best represents
your total family income before taxes 1989 ? Please stop
me when I mention the category that applies to you. Would
your total income from all sources be ...“
1) less than $ 10.000
2) $ 10.000 to $ 20.000
3) $ 20.000 to $ 30.000
4) $ 30.000 to $ 50.000
5) $ 50.000 to $ 75.000
6) $ 75.000 to $ 100.000
7) Over $ 100.000
9) Keine Angabe
LIVEALONE
Alleinstehend lebend:
„Q175: Counting yourself, how many people are currently living
in your (house) / (appartment) / (home) ?“
0) Mehr als 1 Person
1) Alleinstehend
9) Keine Angabe
DANGACT
Dangerous Public Activities: Summenindex [0;3] für Bejahung
„Q103: During the LAST WEEK, did you visit a bar or night-club
that serves alcohol ?...
Q104: During the LAST WEEK, were you in a public place where groups of teenagers or young adults hanging out in the
street ? ...
Q107: Do you ever take a city bus or other forms of public
transportation ? ...“
1) YES
CARRYVAL
2) No
3) Don‘t know/Refused
Carry Valuables in Public: Summenindex [0;16]
„Q164: During the last month, about how many times did you carry at least $50 cash in your (wallet) / (purse) while in a
public place ?
Q165: During the last month, about how many times dit you wear
jewelry (like a watch, ring or necklace) worth more than
$100 when in a public place ?“
WiSe 2001/2002
24
Variable:
SAFEPREC
Safety Precautions: Summenindex der vor 2 Jahren bereits ergriffen
Sicherheitsmaßnahmen [0;9]
„Q109: People protect themselves from crime in many different
ways. I am going to name some types of self-protection.
Please tell me if you take this precaution now or did this -TWO YEARS AGO -- by saying YES or NO .
Q110: Do you currently lock doors whenever you leave home ?
Q111: Did you lock your doors TWO YEARS AGO ?
Q112: Do you currently leave lights on when you‘re not at home?
Q113: Did you leave lights on TWO YEARS AGO ?
Q114: Do you currently belong to a community crime prevention
program (like neighborhood/block watch program)?
Q115: Did you belong to this program TWO YEARS AGO ?
Q116: Do you currently have extra locks installed on doors or
windows?
Q117: Did you have extra locks TWO YEARS AGO ?
Q118: Do you currently carry a weapon for protection when in
public? (IF ASKED: A weapon such as a gun, knife, mace,
etc.)
Q119: Did you carry a weapon for protection TWO YEARS
AGO?
Q120: Do you currently have a burglar alarm or some other electronic device to protect your home from criminals?
Q121: Did you have an alarm like this TWO YEARS AGO ?
Q122: Do you currently have a dog at your home ?
Q123: Did you have a dog TWO YEARS AGO ?
Q124: Do you currently have neighbors watch your home when
you‘re out of town ?
Q125: Did you have neighbors watch your home TWO YEARS
AGO ?
Q126: Do you currently have a weapon in your home for protection?
Q127: Did you have a weapon TWO YEARS AGO ?“
1) YES
2) NO 3) Don‘t know/refused
WiSe 2001/2002
Variable:
EXPGOODS
Expensive Consumer Goods: Summenindex [0;5]
25
„Q156-160: Do you own any of the following expensive consumer
items that are commonly stolen by burglars ? Do you
own ....
ASSESS
156:
157:
158:
159:
160:
A portable color TV ?
A video cassette recorder (VCR) ?
A 35mm camera ?
A home computer ?
A bicycle or motorbicycle ?“
1)
YES
2) NO
3) Don‘t know/Refused
Assess Routes: Summenindex der bejahten Einbruchsmöglichkeiten
[0;2]
„Q130: Some people are more likely to be crime victims because
criminals view them as „easy targets.“ Here are several
questions about your personal habits and property which
might influence your chances of being a crime victim.
Q134:
Q141:
1)
GBARRIER
First, does your (house) / (apartment) / (home) have
ground floor windows?
Is there an alley behind your home ?“
YES
2) NO
3) Don‘t know/ Refused
Guardianship Barriers: Anzahl der Sicherheitsdefizite des Hauses /
Wohnung: Summenindex der Bejahungen [0;2]
„Q135: Is there a tall fence or hedge (over 5 feet) around your
dwelling ?“
Q136: Is there a vacant lot or empty house next to your home?“
1)
CORNER
YES
2) NO
Eckgrundstück vs. Blockseitenmitte
„Q140: Is your (house) / (apartment) / (home) on a street corner?“
1)
YES
2) NO
WiSe 2001/2002
Variable:
BUSYPLAC
Busy Plubic Places within three blocks of the resident‘s
home.attracting strangers. Summenindex der Bejahungen [0;9]
26
„Are any of the following places within 3 blocks of your home ?
INCIVILI
67.
68.
69.
70.
71.
72.
73.
74.
75.
High school or Junior high
Convenience store / gas station
Bar or nightclub that serves alcohol
Fast food restaurant
Bank or office building
Park or play ground
Shopping center / mall
Hotel / motel
Bus stop“
1)
YES
2) NO
Perceived Neighborhood Decay / Deterioratuib (Signs of Incivility
in the neighborhood) Summenindex der Bejahungen [0;5]
„Do you have any of these problems within 3 blocks of your home?
92.
93.
94.
95.
96.
Groups of teenagers hanging around the street
Litter / garbage / trash on the street
Abandoned houses and run-down building
Poor street lighting at night
Vandalism like broken windows, writing on the walls“
1)
YES
2) NO
WiSe 2001/2002
27
Variable:
INTEGRAT
Perceived Neighborhood Social Integration. Summenindex der Bejahungen [0;6}
„Q79:
Q80:
Can you easily tell if a person is a stranger or resident on
your city block ? NOTE: WANT TO KNOW IF RESPONDENT CAN RECOGNIZE STRANGERS AROUND
THEIR HOME.
Do you have any good friends or relatives who are neighbors on your block ?
...
Have you done any of the following activities with your current
neighbors, have you ....
Q82:
Q83:
Q84:
Q85:
1)
Q100
Watched your neighbor‘s property when they are out of
town?
Borrowed tools or small food items (e.g. milk, sugar) from
your neighbors ?
Had dinner or lunch with a neighbor ?
Helped a neighbor with a problem ?“
YES
2) NO
Gelegenheitshäufigkeit für Einbruch
„Q100: How many EVENINGS LAST WEEK was your home
unoccupied for some time at night? (IF ASKED, HOW
LONG, SAY:) unoccupied for 2 hours or more ?“
0) keine Nacht ...... 7) jede Nacht
Q155
9) Keine Angabe
Subjektive Einschätzung der eigenen Verteidigungsfähigkeit bei
einem tätlichen Angriff
„Q155: Do you think you could physically defend yourself or ward
off an attack from another person ?“
1) YES 2) NO
9) Keine Angabe
WiSe 2001/2002
28
Tab. 4: Übersicht der durch Aggregation gewonnenen Kontextmerkmale der Nachbarschaft:
Variable:
NETHHET
Ethnische Heterogenität der Nachbarschaft: [0; 0,25]
Anteilswert Minority * (1 - Anteilswert Minority)
Minimum: 0,0
PNETHHET
Maximum: 0,25
Ethnische Heterogenität der Nachbarschaft transformiert:[0;25]
PNETHHET = NETHHET*100
Minimum: 0,0
PMINORI
Prozentsatz ethnischer Minoritäten in der Nachbarschaft:
Minimum: 0,00 %
MINCIVIL
Maximum: 7,24
Nachbarschaft: Mittlere Einkommensklasse. Indikator für Soziale
Segregation der Nachbarschaft:
Minimum: 1,33
MSAFEPRE
Maximum: 5,30
Nachbarschaftsmittelwert Busy Public Places. Indikator für „Soziale Dichte“
Minimum: 0,82
MINCOME
Maximum: 3,33
Nachbarschaftsmittelwert der „Sozialen Integration / Informelle
Soziale Kontrolle“:
Minimum: 1,44
MBUSYPLA
Maximum: 93,33 %
Nachbarschaftsmittelwert der „Zeichen des Verfalls“
Minimum: 0,00
MNINTEGR
Maximum: 25,0
Maximum: 5,31
Nachbarschaft: Mittelwert der vor 2 Jahren bereits ergriffenen Sicherheitsmaßnahmen
Minimum: 2,17
Maximum: 5,50
WiSe 2001/2002
29
Variable:
PVICBURG
Prozentsatz Befragter in der Nachbarschaft, die in den letzten 2 Jahren Opfer eines Einbruchs (-versuchs) geworden sind. (Property
Crime Proximity)
Minimum: 0,00 %
PVICVIOL
Prozentsatz Befragter in der Nachbarschaft, die in den letzten 2 Jahren Opfer eines Raubs, Körperverletzung geworden sind.
(Violent Crime Proximity)
Minimum: 0,00 %
PVICION
Maximum: 55,56 %
Maximum: 35,71 %
Prozentsatz Befragter, die Opfer einer Straftat in der eigenen Nachbarschaft in den letzten 2 Jahren geworden sind
(General Crime Proximity)
Minimum: 11,11%
Maximum: 100,00%
3.2 Makrosoziale Erklärungsfaktoren der Viktimisierung auf der Census-TractEbene
Für die 3. Ebene der Census Tracts enthält die SPSS-Datendatei „S9741CEN.SAV“ die folgenden makrosozialen Indikatoren zur Kriminalitätsbelastung, Desorganisation und Haushaltsgröße, die Miethe und seine Projektgruppe dem „Uniform Crime Report“ sowie den Volkszählungen von 1960, 1970 und 1980 entnommen haben. Über die Kennung der Volkszählungsbezirke „TRACTID“ lassen sich diese sozialökologischen Daten an die eigentliche Viktimisierungsstudie für die 100 seit 1960 unveränderten Zählbezirke ankoppeln.
Name
Position
YEAR
Zenusjahr
Measurement Level: Scale
Column Width: 8 Alignment: Right
Print Format: F2
Write Format: F2
1
TRACTID
Zenus-Tract-Nr.
Print Format: F3
Write Format: F3
2
HOMRAT60
Mordrate pro 100.000 1960
Print Format: F10.3
Write Format: F10.3
3
RAPRAT60
Vergewaltigungsrate pro 100.000 1960
Print Format: F10.3
Write Format: F10.3
4
WiSe 2001/2002
30
ROBRAT60
Raubrate pro 100.000 1960
Print Format: F10.3
Write Format: F10.3
5
ASSRAT60
Körperverletzungsrate pro 100.000 1960
Print Format: F10.3
Write Format: F10.3
6
BURRAT60
Einbruchsrate pro 100.000 1960
Print Format: F10.3
Write Format: F10.3
7
CARRAT60
Autodiebstahlsrate pro 100.000 1960
Print Format: F10.3
Write Format: F10.3
8
RHETER60
Rassische/ethnische Hetereogentität 1960
Print Format: F7.4
Write Format: F7.4
9
PUNEMP60
Arbeitslosenanteil in % 1960
Print Format: F7.3
Write Format: F7.3
10
POCROW60
Anteil überbelegter Wohnungen 1960
Print Format: F6.2
Write Format: F6.2
11
PPUBTR60
Anteil der Berufspendler mit ÖPNV 1960
Print Format: F6.2
Write Format: F6.2
12
PFEMAL60
Frauenanteil der Beschäftigten 1960
Print Format: F9.3
Write Format: F9.3
13
MEDFIN60
Mittlere Familieneinkommen 1960
Print Format: F9.2
Write Format: F9.2
14
POPPH60
Durchschnittliche Haushaltsgrösse 1960
Print Format: F9.3
Write Format: F9.3
15
PMOVE60
Anteil der zugezogenen Personen älter als 5 Jahre 1960
Print Format: F9.3
Write Format: F9.3
16
PKIDPA60
Anteil der Kinder unter 18 Jahren mit beiden Elternteilen 19
17
WiSe 2001/2002
31
Print Format: F9.3
Write Format: F9.3
HOMRAT70
Print Format: F10.3
Write Format: F10.3
18
RAPRAT70
Print Format: F10.3
Write Format: F10.3
19
ROBRAT70
Print Format: F10.3
Write Format: F10.3
20
ASSRAT70
Print Format: F10.3
Write Format: F10.3
21
BURRAT70
Print Format: F10.3
Write Format: F10.3
22
CARRAT70
Print Format: F10.3
Write Format: F10.3
23
RHETER70
Print Format: F7.4
Write Format: F7.4
24
PUNEMP70
Print Format: F7.3
Write Format: F7.3
25
POCROW70
Print Format: F6.2
Write Format: F6.2
26
PPUBTR70
Print Format: F6.2
Write Format: F6.2
27
PFEMAL70
Print Format: F9.3
Write Format: F9.3
28
MEDFIN70
Print Format: F9.2
29
WiSe 2001/2002
32
Write Format: F9.2
POPPH70
Print Format: F9.3
Write Format: F9.3
30
PMOVE70
Print Format: F9.3
Write Format: F9.3
31
PKIDPA70
Print Format: F9.3
Write Format: F9.3
32
HOMRAT80
Print Format: F10.3
Write Format: F10.3
33
RAPRAT80
Print Format: F10.3
Write Format: F10.3
34
ROBRAT80
Print Format: F10.3
Write Format: F10.3
35
ASSRAT80
Print Format: F10.3
Write Format: F10.3
36
BURRAT80
Print Format: F10.3
Write Format: F10.3
37
CARRAT80
Print Format: F10.3
Write Format: F10.3
38
RHETER80
Print Format: F7.4
Write Format: F7.4
39
PUNEMP80
Print Format: F7.3
Write Format: F7.3
40
POCROW80
Print Format: F6.2
Write Format: F6.2
41
WiSe 2001/2002
33
PPUBTR80
Print Format: F6.2
Write Format: F6.2
42
PFEMAL80
Print Format: F9.3
Write Format: F9.3
43
MEDFIN80
Print Format: F9.2
Write Format: F9.2
44
POPPH80
Print Format: F9.3
Write Format: F9.3
45
PMOVE80
Print Format: F9.3
Write Format: F9.3
46
PKIDPA80
Print Format: F9.3
Write Format: F9.3
47
HOMR8070
Diff.Mordrate 80 vs. 70
Print Format: F8.2
Write Format: F8.2
48
RAPR8070
Diff. Vergewaltigungsrate 80 vs. 70
Print Format: F8.2
Write Format: F8.2
49
ROBR8070
Diff. Raubrate 80 vs. 70
Print Format: F8.2
Write Format: F8.2
50
ASSR8070
Diff. Körperverletzungssrate 80 vs. 70
Print Format: F8.2
Write Format: F8.2
51
BURR8070
Diff. Einbruchsrate 80 vs. 70
Print Format: F8.2
Write Format: F8.2
52
CARR8070
Diff. Autodiebstahlsrate 80 vs. 70
Print Format: F8.2
Write Format: F8.2
53
RACE8070
Diff. ethnische Hetereogenität 80 vs. 70
54
WiSe 2001/2002
34
Print Format: F8.2
Write Format: F8.2
ALO8070
Diff. Arbeitslosenanteil 80 vs. 70
Print Format: F8.2
Write Format: F8.2
55
POVC8070
Diff. Anteil überbelegter Wohnungen 80 vs. 70
Print Format: F8.2
Write Format: F8.2
56
PPUB8070
Diff. Anteil der Berufspendler mit ÖPNV 80 vs.70
Print Format: F8.2
Write Format: F8.2
57
PFEM8070
Diff. Frauenanteil der Beschäftigten 80 vs. 70
Print Format: F8.2
Write Format: F8.2
58
MFIN8070
Diff. Mittlere Familien-/Haushaltseinkommen 80 vs. 70
Print Format: F8.2
Write Format: F8.2
59
PPHH8070
Diff. durchschnittliche Haushaltsgrösse 80 vs. 70
Print Format: F8.2
Write Format: F8.2
60
MOVE8070
Diff. Anteil der zugezogenen Personen 80 vs. 70
Print Format: F8.2
Write Format: F8.2
61
PKID8070
Diff. Anteil der Kinder aus vollständigen Familien 80 vs. 70
Print Format: F8.2
Write Format: F8.2
62
WiSe 2001/2002
35
4. Die statistischen Grundlagen „Hierarchischer Verallgemeinerter Linearer
Modelle“ am Beispiel der binären logistischen Regression für Individualdaten
Beim Programm HLM for Windows 5,04 handelt es sich um eine Weiterentwicklung der DOSExtender-Versionen HLM 2 und 3, welche nun über eine graphische Bedienungsoberfläche
verfügt. Mit diesem Programm lassen sich Mehrebenenmodelle für Kriteriumsvariablen mit
metrischen, ordinalen und nominalen Meßniveau sowie für Zählvariablen schätzen, die bis zu
drei Analyseebenen berücksichtigen.2
Bryk & Raudenbush (2000) integrieren nichtlineare Regressionsmodelle der ersten Ebene als
„verallgemeinerte lineare Modelle“ im Sinne McCullagh&Nelder (1989), die über eine spezifische Fehlerstruktur und eine eigene „Link“- oder Verknüpfungsfunktion verfügen.
„Within HLM, the user can specify a nonlinear analysis appropriate for counts and binary,
multinomial, or ordinal data. The approach is a direct extension of the generalized linear model
of McCullagh & Nelder (1998) to the case of hierarchical data. We, therefore, refer to this
approach as a „hierarchical generalized linear model“ (HGLM).“ (Raudenbush, Bryk, Cheong&Congdon 2000, S. 113)
Byrk &Raudenbush realisieren die binäre logistische Regression für Individualdaten im Rahmen
des Bernoulli-Modell. Bei ihm handelt es sich um ein nichtlineares Wahrscheinlichkeitsmodell,
das den linearen Prädiktor mit Hilfe der logistischen Verteilungsfunktion als „link-function“ mit
der diskreten Kriteriumsvariable verbindet. Es stellt einen Sonderfall des allgemeinen Binomialmodells dar, wobei die Größe betrachteten Subpopulation bzw. die Anzahl der Versuche jeweils
Eins ist. Als abhängige Variable verwendet das Bernoullimodell das Logit als logarithmisches
Verhältnis der Wahl- und Komplementärwahrscheinlichkeiten, wobei es sich in unserem Fall
um das Logit der Wahrscheinlichkeit handelt, Opfer eines Gewaltdelikts zu werden. Seine
Vorhersagefehler innerhalb der Kontexte folgen der Binomialverteilung, wobei sie der geschätzten Varianz der Anteilswerte oder Wahlwahrscheinlichkeiten im Kontext j entsprechen.
Deshalb sind die Vorhersagefehler innerhalb der Kontexteinheiten nicht mehr homoskedastisch,
sondern ihre Varianz hängt unmittelbar von der für den Kontext j geschätzten Wahlwahrscheinlichkeit ab. Das heißt, dass wir für jede Level-2-Einheit eine eigene Fehlervarianz
erhalten, die umso stärker über die Kontexte hinweg variiert, je mehr die geschätzte Wahrscheinlichkeit selbst über die Kontexte schwankt. Daher läßt sich die Residualvarianz der ersten
2
Als Programmalternativen zur Schätzung „Verallgemeinerter Hierarchisch Linearer
Modelle“ stehen uns das von Rasbash, Browne, Goldstein, Yang, Plewis, Healy, Woodhouse,
Draper, Langford&Lewis (2000) entwickelte kommerzielle Programm MLWin 1.1 sowie das
Freeware-Statistikpaket Random-Regression-Models (RRM) von Hedecker&Gibbons (1996,
1999) zur Verfügung. Während ersteres bis zu fünf Analyseebenen theoretisch berücksichtigen
kann, beschränkt sich letzteres auf ein 2-Ebenenmodell. Der Vorteil der von Hedecker&Gibbons
(1996) entwickelten und im Programm MIXOR implementierten Maximum-MarginalLikelihood-Methode besteht darin, dass sie eine effiziente Schätzung der Log-Likelihood bzw.
Deviance sowohl des Null- also auch des Alternativmodells erlaubt. Hierdurch können wir den
Likelihood-Ratio-χ2-Test simultan für die geschätzten Fixed- und Random-Effects durchführen
und diverse Pseude-R2e für die Bestimmung der „praktischen Signifikanz“ berechnen.
WiSe 2001/2002
36
Ebene im Gegensatz zum klassischen Mehrebenenmodell für metrische Kriteriumsvariablen
nicht mehr als einen einzigen Skalar schätzen. Für die zugehörigen Zwischen-Kontext- und
Binnen-Kontext-Regressionen benötigen wir das folgende Gleichungssystem, wobei wir die
logistischen Regressionsparameter mit einem „β“ bezeichnen.
Die Gleichungen des Logistischen&Mehrebenenmodells
der späten 90 er Jahre :
Level / Ebene 2: Between&Context&Regression
2a) Intercept&as&Outcome&Model:
β0j ' γ00 % γ01 ( Z.j % u0j
2b) Slope&as&Outcome&Model:
β1j ' γ10 % γ11 ( Z.j % u1j
Level / Ebene 1: Within&Context Regression
1) ln
P ( Yij ' 1 )
1& P ( Yij ' 1 )
' β0j % β1j ( Xij % eij
Legende:
Yij: Diskrete Kriteriumsvariable Y [ 1 oder 0 ]
γ00 : Regressionskonstante der linearen Modells zur Vorhersage der
kontextspezifischen logistischen Regressionskonstanten β0j
γ01 : Linearer Steigungskoeffizient des Kontextmerkmals Z bei der
Vorhersage der kontextspezifischen logistischen Regressionskonstanten β0j
Z.j : Kontextmerkmal Z der Gruppe j
u0j : Residuum des Kontextes j bei der Vorhersage seiner
logistischen Regressionskonstanten β0j
γ10 : Regressionskonstante der linearen Modells zur Vorhersage der
kontextspezifischen logistischen Steigung β1j
γ11 : Linearer Steigungskoeffizient des Kontextmerkmals Z bei der
Vorhersage der kontextspezifischen logistischen Steigung β1j
u1j : Residuum des Kontextes j bei der Vorhersage seiner logistischen
Steigung β1j
β0j : Logistische Regressionskonstante des Kontextes j
β1j : Logistischer Regressionskoeffizient des Kontextes j für das Merkmal Xij
Xij: Exogenes Individualmerkmal X der Person i im Kontext j
eij: Binomial&verteiltes Residuum der Vorhersage von Yij im Kontext j
WiSe 2001/2002
37
Die „Empirical-Bayes“-Residuen der Kontexteinheiten j ermitteln wir, indem wir die Gleichungen 2a) und 2b) nach u0j bzw. u1j auflösen. Bei ihnen handelt es sich jeweils um das
Residuum der Vorhersage der kontextspezifischen logistischen Regressionskonstanten oder
Steigung auf der Basis der betrachteten Kontextmerkmale Z.j.
Interpretation der Residuen des logistischen Between&Context&
Regressionsmodells ( Level 2 ):
3a) u0j ' β0j & [ γ00% γ01 ( Z . j ] ' β0j & β̂0j
3b) u1j ' β1j & [ γ10% γ11 ( Z . j ] ' β1j & β̂1j
Wenn wir die beiden Schätzgleichungen der zweiten Ebene in diejenige der ersten Ebene
einsetzen, erhalten wir das folgende Eingleichungsmodell der logistischen Regressionsanalyse:
Die Eingleichungsvariante des Logistischen Mehrebenenmodells
Einsetzen von Gleichung 3 a und 3 b in Gleichung 1:
4) ln
P ( Yij ' 1 )
1& P ( Yij ' 1 )
' [ γ00 % γ01 ( Z.j % u0j ] % [ γ10 % γ11 ( Z.j % u1j ] ( Xij % eij
'
γ00
% γ01 ( Z.j
% γ10 ( Xij
% γ11 ( Z.j ( Xij
% u1j ( Xij
% u0j
% eij
||
||
||
||
|
||
|
||
|
||
||
||
||
||
||
|
||
|
||
|
||
|
||
|
||
|
Fixed Effects:
Logistische Regressionskonstante
Logistischer Effekt des Kontextmerkmals Z
Logistischer Effekt des Individualmerkmals X
Logistischer Effekt der Cross&Level&
Interaction von Z und X
Random&Effects:
Heteroskedastizität des Residuums der
logistischen Steigung β1 im Kontext j ( Level 2 )
Residuum der logistischen Regressions&
konstante β0 im Kontext j ( Level 2 )
Residuum von Y ij der Personi im Kontext j
( Level 1 )
Für die Residuen der Binnen- und Zwischen-Kontext-Regressionen des Logistischen Mehrebenenmodells gelten die folgenden Annahmen. Bryk&Raudenbush (1992, S. 20) bezeichnen
die Kovarianzmatrix der Level-2-Residuen mit dem griechischen Großbuchstaben TAU („Τ“)
und ihre Elemente mit dem zugehörigen Kleinbuchstaben tau („τ“). Hingegen verwendet
WiSe 2001/2002
38
Goldstein (1999) hierfür den griechischen Großbuchstaben OMEGA („Ω“). Da sich die hier
verwendete Notation an derjenigen von Busing, Meijer & van der Leeden (1994) orientiert,
behalten wir die Bezeichnungen u0j und u1j für die Residuen der zweiten Ebene sowie deren für
den deren Kovarianzmatrix THETA („Θ“) bei.
Annahmen für die Fehlerterme des Logistischen Mehrebenenmodells
auf der Basis von Individualdaten:
Level / Ebene 1:
1.1) eij ist binomialverteilt mit einem Erwartungswert von Null und
1
einer Varianz σ2e '
ij
P j ( Y ' 1 ) ( ( 1 & Pj ( Y ' 1 ) )
1.2) Vorliegen der Heteroskedastizität von eij in allen Kontexten j
Level / Ebene 2:
2.1) ukj ist normalverteilt mit einem Erwartungswert von Null und der
Kovarianzmatriz ( Θ ) der Residuen:
E
u0j
u1j
'
0
0
Var
u0j
u1j
'
τ00 τ01
τ10 τ11
(u (u ) (u (u )
' ( u0j ( u0j ) ( u0j ( u1j ) ' Τ ' Ω ' Θ
1j
0j
1j
1j
Var ( u0j ) ' τ00 ' u0j ( u0j
Var ( u1j ) ' τ11 ' u1j ( u1j
Cov ( u0j , u1j ) ' τ10 ' τ01 ' u0j ( u1j ' u1j ( u0j
2.2) Die Residuen der 2. Ebene korrelieren nicht mit denjenigen der
1.Ebene:
Cov ( u0j , eij ) ' Cov ( u1j , eij ) ' 0
Raudenbush, Bryk, Cheong&Congdon (2000, S. 122f.) weisen ausdrücklich daraufhin, dass sie
als Schätzverfahren die „Penalized-Quasi-likelihood“ (PQL)-Methode verwenden, bei der es
sich um eine numerische Approximation der Maximum-Likelihood-Schätzung handelt.3 Hierbei
schätzen sie die „fixed effects“ mit Hilfe des „Iterative Generalized-Least-Squares“ Verfahrens
(IGLS), während sie die Varianzkomponenten mit Hilfe der Maximum-Likelihood-Schätzung
ermitteln. Bei diesem Verfahren handelt es sich daher um eine Variante der „Restricted
Maximum-Likelihood-Methode (REML), die HLM 5 standardmäßig für HierarchischVerallgemeinerte-Lineare-Regressionsmodelle verwendet. Der in der Mehrebenenanalyse
gebräuchliche Maximum-Likelihood-χ2-Test beschränkt sich deshalb allein auf die Veränderung
der Varianzkomponenten zweier hierarchisch ineinander geschachtelter Modelle.
3
Zur genauen Vorgehensweise der PQL-Methode: S. Raudenbush&Bryk (2002, S.457f.)
WiSe 2001/2002
39
„Using PQL, HGLM produces approxiamte empirical Bayes estimates of the randomly-varying
level-1 coefficients, generalized least quares estimators of the level-2 (and level-3) coefficients,
and approximate restricted maximum-likelihood estimators of the variance and covariance
parameters. ... For two-level Bernoulli models, HGLM provides an alternative to estimation via
PQL. The alternative uses a sixth order approximation to the likelihood based on a Laplace
transform and is therefore called „Laplace6.“ Simulations by Yang (1998) and Raudenbush,
Yang, & Yosef (in press) show that this approach produced remarkably accurate approximation
to maximum likelihood (ML), and therefore provides efficient (or nearly efficient) estimates of
all parameters.“ (Raudenbush, Bryk, Cheong & Congdon 2000, S. 127f.)
Das Laplace6-Schätzverfahren liefert nach Angaben der Autoren eine bemerkenswerte gute
Approximation an die Maximum-Likelihood-Schätzung der Populationsschätzer und Varianzkomponenten im 2-Ebenen-Modell. Im Vergleich zum „Penzalized-Quasi-Likelihood“-Verfahren verfügen sie über deutlich niedrigere Standardfehler. Diese Verfahren steht aber nur für
binäre logistische Regressionsmodelle im 2-Ebenen-Ansatz zur Verfügung.
Im Rahmen ihrer Restricted-Maximum-Likelihood-Schätzung verwenden Raudenbush et.al.
(2000) den Kehrwert der Residualvarianz der ersten Analyseebene als Gewichtungsfaktor für die
Generalized-Least-Squares-Schätzung der logistischen Regressionsmodelle innerhalb der
einzelnen Kontexte. Sie normieren die Residualvarianz der kontextspezifischen Logits auf den
Wert 1/ (Pj*(1- Pj)). Darüber hinaus bietet HLM 5 die Möglichkeit, die Ober- und Unterdispersion der Residualvarianz innerhalb der Kontexteinheiten zu schätzen. Dies empfiehlt sich aber nur
dann, wenn wir berechtigte Annahmen haben, dass die hierarchische Datenstruktur bei der
Modellspezifikation nicht adäquat berücksichtigt wird. Dies ist beispielsweise der Fall, wenn
wir zwar Personen in ihrer Nachbarschaft ihres Stadtteils befragt haben, wir aber bei der eigentlichen Mehrebenenanalyse die mittlere Ebene der Nachbarschaften ignorieren.4 Den hieraus
resultierenden durchschnittlichen „Fehlerzuschlag“ für die Residuen der ersten Ebene können
wir im Rahmen des extra-binomialen Modells schätzen. Im folgenden stellen wir sie formelmäßig der Residualvarianz der logistischen Regression ohne Überdispersion gegenüber:
4
S. Goldstein (1999, chapter 7, p.2)
WiSe 2001/2002
40
Fehlervarianzen der kontextspezifischen logistischen Regressionsmodelle
ohne und mit Überdispersion für Individualdaten:
Fehlervarianz des einfachen Binomialmodells:
σ2e '
ij
1
P̂ j ( (1 & P̂ j )
Fehlervarianz des extra&binomialen Modells:
σ2e '
ij
σ2 r
P̂ j ( (1 & P̂ j )
Legende:
σ2e : Residualvarianz der logistischen Regression im Kontext j
ij
P̂ j : Geschätzte Wahrscheinlichkeit von Y ' 1 im Kontext j
σ2 r: Geschätzte Varianz des Überdispersionfaktors
„However, if the level-1 data do not follow this model, the actual level-1 variance may be larger
than that assumed (over-dispersion) or smaller than that assumed (under-dispersion). For
example, if undetected clustering exists within level-1 units or if the level-1 model is underspecified, extra-binomial or extra Poisson dispersion may arise. This problem can be handled
in a variety of ways; HGLM allows estimation of a scalar variance so that the level-1 variance
will be σ2.“ (Raudenbush et.al. 2001, S. 131)
Raudenbush et. al. (2000) unterscheiden bei der Schätzung Hierarchischer Verallgemeinerter
Linearer Modelle zwischen der kontextspezifischen („Unit-specific model“) und der eigentlichen Populationsschätzung („Population-average model“). Ersteres dient zur Vorhersage der
Wahrscheinlichkeit, dass die betrachtete diskrete Kriteriumsvariable in einem spezifischen
Kontext den Wert Eins annimmt, während letzteres zur kontextübergreifenden Populationsschätzung dient. Die Unterschiede beider Modelle zeichnen sich deutlich ab, wenn wir die zugehörigen Prognosegleichungen betrachten. Hierzu setzen wir den jeweiligen „linearen Prädiktor“ in die Gleichung der logistischen Verteilungsfunktion ein. Im Falle des „Unit-specific
model“ ermitteln wir die für eine spezifische Befragtengruppe im Kontext j geschätzte Wahlwahrscheinlichkeit, indem wir neben den exogenen Invidiudal- und Kontextmerkmalen, deren
Wechselwirkung und die „Empirical Bayes-Residuen“ der kontextspezifischen Effekte in die
Prognosegleichung einsetzen:
WiSe 2001/2002
41
Prognosegleichung des unit&specific&Logit&Mehrebenenmodells:
e
P( Y ' 1 | Xij , Z.j , Xij ( Z.j , u1j , u0j ) '
'
(γ00 % γ01 ( Z.j % γ10 ( Xij % γ11 ( Z.j ( Xij % u1j ( Xij % u0j )
1%e
(γ00 % γ01 ( Z.j % γ10 ( Xij % γ11 ( Z.j ( Xij % u1j ( Xij % u1j )
1
1%e
& (γ00 % γ01 ( Z.j % γ10 ( Xij % γ11 ( Z.j ( Xij % u1j ( Xij % u0j )
Raudenbush et.al. (2000) veranschaulichen die Interpretation der Logitschätzer im „unitspecific-model“ für den einfacheren Fall eines Modell ohne eine Wechselwirkung zwischen den
Ebenen („cross-level-interaction“):
„In this model, γ10 is the expected difference in the log-odds of „success“ between two students
who differ by one unit on X (holding Wj and u0 j constant); γ 01 is the expected difference in the
log-odds of success between two students who have the same value on X but attend schools
differing by one unit on W (holding u0 j) constant).“ (A.a.O., S. 129)
Interessieren wir uns weniger für die Prognosen auf der Ebene spezifischer Level-2 Einheiten
sondern vor allem für die Schätzung der Grundgesamtparameter, so benötigen wir das
„Population-average-model“. Letzteres beruht zwar auf den geschätzten „fixed“- und „randomeffects“ des kontextspezifischen Logitmodells, es betrachtet aber die Effekte der Kontextmerkmale unter der Annahme der durchschnittlichen kontextspezifischen Abweichung der geschätzten „random-effects“ u0 j und u1 j. Unter der Annahme, dass die kontextspezifischen
Logitschätzer normalverteilt sind, ist zwar der theoretische Erwartungswert der Varianzkomponenten von u0 j und u1j jeweils Null. Da aber die empirischen Mittelwerte der geschätzten
„random-effects“ u0 j und u1j oftmals von Null verschieden sind, berücksichtigt die Prognosegleichung des „Population-average Model“ ihre kontextspezifischen Residuen als Mittelwerte der
u-Terme.5
rognosegleichung des Population&average&Logit&Mehrebenenmodells :
(
( Y ' 1 | Xij , Z.j , Xij ( Z.j , [ u0j , u1j ]) '
(
(
(
(γ00 % γ01 ( Z.j % γ10 ( Xij % γ11 ( Z.j ( Xij [ % u1j ( Xij % u0j ] )
1%e
(
(
(
1%e
& (γ(00 % γ(01 ( Z.j % γ(10 ( Xij % γ(11 ( Z.j ( Xij [ % u1j ( Xij % u0j ] )
S. Raudenbush&Bryk (2002, S. 303)
(
(γ00 % γ01 ( Z.j % γ10 ( Xij % γ11 ( Z.j ( Xij [ % u1j ( Xij % u0j ] )
1
'
5
e
WiSe 2001/2002
42
Raudenbush et.al. (2000) erläutern die Interpretation geschätzten γ-Parameter am Beispiels eines
Population-average-Model ohne Wechselwirkungseffekt zwischen den exogenen Individualund Kontextmerkmalen.
„However, one might also want to know the average difference between log-odds of success of
students having the same X but attending schools differing by one unit on W, that is, the
difference of interest averaging over all possible values of u0 j. ... Note that [the formula, W.L.]
does not condition on (or „hold constant“) the random effect u0 j. Thus γ *01 gives the expected
difference in log-odds of success between two students with the same X who attend schools
differing by one unit on W - without respect to the random effect u0 j. If one had a nationally
representative sample and could validly assign a causal inference to W, γ *01 would be the
average chance in the log-odds of success in the whole society associated with boosting W by
one unit while γ 01 would be the average change in log-odds associated with boosting W one unit
for those schools sharing the same value of u0 j.“ (A.a.O., S. 129f.)
HGLM schätzt sowohl das kontextspezifische also auch das Populationsmodell für diskrete
Kriteriumsvariablen. Die Parameter des Populationsmodells werden mit Hilfe der Verallgemeinerten Kleinste-Quadrate-Methode geschätzt, wobei ihnen die Kovarianzstruktur der
Varianzkomponenten des kontextspezifischen Modells zugrunde gelegt wird. Zusätzlich
berechnet HGLM robuste Standardfehler für das „populations-average-model“ die nach Zeger
et.al. (1988) folgende Vorteile aufweisen:
„These standard errors are relatively insensitive to misspecification of the variances and covariances at the two levels and to the distributional assumptions at each level. The method of
estimation used in HGLM for the population-average model is equivalent to the „generalized
estimating equation“ (GEE) approach popularized by Zeger, et al. (1988).“ (Raudenbush et. al.
2000, S. 130)
Raudenbush weist darauf hin, dass wir mit Hilfe der logistischen Regressionskonstanten γ *00
des Populationsmodells die durchschnittliche Wahlwahrscheinlichkeit der Grundgesamtheit
ermitteln können, wenn wir alle exogenen Individual- und Kontextmerkmale an ihrem jeweiligen Grand-Mean-zentrieren oder alternativ ein reines Random-Intercept-Only-Modell schätzen.
Da die Residualvarianzen der Binnenregressionen des logistischen Mehrebenenmdoells heteroskedastisch sind, können wir die zugehörige Varianzkomponente σ2e ij nicht mehr kontextübergreifend schätzen. Daher empfehlen Snijders&Boskers (1999, S. 224), als konservative Schätzung der Residualvarianz der ersten Ebene die Varianz der logistische Dichtefunktion mit einem
Wert von π2 / 3 oder 3,29 in die Formel des Intra-Klassen-Korrelationskoeffizienten
einzusetzen.6
6
Alternativ zum Vorgehen von Snijders&Boskers (1999) schlagen Goldstein,
Browne&Rabash (2000) ein Simulationsmodell zur Schätzung der Residualvarianz innerhalb
der Kontexteinheiten vor, welches sie mit der Markov-Chain-Monte-Carlo-Methode (MCMC)
in ihrem Programm MLWin 1.10 realisiert haben.
WiSe 2001/2002
43
„Since the logistic distribution for the level-one residual implies a variance of π2 / 3 = 3.29, this
implies that for a two-level logistic random intercept model with an intercept variance of τ20 , the
intraclass correlation is
.“
2
ρI '
τ
0
τ20 % π2 / 3
5. Entwicklung eines Auswertungsdesigns
Verallgemeinerte Lineare Mehrebenenmodelle erfordern eine sorgfältige Planung der einzelnen
Auswertungsschritte, wobei die Auswahl der exogenen Individual- und Kontextmerkmale stets
hypothesen- und somit theoriegeleitet erfolgen sollte. Nur so ist es möglich, „sparsame“ und
„erklärungskräftige“ Mehrebenenmodelle zu entwickeln, die dem analysierten Gegenstandsbereich gerecht werden können. Analytisch haben wir hierbei zu unterscheiden zwischen der
Erklärung der Variation unserer Kriteriumsvariablen innerhalb der Kontexteinheiten, der
sogenannten „Pooled Within-Context-Regression“, und zwischen den analysierten Kontexteinheiten. Letztere bezeichnen wir als „Between-Context-Regression“. Während erstere die
Viktimisierungsunterschiede einzelner Befragtengruppen innerhalb der Nachbarschaften als
Kontexteinheit untersucht, versucht letztere zu klären, auf welche Kontextmerkmale die Unterschiede der Viktimisierungsraten der Nachbarschaften zurückzuführen sind. Daher entwickeln
wir im ersten Arbeitsschritt auf der Basis unserer Forschungshypothesen zunächst ein logistisches Regressionsmodell zur Vorhersage des Viktimisierungsrisikos durch Gewaltdelikte
innerhalb der Nachbarschaften. Anschließend verwenden wir ein lineares Regressionsmodell,
um die Variation der Opferraten zwischen den Nachbarschaften durch ausgewählte Kontextmerkmale zu erklären.
Im zweiten Arbeitsschritt schätzen wir mit WHLM 5 zunächst ein Random-Intercept-OnlyModel, um die Kontextabhängigkeit des Viktimisierungsrisikos durch Gewaltdelikte summarisch zu bestimmen. Im dritten Arbeitsschritt schätzen wir anschließend ein logistisches Mehrebenenmodell zur Vorhersage die Opferrisikos, das die bedeutsamen Individualmerkmale enthält
und die Kontextzugehörigkeit der Befragten adäquat berücksichtigt (Random-Intercept-Model).
Im vierten Arbeitsschritt schätzten wir zusätzlich zur Varianzkomponente der kontextabhängigen logistischen Regressionskonstanten diejenige des logistischen Steigungskoeffizienten für
den Gruppenunterschied des Opferrisikos von Minoritätenangehörigen im Vergleich zu ihren
weißen Nachbarn. Im fünften Arbeitsschritt erweitern wir hypothesengeleitet unser logistisches
Mehrebenenmodell um ausgewählte Kontextmerkmale, um die Variation der Opferrisken
sowohl der Referenzgruppe auch der Minoritätenangehörigen zwischen den Nachbarschaften
durch sie zu erklären.
Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse Tab. 5:
WiSe 2001/2002
44
Auswertungsdesign für die Seattle-Viktimisierungsstudie von Miethe
1. Arbeitsschritt: Explorative, hypothesengeleitete Analysen
1.1
Pooled-Within-Context-Logit-Regression (SPSS):
Analyse der Variation des Viktimisierungsrisikos durch Gewaltdelikte innerhalb der Nachbarschaften auf der Basis ausgewählter Individualmerkmale
1.2
Between-Context-Regression (SPSS):
Analyse der Variation der Viktimisierungsraten durch Gewaltdelikte zwischen den Nachbarschaften auf der Basis ausgewählter Kontext-/Nachbarschaftsmerkmale (Multiple Lineare Regression)
2. Arbeitsschritt: Schätzung des Random-Logit-Intercept-Only-Model (WHLM 5)
Bestimmung des Ausmaßes der Kontextabhängigkeit des Opferrisikos durch Gewaltdelikte (Intra-Class-Correlation-Coefficient)
3. Arbeitsschritt: Schätzung des Random-Logit-Intercept-Model mit den Individualmerkmalen (WHLM 5)
Erklärung der Binnenvariation des Opferrisikos durch die in Arbeitsschritt 1.1 ausgewählten Individualmerkmale bei gleichzeitiger Berücksichtigung der Kontextzugehörigkeit der Befragten.
4. Arbeitsschritt: Schätzung des Random-Logit-Intercept/Logit-Slope-Model (WHLM 5)
Bestimmung der Kontextabhängigkeit des Gruppenunterschieds der Viktimisierung
durch Gewaltdelikte von Minoritätenangehörigen im Vergleich zu ihren weißen
Nachbarn (Schätzung der Varianzkomponente des Random-Logit-Slope der Dummyvariablen MINORITY)
5. Arbeitsschritt: Schätzung des Logit-Coefficient-as-Outcome-Model (WHLM 5)
Erklärung der Variation des Random-Logit-Intercept und Random-Logit-Slope zwischen den Nachbarschaften durch die in Arbeitsschritte 1.2 ausgewählten Kontextmerkmale
6. Arbeitsschritt: Schätzung des Logit-Coefficient-as-Outcome-Model mit dem FreewareProgramme MIXOR von Hedecker&Gibbons
WiSe 2001/2002
45
6. 1. Arbeitsschritt: Explorative, hypothesengeleitete Analysen
Im Rahmen der explorativen Analysen betrachten wir zunächst das Viktimisierungsrisiko bei
Gewaltdelikten innerhalb der 300 untersuchten Nachbarschaften. Anschließend richtet sich
unser Augenmerk auf die Variation der Viktimisierungsrate zwischen den Nachbarschften,
wobei wir uns fragen, von welchen Kontextmerkmalen sie vom Niveau her abhängt.
6.1 Explorative Analyse des Viktimisierungsrisikos innerhalb der Nachbarschaften
Bevor wir uns der Vorhersage des Opferrisikos zu wenden, betrachten wir zunächst das Niveau
der Viktimierung durch Körperverletzung oder Raubüberfälle in der eigenen Nachbarschaft
während des vorgegebenen Erinnerungszeitraums von zwei Jahren. Wir stellen sie in der
folgenden Abbildung dem Risiko gegenüber, Opfer eines Wohnungseinbruchs zu werden.
Viktimisierung durch Koerperverletzung,Raub in den letzten 2 Jahren
Gültig
Fehlend
Gesamt
nein
ja
Gesamt
9,00
Häufigkeit
5049
252
5301
1
5302
Prozent
95,2
4,8
100,0
,0
100,0
Gültige
Prozente
95,2
4,8
100,0
Kumulierte
Prozente
95,2
100,0
Viktimisierung durch (versuchten) Einbruch in den letzten 2 Jahren
Gültig
Fehlend
Gesamt
nein
ja
Gesamt
9,00
Häufigkeit
4297
994
5291
11
5302
Prozent
81,0
18,7
99,8
,2
100,0
Gültige
Prozente
81,2
18,8
100,0
Kumulierte
Prozente
81,2
100,0
Von den 5302 Befragten per CATI-Interview befragten Bürgern Seattles sind während des 2jährigen Erinnerungszeitraums 4,8 % Opfer einer Körperverletzung oder Raubüberfalls geworden, während 18,8 % einen Einbruch in ihre eigene Wohnung erlebt haben.
Zur Vorhersage des Viktimisierungsrisikos durch Gewaltdelikte innerhalb der eigenen Nachbarschaft schätzen mit Hilfe von SPSS ein binäres logistisches Regressionsmodelle, wobei wir
zunächst nur die Individualmerkmale Alter, Geschlecht, Minoritätenstatus, Einkommensgruppe,
Allein stehend sowie die Anzahl „gefährlicher außerhäuslicher Aktivitäten“ als Prädiktoren
verwenden. Um eine realistische Referenzgruppe zu erhalten, zentrieren wir die metrischen
Merkmale Alter, Einkommengruppe sowie außerhäusliche Aktivitäten an ihrem jeweiligen
Gesamtmittelwert („Grand-Mean-Zentrierung“). Hierdurch erfaßt die logistische Regressionskonstante den Erwartungswert des Logits der Viktimisierung für verheiratete weiße Männer im
Durchschnittsalter von 48,6 Jahren, die über ein mittleres Haushaltseinkommen und ein mittleres außerhäusliches Aktivitätsniveau verfügen. Die logistischen Steigungskoeffizienten der
anderen exogenen Merkmale erfassen unmittelbar die Abweichung der geschätzten Viktimisie-
WiSe 2001/2002
46
rungslogits der im jeweiligen Merkmal abweichenden Effektgruppen. Im Hinblick auf die
geschätzten Logits der Viktimisierung ist das logistische Regressionsmodell zwar linear,
bezüglich der geschätzten Wahrscheinlich, innerhalb der eigenen Nachbarschaft Opfer einer
Gewalttat zu werden, ist es aber nichtlinear, wobei es sich der S-förmigen logistischen Verteilungsfunktion bedient.
Nach der Schätzung des Pooled-Within-Context-Logit-Model mit den reinen Individualmerkmalen berücksichtigen wir zusätzlich die Nachbarschaftszugehörigkeit der Befragten, indem wir
unser Logitmodell um 300 minus 1 Kontextdummyvariablen erweitern. Wir stellen anschließend
die ermittelten Maße der statistischen und praktischen Signifikanz beider Logitmodelle gegenüber. Für die Schätzung der Modelle mit SPSS V11.0 benötigen wir die folgende Befehlsdatei:
* Level-1-Analysen der Viktimisierung durch Gewaltdelikte.
* Berechnung der Grand-Means für metrische Individualmerkmale.
DESCRIPTIVES
VARIABLES=alter income dangact
/STATISTICS=MEAN STDDEV MIN MAX .
* Berechnung der Grand-Mean-Zentrierten Individualmerkmale.
compute agecgm=alter-48.58.
compute incomcgm=income-3.35.
compute dangacgm=dangact-0.88.
compute agec17=alter-17.
var labels agecgm 'Lebenalter CGM'/
incomcgm 'Familieneinkommen CGM'/
dangacgm 'Gefahrensituationen CGM'/
agec17 'Lebensalter Zentriert Mindestalter'.
DESCRIPTIVES
VARIABLES=agecgm incomcgm dangacgm,agec17
/STATISTICS=MEAN STDDEV MIN MAX .
* Logistisches Regressionsmodell M 1 zur Analyse des Viktimisierungsrisikos.
* CGM-metrischer Individualmerkmale.
LOGISTIC REGRESSION VAR=dvicviol
/METHOD=ENTER agecgm frau minority incomcgm livalone dangacgm
/CLASSPLOT
/PRINT=ITER(1)
/CRITERIA PIN(.05) POUT(.10) ITERATE(20) CUT(.5) .
* Logist.Regressionsmodell M 2 mit zusaetzlichen Nachbarschaftsdummyvariablen.
LOGISTIC REGRESSION VAR=dvicviol
/METHOD=ENTER agecgm frau minority incomcgm livalone dangacgm
/CONTRAST (blockict)=Indicator
/CLASSPLOT
/PRINT=ITER(1)
/CRITERIA PIN(.05) POUT(.10) ITERATE(20) CUT(.5) .
WiSe 2001/2002
47
Für das logistische Regressionsmodell M 1 erhalten wir auszugsweise die folgenden Angaben
zur Modellanpassung und die zugehörigen Logitschätzer:
Omnibus-Tests der Modellkoeffizienten
Schritt 1 Schritt
Block
Modell
Chi-Quadrat
60,558
60,558
60,558
df
6
6
6
Sig.
,000
,000
,000
Modellzusammenfassung
-2
Log-Likeli
hood
Schritt
1
1730,159
Cox & Snell
R-Quadrat
,013
Nagelkerkes
R-Quadrat
,040
Variablen in der Gleichung
Schritt
a
1
Regressions
koeffizientB
AGECGM
-,006
FRAU
,012
MINORITY
,115
INCOMCGM
-,187
LIVALONE
,577
DANGACGM
,319
Konstante
-3,295
Standardfehler
,004
,141
,189
,056
,151
,086
,121
Wald
2,013
,007
,372
11,246
14,610
13,668
744,209
df
1
1
1
1
1
1
1
Sig.
,156
,933
,542
,001
,000
,000
,000
Exp(B)
,994
1,012
1,122
,830
1,780
1,376
,037
a. In Schritt 1 eingegebene Variablen: AGECGM, FRAU, MINORITY, INCOMCGM, LIVALONE,
DANGACGM.
Mit einem Likelihood-Ratio-χ2-Wert von 60,56 bei 6 Freiheitsgraden verwerfen wir die zugehörige Nullhypothese, die besagt, dass alle logistischen Steigungskoeffizienten Null sind, mit
einer Irrtumswahrscheinlichkeit von weniger als einem Prozent. Die betrachteten sechs exogenen Merkmale üben zwar einen statistisch signifikanten Einfluß auf das Logit der Viktimisierung durch Gewaltdelikte aus, aber ihr Einfluß im Sinne der praktischen Signifikanz erweist sich
als dürftig. Dies ist deutlich ersichtlich, wenn wir die zugehörigen Pseudo-R2 betrachten. SPSS
bietet uns als „Pseudo-Bestimmtheitsmaße“ diejenigen an, die Maddala (1983) sowie
Cragg&Uhler (1970) entwickelt haben. Ersteres firmiert in SPSS als Cox&Snell- und letzteres
als Nagelkerke Pseudo-R2. Wie Langer (2000) ausführlich gezeigt hat, unterschätzen aber beide
deutlich die „wahre Modellanpassung“. Hingegen verfügt das von Veall&Zimmermann
(1992,1994) korrigierte Aldrich&Nelson Pseudo-R2 (1984) über die beste Approximation des
McKelvey&Zavoina Pseudo-R2s. Letzteres beschreibt den Fit des binären oder ordinalen
Logitmodell gemäß den Simualationsstudien von Hagle&Mitchell (1992), Veall&Zimmermann
(1992,1994) , Windmeijer (1994) sowie Demaris (2002) am besten. Da es aber auf der direkten
Varianzzerlegung der geschätzten Logits beruht und diese in den meisten Mehrebenenprogrammen nicht realisierbar ist, verwenden wir zur Beurteilung der praktischen Signifikanz das
Aldrich&Nelson Pseudo-R2 mit der von Veall&Zimmermann (1992) vorgeschlagenen Korrektur
anhand seiner geschätzten Obergrenze. Der Logik der proportionalen Fehlerreduktion (PRE)
folgend, ist es auf den Wertebereich von Null bis Eins begrenzt. Wir können es daher analog
zum klassischen Determinationskoeffizienten R2 als geschätzten Anteil der durch die exogenen
Variablen aufgeklärten Varianz der Logits interpretieren.
WiSe 2001/2002
48
Berechnung des Proportional&Reduction&of&Error&R 2 auf der Basis
der Deviancen von Null&und Alternativmodell 2:
PRE&R 2 '
DevianceNullmodell & DevianceA.M.2
DevianceNullmodell
DevianceA.M.2
McFadden Pseudo&R 2 ' 1 &
DevianceNullmodell
Da das McFadden Pseudo-R2 und das PRE-R2 von ihrem Konstruktionsprinzip her identisch
sind, liefert sie beide denselben Wert für die auf die exogenen Merkmale zurückzuführende
proportionale Reduktion der Deviance. Einen etwas realistischeren Aufschluss über die Modellanpassung vermittelt das Aldrich&Nelson Pseudo-R2. Da es nur bei Gleichverteilung der
Kategorien der Kriteriumsvariable sein theoretisches Maximum von Eins erreicht, haben
Veall&Zimmermann (1994) in Anlehnung an Hagle&Mitchell (1992) vorgeschlagen, zunächst
seine empirische Obergrenze bei gegebener Verteilung der Kategorien zu schätzen und anschließend das Aldrich&Nelson Pseudo-R2 an seiner empirischen Obergrenze zu normieren.
Berechnung des Aldrich&Nelson&Pseudo&R 2 für binäre/ordinale Kriteriumsvariablen:
Für Probits:
Aldrich&Nelson&Pseudo R '
2
'
LR&Χ2M
2
LR&Χ
MA
A
% n
MA
2 ( (lnL A & lnL0 )
2 ( (lnL A & lnL0 ) % nM
A
Für Logits:
Aldrich&Nelson&Pseudo R '
LR&Χ2M
2
'
2
LR&Χ
MA
A
% ( nM ( 3,29 )
A
2 ( (lnL A & lnL0 )
2 ( (lnLA & lnL0 ) % ( nM ( 3,29 )
A
Veall&Zimmermann schätzen die empirische Obergrenze des Aldrich&Nelson Pseudo-R2 über
die folgende Formel:
WiSe 2001/2002
Theoretische Spannbreite:
&2 ( lnL0
Probits: 0 # Aldrich&Nelson&Pseudo R 2 #
Logits: 0 # Aldrich&Nelson&Pseudo R 2 #
49
n & 2 ( lnL0
&2 ( lnL0
3,29 ( n & 2 ( lnL0
Legende:
lnL0: Log&Likelihood des Nullmodells
n:
Stichprobenumfang n
Das eigentliche korrigierte Aldrich&Nelson-Pseudo-R2 berechnen Veall&Zimmermann über die
folgende Formel:
Veall&Zimmermann&Korrektur des Aldrich&Nelson&Pseudo&R 2:
Es wird an seinem eigenen Maximum standardisiert, wobei es von der
Anzahl der Kategorien und ihren relativen Häufigkeiten abhängt &< Range [ 0 ; 1 ]
Für Probits:
Aldrich&Nelson&Pseudo R 2V&Z '
2 ( (lnL A & lnL0 )
2 ( (lnL A & lnL0 ) % n
&2 ( lnL0
n & 2 ( lnL0
Für Logits:
2 ( (lnLA & lnL0 )
2 ( (lnL A & lnL0 ) % 3,29(n
&2 ( lnL0
3,29 ( n & 2 ( lnL0
Für die Berechnung des Aldrich&Nelson-Pseudo-R2 mit Veall&Zimmermann-Korrektur
benötigen wir das Excel-Arbeitsblatt „mlafitlogit.xls“. Neben dem Gesamtstichprobenumfang
von 4659 Befragten setzten wir die Devianzen (-2*LogLikelihood) des Null- und aktuellen
Modells an den hierfür vorgesehenen Positionen im Arbeitsblatt ein. Die für den LikelihoodRatio-χ2-Test benötigte Anzahl der Freiheitsgrade erhalten wir, indem die Anzahl der zu schätzenden logistischen Steigungskoeffizienten ermitteln. In unserem Fall haben wir sechs logistische Steigungskoeffizienten geschätzt, die der Anzahl der Freiheitsgrade entsprechen. Excel
berechnet anschließend die Likelihood-Ratio-χ2-Prüfgröße und die zugehörige Irrtumswahrscheinlichkeit (alpha). Neben den Maddala-Maximum-Likelihood-Pseudo-R2 ermittelt Excel
automatisch diejenigen von McFadden (1979), Aldrich&Nelson (1984) ohne und mit der von
Veall&Zimmermann (1992) vorgeschlagenen Korrektur an seiner geschätzten Obergrenze.
WiSe 2001/2002
50
Abb. 8:Excel-Arbeitsmappe „mlafitlogit.xls“ zur Berechnung der Pseudo-R2e für Logistische
Mehrebenenmodelle mit einer diskreten/ordinalen Kriteriumsvariablen
Wie wir der Abb.8 entnehmen, verfügt das Within-Context-logistische Regressionsmodell mit
einer geschätzten Varianzaufklärung von 3,73 % gemäß dem A&N-Pseudo-R2 mit Veall&Zimmermann-Korrektur über eine sehr mäßige Modellanpassung im Sinne der praktischen
Signifikanz. Daher sollten wir die Effekte der exogenen Individualmerkmale mit einer gewissen
Vorsicht interpretieren.
Die logistische Regressionskonstante von -3,295 erfasst den Erwartungswert der Viktimisierung
für die Referenzgruppe der weißen verheirateten Männer, die rd. 49 Jahre alt sind und ein
mittleres außerhäusliche Aktivitätsniveau aufweisen. Dem Wald-Test zur Folge ist ihr geschätztes Logit signifikant von Null verschieden. Bei der Interpretation haben wir zu beachten,
dass ein Logit von Null einer Wahrscheinlichkeit von 50 % entspricht. Um die Interpretation zu
erleichtern, berechnen wir die geschätzte Opferwahrscheinlichkeit, indem wir die logistische
Regressionskonstante als fixed-effect in die Prognosegleichung des logistischen Regressionsmodells einsetzen. Das geschätzte Opferrisiko der Referenzgruppe beträgt rd. 3,57 %.
Gemäß seinem negativen Vorzeichen (AGECGM) sinkt mit zunehmenden Alter das Logit der
Viktimisierung durch Gewaltdelikte, wobei es gemäß dem Wald-Test die übliche Signifikanzgrenze von 5 % nicht erreicht. Um diesen Alterseffekt im Sinne des von Long (1997, S.75)
vorgeschlagenen „discrete change“ zu bestimmen, berechnen wir zusätzlich die geschätzten
Opferwahrscheinlichkeiten für die Altersgruppen der 20- und 70-jährigen. Während die 20jährigen mit sonst identischen Merkmalen der Referenzgruppe über Opferrisiko von 4,21 %
aufweisen, sinkt es bei den 70-jährigen auf 3,16 % ab. Dies entspricht einer Prozentsatzdifferenz
WiSe 2001/2002
51
von 1,05 %. Im Vergleich zu den Männer der Referenzgruppe liegt das Viktimisierungsrisiko
der Frauen nicht signifikant höher, wie wir leicht an der geschätzten Opferwahrseinlichkeit von
3,62 % im Durchschnittsalter erkennen. Bei den 20- bzw. 70-jährigen unterscheidet sich das
Risiko der Frauen nur unwesentlich von demjenigen der Männer. Im Durchschnittsalter unterscheidet sich die Opferrisiken der weißen und farbigen Befragten (MINORITY) nicht statistisch
signifikant voneinander. Mit 3,99 % liegt die geschätzte Opferwahrscheinlichkeit der ethnischen
Minoritäten im Durchschnitt nur knapp einen halben Prozentpunkt über derjenigen ihrer weißen
Nachbarn.
Hingegen sinkt in signifikanten Maße das Opferrisiko, wenn das Haushaltseinkommen der
Befragten (INCOMCGM) zunimmt. Um diesen Effekt sozialer Ungleichheit genauer zu bestimmen, vergleichen wir die geschätzten Opferrisiken der untersten und obersten Einkommensgruppe. Während die Opferwahrscheinlichkeit bei den Befragten mit einem Jahreseinkommen
von weniger als $ 10.000 bei 5,44 % im Durchschnittsalter liegt, sinkt es bei denjenigen, die
mehr als $ 100.000 verdient haben, auf 1,84 %. Die Unterschiede der geschätzten Opferrisiken
liegen in den Altersgruppen der 20-jährigen bei 6,39 vs. 2,18 % bzw. der 70-jährigen bei 4,82
vs. 1,62 %. Somit übersteigt für alle Altersgruppen die Opferwahrscheinlich der „Armen“
diejenigen der „Reichen“ nahezu um das Dreifache.
Die beiden „life style“-Indikatoren Singledasein (LIVALONE) und Anzahl außerhäuslicher
Aktivitäten (DANGACGM) erhöhen in signifikanten Ausmaß das Risiko der Befragten, Opfer
einer Körperverletzung oder eines Raubüberfalls zu werden. Im Vergleich zu der verheirateten
Männer der Referenzgruppe steigt ihre Opferwahrscheinlichkeit im Durchschnittsalter auf
6,19% an. Diesen Single-Effekt finden wir ebenfalls bei den 20- und 70-jährigen mit geschätzten
Opferrisiken von 7,27 bzw. 5,49%. Über alle Altersgruppen hinweg weisen Alleinstehende ein
nahezu doppelt so hohes Opferrisiko auf als Verheiratete. Um den Effekt der außerhäuslichen
Aktivitäten zu bestimmen, kontrastieren wir diejenigen Gruppen von Befragten, die sich in alle
drei vorgegebenen Gefahrensituationen begeben haben (DANGACT=3) und diejenigen, die dies
nicht getan haben (DANGACT=0). Im Durchschnittsalter von rd. 49 Jahren erhalten wir jeweils
ein geschätztes Opferrisiko für erstere von 6,8% und für letzere von 2,73%. Bei den 20jährigen erwarten wir Risiken von 7,98 bzw. 3,22%, während sie bei den 70-jährigen auf 6,03
bzw. 2,41% sinken. Über die betrachteten Altersgruppen hinweg, übersteigt das Risiko der
„Kneipengeher“ dasjenige der „Stubenhocker“ um das Zweieinhalbfache.
Um die Interpretation der Logitschätzer zu erleichtern, stellen wir die mit Hilfe der Prognosegleichung der logistischen Regression geschätzten Opferwahrscheinlichkeiten der einzelnen
Effekt- und Altersgruppen in der folgenden Abbildung als dreidimensionales Balkendiagramm
dar:
WiSe 2001/2002
52
8
O
p
f
e
r
r
i
s
i
k
o
6
4
2
i
n
%
0
20-jährige
R
FG
RE
F
49-jährige
U
RA
MI
Y
L1
RIT
L7
EC
NO
E
EC
OM
ON
C
=0
OM
IN
AL
C
=3
CT
IN
LIV
CT
GA
N
GA
N
Effektgruppen
DA
DA
70-jährige
REFGR
FRAU
MINORITY
INCOMECL1
INCOMECL7
LIVALONE
DANGACT=0
DANGACT=3
70-jährige
3,16
3,19
3,53
4,82
1,62
5,49
2,41
6,03
49-jährige
3,57
3,62
3,99
5,44
1,84
6,19
2,73
6,8
20-jährige
4,21
4,26
4,7
6,39
2,18
7,27
3,22
7,98
Abb. 9:Geschätzte Wahrscheinlichkeit, Opfer eines Gewaltdelikts zu werden, auf die exogenen
Individualmerkmale (Logistische Within-Context-Regression mit n= 4659)
Um die Kontextabhängigkeit der Viktimisierung durch Gewaltdelikte zu ermitteln, schätzen wir
ein weiteres binäres logistisches Regressionsmodell (M.2), welches zusätzlich die Nachbarschaftszugehörigkeit der Befragten enthält. Hierzu fordern wir SPSS dazu auf, vor der Schätzung der logistischen Regression die Nachbarschaftskennung BLOCKICT in 300-1 Dummyvariablen zu zerlegen und als zusätzlichen Faktor im Modell zu berücksichtigen. Da uns lediglich der summarische Erklärungsbeitrag der Kontextzugehörigkeit Nachbarschaft in Bezug
auf die Viktimisierung durch Gewaltdelikte interessiert, verzichten wir auf eine Dokumentation
des umfangreichen SPSS-Ausgabeprotokolls und betrachten nur die partiellen Bestimmtheitsmaße der statistischen und praktischen Signifikanz. Tabelle 6 enthält ebenfalls die zugehörigen
globalen Maße. Mit einer Irrtumswahrscheinlichkeit von weniger als einem Prozent können wir
die Nullhypothese des partiellen Likelihood-Ratio-χ2-Test zurückweisen, die besagt, dass die
Nachbarschaftszugehörigkeit keinen statistisch bedeutsamen Einfluß auf das Viktimisierungsrisiko ausübt. Gemessen am Aldrich&Nelson Pseudo-R2 mit Veall&Zimmermann-Korrektur
steigt die geschätzte Varianzaufklärung der Logits von 3,73 % (M.1) auf 28,87 % (M.2). Dies
entspricht einer auf den Kontextfaktor zurückzuführenden Zunahme um +25,14%. Selbst das
sehr konservative McFadden-Pseudo-R2 verzeichnet beim Vergleich beider Modelle einen
Informationsgewinn von +23,29 %. Gemäß der von McFadden (1979, S.307) aufgestellten
Daumenregel verfügt das Modell 2 mit einem Pseudo-R2 von 26,67% über eine hervorragende
Modellanpassung.
WiSe 2001/2002
53
Tab. 6: Übersicht der Maße der statistischen und praktischen Signifikanz der logistischen Regressionsmodelle ohne (M.1) und mit Nachbarschaftsdummyvariablen (M.2)
Modellanpassung:
Modell 1:
Modell 2:
M.2 vs. M.1
Likelihood-Ratio-χ2-Test =
60,56
477,63
417,07 2)
Freiheitsgrade (D.F.) =
6
305
299
Signifikanzniveau α =
0
0
0
Cox&Snell / Maddala -Pseudo-R2 =
1,3 %
9,7 %
8,4 % 3)
Nagelkerkes / Cragg&Uhler-Pseudo-R2 =
4,0 %
30,5 %
26,5 % 3)
McFadden-Pseudo-R2 =
3,38 %
26,67 %
23,29 % 3)
Aldrich&Nelson -Pseudo-R2 mit
Veall&Zimmermann-Korrektur =
3,73 % 1)
28,87 %
25,14 % 3)
Anmerkungen:
1) Geschätztes Maximum des Aldrick&Nelson-Pseudo-R2 = 0,1046
2) Partieller Likelihood-Ratio-χ2-Test. H0: Alle Logistischen Steigungskoeffizienten der Kontextdummyvariablen sind Null.
3) Differenz der Pseudo-R2e von M.2 und M.1
Beim Vergleich beider logistischer Regressionsmodelle zeigt sich, dass zum einen die exogenen
Individualmerkmale nur einen untergeordneten Einfluß auf das Vikimisierungsrisiko durch
Gewaltdelikte ausüben. Bei der Bewertung dieses Befundes haben wir zu beachten, dass wir die
Effekte der exogenen Individualmerkmale im Durchschnitt aller Kontexteinheiten geschätzt
haben. Wir wissen aber nichts darüber, wie stark diese Effekte über die Nachbarschaften hinweg
variieren können. Ein Nichteffekt wie derjenige der Minderheitenzugehörigkeit auf die Viktimisierung kann darauf beruhen, dass in der einen Hälfte unserer Nachbarschaften, Farbige ein
höheres Opferrisiko als ihre weißen Nachbarn haben, während in der andern Hälfte genau das
Gegenteil zutrifft. Das heißt, dort ist die Opferrate der Weißen möglicherweise deutlich höher
als diejenige ihre farbigen Nachbarn. Daher sollten wir uns vor „deduktiven Fehlschlüssen“
hüten und die soziale Kontextzugehörigkeit der Befragten im Rahmen eines adäquaten logistischen Mehrebenenmodells berücksichtigen. Zum anderen zeichnet sich deutlich ein starker
Einfluß der Nachbarschaftszugehörigkeit auf das Opferrisiko ab. Daher haben wir uns ausführlich mit den „sozial-ökologischen Bedingungen“ der Viktimisierung durch Gewaltdelikte zu
beschäftigen, um deren Einflussgewicht zu bestimmen.
6.2 Explorativen Analysen der Viktimisierungsraten durch Gewaltdelikte auf der
Nachbarschaftsebene
Wir betrachten zunächst die Variation der Viktimisierungsraten speziell für Einbruchs- und
Gewaltdelikte sowie durch Kriminalität insgesamt in der eigenen Nachbarschaft über die
untersuchten 300 Kontexteinheiten. Als vorgegebener Referenzzeitraum dienen die beiden Jahre
vor dem Erhebungszeitpunkt 1990.
WiSe 2001/2002
54
100
80
60
Viktimisierung in %
268
126
200
215
293
276
232
40
20
119
101
36
265
6
0
N=
Abb. 10:
Tab. 7:
230
178
258
179
231
197
213
204
216
199
280
218
227
180
281
257
211
200
229
226
31
201
209
202
208
285
300
300
300
Insgesamt
Einbruchs-
Gewaltdelikte
Variation der Opfersraten in der eigenen Nachbarschaft im vorgegebenen Erinnerungszeitraum von
2 Jahren
Deskriptive Statistiken zu den Opferraten auf der Nachbarschaftsebene
Viktimisierung insg. in
eigener Nachbarschaft
in letzten 2 Jahren in
Prozent
Viktimisierung durch
Einbruch in letzten 2
Jahren in Prozent
Gewaltdelikte in letzten
2 Jahren in Prozent
05. Perzentil
25. Perzentil
33,33
50,00
5,26
,00
Median
Mittelwert
75. Perzentil
95. Perzentil
60,00
59,75
70,59
83,33
11,11
16,67
18,97
25,00
43,71
,00
,00
4,85
5,88
22,22
Wie wir dem Boxplot in Abbildung 10 entnehmen, weist die Viktimisierung durch Gewaltdelikte auf der Nachbarschaftsebene eine erhebliche Variation auf. Während es in 50% der Nachbarschaften keine Gewaltopfer gibt, liegt das Maximum der Opferrate bei 35,7% in der Kontexteinheit 230, die mit einem Sternchen für extrem Ausreißer markiert ist. Die Opferraten bei Einbruchsdelikten weisen mit einer Spannbreite von Null bis 55,56% eine noch höhere Variation
auf, wobei die mittlere Opferrate bei 16,7% liegt. Deliktsübergreifend variiert die Viktimisierung innerhalb der eigenen Nachbarschaft zwischen 11,1 und 100,0%, wobei die mittlere
Opferrate der Nachbarschaften einen Wert von 60,0% erreicht.
WiSe 2001/2002
55
Die exogenen Kontextmerkmale hat die Forschergruppe um Miethe durch die Aggregation der
subjektiven Einschätzungen der Befragten in ihrer jeweiligen Nachbarschaft ermittelt. Im
Gegensatz zu Miethe&Meier(1994) operationalisieren wir die ethnische Heterogenität der
Nachbarschaft nicht über das Produkt der Anteilswerte der ethnischen Minoritäten und ihrer
weißen Nachbarn, sondern wir verwenden direkt den Prozentsatz der Angehörigen ethnischer
Minderheiten als Indikator. Gegen die Verwendung von Anteilswerten als exogene Kontextmerkmale spricht, dass aufgrund ihres auf das Intervall von Null bis Eins begrenzten Wertebereichs ihre Effekte im Regressionsmodell deutlich überschätzt werden. Im verallgemeinerten
linearen Regressionsmodell gibt uns der Steigungskoeffizient an, um wieviel sich der Erwartungswert der Kriteriumsvariable ändert, wenn das exogene Merkmal genau um eine natürliche
Einheit zunimmt. Bei Anteilswerten entspricht diese induzierte Änderung der Kriteriumsvariablen der Zunahme der exogenen Variablen von Null auf Eins und somit der gesamten
Spannbreite. Für den Prozentsatz der ethnischen Minoritäten erhalten wir die in Abbildung 11
dargestellte Verteilung:
100
903
943
873
902
893
1173
883
941
911
1002
1043
773
882
851
791
80
782
901
881
863
60
871
1013
1183
942
771
852
1101
1103
783
1102
40
20
0
N=
Abb. 11:
300
Verteilung des Prozentsatzes ethnischer Minoritäten
über die 300 Nachbarschaften
Tab. 8: Deskriptive Statistiken für den Prozentsatz ethnischer Minoritäten auf der
Nachbarschaftsebene
05. Perzentil 25. Perzentil
Prozentsatz ethnische
Minderheiten in
,00
,00
Nachbarschaft
Median
6,25
Mittelwert 75. Perzentil 95. Perzentil
15,51
18,75
66,39
WiSe 2001/2002
56
In Abbildung 11 zeichnet sich deutlich die ethnische Segregation der Nachbarschaften in Seattle
ab. Die zugehörige Spannbreite reicht zwar von Null bis 93,3% Angehörige ethnischer Minoriäten, der mittlere Prozentsatz liegt aber nur bei 6,25%. An der oberen Quartilsgrenze erkennen
wir, dass 75% der untersuchten Nachbarschaften höchsten einen Minderheitenanteil von 18,75%
aufweisen. Die eindeutig von Minderheiten dominierten Nachbarschaften zeichnen sich markant
durch ihre Kreis- und Sternmarkierungen im Boxplot ab.
Die zentralen exogenen Konstrukte der „sozialen Dichte“ (MBUSYPLA), der „sozialen Integration“ (MNINTEGR), der „Zeichen des Verfalls“ (MINCIVIL) sowie dem Einkommensniveau (MINCOME) gewinnen wir über die Mittelwertsbildung der exogenen Individualmerkmale auf der Nachbarschaftsebene. Ihre Variation auf der Kontextebene zeichnet sich deutlich
in den Boxplots der Abbildung 12 ab, wobei die Nachbarschaftsmittelwerte nahezu den gesamten theoretischen Wertebereich der zugehörigen Individualmerkmale abdecken.
8
7
6
159
100
57
5
4
216
3
2
112
230
231
1
0
N=
300
300
Soziale Dichte
300
Sozale Integration
Zeichen des Verfalls
Abb. 12:
300
Einkommensniveau
Verteilung der aggregierten Kontextmerkmale auf der
Nachbarschaftsebene
Tab. 9: Verteilung der Nachbarschaftsmittelwerte der aggregierten Kontextmerkmale
Soziale Dichte
Nachbarschaftsintegration
Einkommensniveau
05. Perzentil 25. Perzentil
1,44
2,40
,39
,78
2,11
2,94
2,29
2,93
Median
3,23
1,22
3,61
3,36
Mittelwert 75. Perzentil 95. Perzentil
3,45
4,35
5,83
1,33
1,78
2,56
3,51
4,12
4,60
3,36
3,75
4,44
WiSe 2001/2002
57
Wir betrachten zunächst die Korrelationsstruktur der Nachbarschaftsindikatoren und schätzen
anschließend ein multiples lineares Regressionsmodell mit SPSS V11.0, um die Variation der
Viktimisierungsrate durch Gewaltdelikte auf ihrer Basis vorherzusagen.
Tab. 10:
Korrelationen der aggregierten Kontextmerkmale auf der Nachbarschaftsebene
(n = 300)
Soziale Dichte
Soziale Integration
Mittlere Einkommensklasse
% ethnische Minderheiten
%-Einbruchsopfer in letzt.2
%-Gewaltopfer in letzt.2 J.
%-Opfer in Nachbarschaft
Soziale
Dichte
1
,474**
-,425**
-,420**
,073
,180**
,345**
-,109
Mittlere
% GewaltZeichen
Einkom- %ethnische % Einbruchs- opfer in % Opfer in
Soziale
des
Minderpfer in letzt. den letzt.
NachbarmensVerfalls Integration klasse
heiten
2 J.
schaft
2 J.
,474**
-,425**
-,420**
,073
,180**
,345**
-,109
1
-,396**
-,557**
,408**
,413**
,547**
,198**
-,396**
1
,564**
-,099
-,249**
-,268**
,231**
-,557**
,564**
1
-,380**
-,192**
-,449**
,114*
,408**
-,099
-,380**
1
,177**
,228**
,140*
,413**
-,249**
-,192**
,177**
1
,254**
,420**
,547**
-,268**
-,449**
,228**
,254**
1
,154**
,198**
,231**
,114*
,140*
,420**
,154**
1
**. Die Korrelation ist auf dem Niveau von 0,01 (2-seitig) signifikant.
*. Die Korrelation ist auf dem Niveau von 0,05 (2-seitig) signifikant.
Die Rate der Gewaltopfer korreliert auf der Nachbarschaftsebene positiv von ihrer Stärke her in
absteigender Reihenfolge mit den Zeichen des Verfalls, der sozialen Dichte, dem Prozentanteil
ethnischer Minoritäten sowie der allgemeinen Kriminalitätsbelastung („proximity to crime“).
Hingegen korreliert sie negativ mit dem Einkommensniveau und der sozialen Integration der
Nachbarschaft. Da das Einkommensniveau der Nachbarschaft mit den „Zeichen des Verfalls“
sowie der sozialen Integration mit -0,56 bzw. +0,56 relativ hoch korreliert, sollten wir diese
Kontextvariable der „sozialen Ungleichheit“ im multiplen Regressionsmodell nicht berücksichtigen, um Multikollinearität zu vermeiden.
Wie wir den Abbildungen 10 und 12 entnehmen können, verfügen die meisten unserer Kontextmerkmale weder über einen theoretischen noch über einen empirischen Nullpunkt. Die
einzige Ausnahme hiervon bildet der Prozentsatz ethnischer Minoritäten in der Nachbarschaft.
Daher empfiehlt es sich die Kontextmerkmale jeweils an ihrem Gesamtmittelwert zu zentrieren.
Hierdurch ändert sich die Interpretation der Regressionskonstanten folgendermaßen. Sie erfasst
nunmehr den Erwartungswert der Viktimisierungsrate durch Gewaltdelikte für Nachbarschaften,
die exakt dem jeweiligen Durchschnitt der Kontextmerkmale Soziale Dichte, Zeichen des
Verfalls, Soziale Integration, Minoritätenanteil sowie der allgemeinen Kriminalitätsbelastung
entsprechen. Bei ihr handelt es sich daher um eine „Durchschnittsnachbarschaft“. Die Zentrierung selbst führt bei den einzelnen exogenen Variablen dazu, dass wir den Schwerpunkt der
Verteilung in den Nullpunkt verschieben, wodurch aber ihre ursprüngliche Streuung beibehalten
wird.
Für die „Grand-Mean-Zentrierung“ der Kontextemerkmale und die Schätzung des multiplen
Regressionsmodells benötigen wir die folgenden SPSS-Befehle:
WiSe 2001/2002
58
GET FILE='D:\LEHRE\multilev\MIETHE\SPSSFWIN\neighbor2.sav'.
* Grand-Mean-Zentrierung der Level-2-Indikatoren.
compute mbusycgm=mbusypla-3.45.
compute mincicgm=mincivil-1.33.
compute mnintcgm=mnintegr-3.51.
compute mincocgm=mincome-3.36.
compute pminocgm=pminori-15.51.
compute pvicncgm=pvicion-59.75.
var labels mbusycgm 'Soziale Dichte (CGM)'/
mincicgm 'Zeichen des Verfalls (CGM)'/
mnintcgm 'Soziale Integration (CGM)'/
mincocgm 'Einkommensniveau (CGM)'/
pminocgm '%-Minoritäten (CGM)'/
pvicncgm '%-Verbrechensopfer (CGM)'.
REGRESSION
/DESCRIPTIVES MEAN STDDEV CORR SIG N
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT pvicviol
/METHOD=ENTER mbusycgm mincicgm mnintcgm pminocgm pvicncgm.
Für das multiple Regressionsmodelle erhalten wir die folgenden Angaben zur Verteilung der
untersuchten Variablen, zur Modellanpassung sowie die geschätzten Regressionskoeffizienten:
Deskriptive Statistiken
Gewaltdelikte in letzten 2
Jahren in Prozent
Soziale Dichte (CGM)
(CGM)
Soziale Integration (CGM)
%-Minoritäten (CGM)
%-Verbrechensopfer
(CGM)
Mittelwert
Standardab
weichung
4,8496
7,23854
300
-,0020
1,34472
300
,0017
,70183
300
,0005
-,0025
,78927
19,75641
300
300
,0037
15,47415
300
N
Modellzusammenfassung
Modell
1
R
R-Quadrat
,563a
,317
Korrigiertes
R-Quadrat
,305
Standardfehler des
Schätzers
6,03507
a. Einflußvariablen : (Konstante), %-Verbrechensopfer
(CGM), Soziale Dichte (CGM), %-Minoritäten (CGM),
Soziale Integration (CGM), Zeichen des Verfalls (CGM)
WiSe 2001/2002
59
ANOVAb
Modell
1
Regression
Residuen
Gesamt
Quadrats
umme
4958,462
10708,081
15666,543
df
5
294
299
Mittel der
Quadrate
991,692
36,422
F
27,228
Signifikanz
,000a
a. Einflußvariablen : (Konstante), %-Verbrechensopfer (CGM), Soziale Dichte (CGM),
%-Minoritäten (CGM), Soziale Integration (CGM), Zeichen des Verfalls (CGM)
b. Abhängige Variable: Viktimisierung durch Gewaltdelikte in letzten 2 Jahren in
Prozent
Koeffizientena
Modell
1
(Konstante)
Soziale Dichte (CGM)
(CGM)
Soziale Integration (CGM)
%-Minoritäten (CGM)
%-Verbrechensopfer
(CGM)
Nicht standardisierte
Koeffizienten
Standardfehler
B
4,843
,348
,638
,315
Standardisierte
Koeffizienten
Beta
,118
T
13,901
2,027
Signifikanz
,000
,044
4,520
,677
,438
6,677
,000
-,583
,008
,528
,020
-,064
,021
-1,105
,395
,270
,693
,043
,025
,092
1,737
,083
a. Abhängige Variable: Viktimisierung durch Gewaltdelikte in letzten 2 Jahren in Prozent
Mit den fünf ausgewählten Kontextmerkmalen binden wir rd. 31,7 % der Varianz der Viktimisierungsrate durch Gewaltdelikte, wobei sich dieser Erklärungsbeitrag mit einem F-Wert von
27,23 bei 5 respektive 294 Freiheitsgraden als statistisch signifikant erweist. Aufgrund der
hierarchischen Datenstruktur sind aber die Voraussetzungen des F- und T-Tests verletzt, so dass
wir uns auf die Betrachtung der geschätzten Regressionskoeffizienten nach Vorzeichen und
Größe beschränken müssen.
Für unsere „Durchschnittsnachbarschaft“ erwarten eine durchschnittliche Viktimisierungsrate
von 4,84%. Erhöht sich die soziale Dichte im Sinne der Anzahl „öffentlicher Plätze“ um eine
Einheit zu, so erwarten wir eine Zunahme derViktimisierungsrate um jeweils 0,64%. Nehmen
hingegen die Zeichen des Verfalls um eine Einheit zu, so steigt die Viktimisierungsrate im
Durchschnitt um 4,52%. Erhöht sich das Ausmaß der sozialen Integration der Nachbarschaft um
eine Einheit, so erwarten wir eine Abnahme der Viktimisierung um 0,58%. Eine Zunahme des
Minderheitenanteils wirkt sich faktisch nicht auf die Opferrate aus. Hingegen führt die Zunahme
der Verbrechensbelastung der Nachbarschaft um 1 %, zu einer geringfügen Erhöhung des
Viktimisierungsrate um 0,04%. Gemessen an seinem standardisierten Regressionskoeffizienten
übt das Kontextmerkmal „Zeichen des Verfalls“ mit einem ß-Koeffizienten von +0,44 den
stärksten Einfluß auf Viktimisierungsrate durch Gewaltdelikte aus. Ihm folgen mit deutlichem
Abstand die soziale Dichte (ß=+0,12) und die allgemeine Kriminalitätsbelastung der Nachbarschaft (ß=+0,09). Hingegen unterschreiten die Kontextmerkmale soziale Integration und Minderheitenanteil deutlich die für eine inhaltliche Interpretation geltende |0,10|-Grenze.
WiSe 2001/2002
60
6.3 Entwicklung eines Mehrebenenmodells für die Erklärung des Viktimisierungsrisikos durch Gewaltdelikte
Auf der Grundlage der in Abschnitt 6.1 und 6.2 durchgeführten Arbeitsschritte entwickeln wir
nun ein Verallgemeinertes hierarchisches Zweiebenenmodell, bei dem wir zum einen innerhalb
der Nachbarschaften das Logit der Viktimisierung durch Gewaltdelikte (DVICVIOL) auf der
Basis unserer exogenen Individualmerkmale schätzen. Zum anderen zerlegen wir die Varianz
der geschätzten logistischen Regressionskonstante und ausgewählter Steigungskoeffizienten mit
Hilfe der bereits vorgestellten Kontextmerkmale.
SOZIALE DICHTE:
Anzahl öffentlicher Plätze
(MBUSYPLA(CGM))
Ebene 2:
Nachbarschaftskontext
ETHNISCHE HETEROGENITÄT:
% Minderheiten
(PMINORI(CGM))
ZEICHEN DES VERFALLS:
(MINCIVIL(CGM))
SOZIALE INTEGRATION:
(MNINTEGR(CGM))
PROXIMITY TO CRIME:
(PVICTION(CGM))
Ebene 1:
Befragte in ihrer
Nachbarschaft
Logit-Regressionskonstante:
Verheiratete weiße Männer
ß1
ALTER (CGM)
ß2
ß0j
Y ij:
Logit
(DVICVIOL)
Abb. 13:
FRAU vs. Mann
Ethnische Minderheit
(MINORITY)
ß3j
ß4
HH-Einkommensklasse
(INCOME(CGM))
ß5
Alleinstehend
(LIVALONE)
ß6
Ausserhäusliche Aktivitäten
(DANGACT(CGM))
Theoriegeleitetes Logit-Zweiebenenmodell zur Erklärung des Viktimisierungsrisikos durch Gewaltdelikte
WiSe 2001/2002
61
Die Schätzgleichungen des logistischen Mehrebenenmodells :
2 a) Logistic Intercept&as&Outcome: β 0 j
β 0 j ' γ 0 0 % γ 0 1 ( ( PMINORI. j& PMINORI.. ) % γ 0 2 ( ( MNINTEGR. j& MNINTEGR.. )
% γ 0 3 ( ( MINCIVIL. j& MINCIVIL.. ) % u 0 j
2 b) Fixed Logistic Slope: β 1 j
β1j ' γ10
2 c) Fixed Logistic Slope: : β 2 j
β2j ' γ20
2 d) Logistic Slope&as&Outcome: β 3 j
2 e) Fixed&Logistic Slopes: β 4 j
β 4 j ' γ40
2 f) Fixed&Logistic Slopes: β 5 j
β 5 j ' γ50
2 g) Fixed&Logistic Slopes: β 6 j
β 6 j ' γ60
Level / Ebene 1: Logistic Within&Context Regression
1) ln
P ( DVICVIOL ' 1)
1 & P ( DVICVIOL ' 1 )
' β 0 j % β 1 j ( ( ALTERì j& ALTER.. ) % β 2 j ( FRAU i j
ij
% β 3 j ( MINORITY i j % β 4 j ( ( INCOME i j& INCOME.. )
% β 5 j ( LIVALONE i j % β 6 j ( ( DANGACT i j& DANGACT.. ) % e i j
Bei dem in Abbildung 13 vorgestellten Mehrebenenmodell handelt es sich in seiner Gänze zwar
um ein wünschenswertes Erklärungsmodell. Die bisherigen Erfahrungen mit der Schätzung
WiSe 2001/2002
62
logistischer Mehrebenenmodelle zeigen aber, dass Modelle mit mehr als zwei Varianzkompenenten kontextabhängiger Effekte („random effects“) kaum identifizierbar sind. Zumeist gelangt
der iterative Lösungsalgorithmus der Maxiumum-Marginal-Likelihood oder des Laplace6Verfahren nicht zu einer konvergierenden Lösung. Dies ist darauf zurückzuführen, dass die
logistischen Within-Context-Regressionen wegen der geringen Fallzahlen der einzelnen Kontexte zumeist sehr instabile logistische Schätzer liefern. Für eine stabile Schätzung der kontextabhängige Effekte benötigen wir aber mindestens zehn Fälle pro „random-effect“ in jeder
einzelnen Kontexteinheit. Ein Blick auf die Verteilung der Anzahl der Befragten innerhalb der
Nachbarschaften offenbart uns in Tabelle 11, dass sie zwischen 13 und 21 Personen schwanken.
Daher können wir höchstens zwei kontextabhängige Effekte in unserem logistischen Mehrebenenmodell schätzen.
Tab.11:
Gültig
Verteilung der Befragtanzahl innerhalb der
300 untersuchten Nachbarschaften
13
14
15
16
17
18
19
20
21
Gesamt
Häufigkeit
1
3
8
26
50
180
23
5
4
300
Prozent
,3
1,0
2,7
8,7
16,7
60,0
7,7
1,7
1,3
100,0
Gültige
Prozente
,3
1,0
2,7
8,7
16,7
60,0
7,7
1,7
1,3
100,0
Kumulierte
Prozente
,3
1,3
4,0
12,7
29,3
89,3
97,0
98,7
100,0
Aus diesem Grunde sind wir gezwungen, unser logistisches Mehrebenenmodell stark zu vereinfachen. Wie den Schätzgleichungen zu entnehmen ist, erklären wir zum einen die Variation der
kontextabhängigen logistischen Regressionskonstante durch die Nachbarschaftsmerkmale
Ethnische Heterogenität, Soziale Integration und den Zeichen des Verfalls. Die logistische
Regressionskonstante ß0j liefert uns den Erwartungswert des Logits der Viktimisierung durch
Gewaltdelikte für weiße, verheiratete Männer im Durchschnittsalter von rd. 49 Jahren, deren
Haushaltseinkommen und außerhäuslichen Aktivitäten dem jeweiligen Gesamtmittelwert
entspricht. Als zweiten „random-effect“ schätzen wir den logistischen Steigungskoeffizienten
ß3j, der für ihre farbigen Nachbarn die Abweichung ihres Logits der Viktimisierung von demjenigen der Referenzgruppe erfasst. Anschließend verwenden wir zur Varianzaufklärung dieses
kontextabhängigen logistischen Steigungskoeffizienten die drei bereits vorgestellten Nachbarschaftsmerkmale. Auf die Kriminalitätsbelastung der Nachbarschaft als exogenes Kontextmerkmal müssen wir verzichten, da wir sie durch Aggregation der selbstberichteten Opfererfahrungen
der Befragten gebildet haben. Hierdurch kreieren wir einen definitorischen Zusammenhang
zwischen der Kriteriumsvariable der logistischen Regression und diesem Kontextmerkmal, der
dazu führt, dass der iterative Schätzalgorithmus keine Konvergenzlösung findet. Daher müssen
auf die „Proximity to Crime“ als kontextuellen Erklärungsfaktor verzichten.
WiSe 2001/2002
63
7. Die Schätzung des Generalized Hierarchical Linear Model mit HLM 5
Um die Mehrebenenmodelle der Arbeitsschritte 2 bis 5 mit HLM 5 schätzen zu können, importieren wir zunächst unsere SPSS-Datendatei „miethewhlm.sav“, die bereits die hierarchische
Datenstruktur enthält. Anschließend spezifizieren wir die einzelnen Mehrebenenmodelle, deren
Schätzgleichungen wir ebenfalls vorstellen.
7.1 Das Importieren von SPSS-Daten in HLM 5
Die Vollversion von HLM 5 beinhaltet eine DMBSCOPY 7-Teillizenz, die es gestattet, aus fast
allen bekannten Statistikprogrammen und Datenbanken Level-1 bis Level-3 Datendateien direkt
zu importieren. In der Studentenversion beschränkt sich der Datenimport auf SPSS, SYSTAT
sowie SAS 5-Transport-Dateien. HLM 5 baut sich selbständig die benötigte hierarchische
Datenstruktur in der „Sufficient-Statistics-Matrix“ (SSM-Datei) auf, wobei für die nichtlinearen
Wahrscheinlichkeitsmodelle die importierten Daten aus ihren Ursprungsdateien mehrfach im
Rahmen der iterativen Lösungen eingelesen werden. Daher sollten Arbeitsgruppen ihre
Sufficient-Statistical-Matrix-Dateien auf demselben gemeinsamen Netzlaufwerk aufbauen, wo
sie auch die ursprünglichen Datendatei abgelegt haben. HLM 5 protokolliert die Rahmen der
menügesteuerten Variablenauswahl benötigten Befehle in einer Response-Kommandodatei, die
intern den Suffix „*.rsp“ erhält. Zusätzlich führt HLM bei der Generierung der hierarchischen
Datenstruktur eine deskriptive Analyse der eingelesenen Variablen durch, wobei es in der Datei
„hlm2ssm.sts“ für die einzelnen Analyseebenen getrennt die zugehörigen Fallzahlen, Mittelwerte, Standardabweichungen, Minima und Maxima protokolliert. Nach der graphischen
Spezifikation der Mehrebenengleichungssystems protokolliert HLM alle zur Schätzung des
Modells benötigten Befehle in einer mit dem Suffix „*.hlm“ versehenen Kommandodatei, deren
Name der Nutzer selbst festlegt. Das gesamt Ausgabeprotokoll speichert HLM in einer mit der
Endung „*.out“ versehenen Datei, deren Name vom Nutzer ebenfalls frei zu wählen ist. Als
zusätzliche Optionen bietet HLM 5 die Möglichkeit an, sich für SPSS, SYSTAT oder SAS
neben den Level-2 Prädiktoren die Residuen der Kleinste-Quadrate- und der „Empirical Bayes“Schätzungen im Sinne ihrer kontextspezifischen Abweichungen von den „fixed effects“ der
Populationsschätzung extern speichern zu lassen. Diese ASCII-Datei enthält neben den für das
Einlesen benötigten Befehlen zusätzlich die auf der Basis der Kontextmerkmale geschätzten
Erwartungswerte („fitted values“) der kontextabhängigen Regressionskoeffizienten der Level-1Gleichung. Auf ihrer Grundlage können wir später beispielsweise in SPSS detaillierte Analysen
der Residuen im Sinne der Identifikation von besonders stark abweichenden Kontexteinheiten
durchführen.7
Um Daten aus SPSS in HLM einzulesen, rufen wir im File-(Datei-) Menü den Unterpunkt
„SSM“ auf, wobei wir die Erstellung einer neuen „Sufficient-Statistics-Matrix“ anfordern, deren
Level-1 und Level-2 Daten wir aus einem anderen Statistikpaket („Stat package input“) einlesen
wollen.
7
Vgl. Raudenbush, Bryk, Cheong&Congdon 2000, S. 41-49
Abb. 14:
Abb. 15:
WiSe 2001/2002
Programminterne Dateiverwaltung von HLM 5
Erstellen einer neuen HLM-SSM-Arbeitsdatei über den
Datenimport aus SPSS
64
WiSe 2001/2002
Nach dem Aufruf der Datenimportoption erwartet
HLM 5 zunächst eine genau Spezifikation der zu erstellten hierarchischen Datenstruktur. Bei Querschnittsanalysen unterscheidet HLM zwischen 2- und
3-Ebenenmodellen („HLM2" bzw. „HLM3"). Für
Wiederholungsmessung bietet HLM ebenfalls 2(„HMLM“) bzw. 3-Ebenenmodelle („HMLM2") an,
die aber ein Set von Dummyvariablen für die einzelAbb. 16:
nen Messzeitpunkte erfordern.
65
Festlegung der Art des zu
schätzenden Mehrebenenmodells
Danach erscheint das eigentlich HLM-Menü für die Erstellung des „SSM-File“, wobei HLM
standardmäßig davon ausgeht, dass die Daten als SPSS, SAS oder SYSTAT-Dateien vorliegen.
Wenn wir die Option „Anything else“ im Auswahlfeld „Input File Type“ wählen, aktivieren wir
das DMBSCOPY-Modul für den Datenimport aus anderen Statistikprogrammen und Datenbanken. Über den „Browse“-Schaltknopf rufen wir das Dateiauswahlmenü für die Level-1 bzw.
Level-2 Ebene auf. HLM kann sowohl die Level-1 und Level-2 Variablen aus getrennten
Dateien mit einer gemeinsamen Kontextkennung also auch aus einer einzigen Datendatei
einlesen, die bereits die zu generierende hierarchische Datenstruktur enthält.
Abb. 17:
Erstellungsmenü für die Auswahl der einzulesenden Level-1 und Level-2Datensätze aus SPSS oder anderen Statistikprogrammen
WiSe 2001/2002
66
Als Level-1-Datei lesen wir unsere SPSS-Datendatei „miethewhlm.sav“ ein, die ebenfalls die
bereits auf der Individualebene gespiegelten Kontextmerkmale enthält.
Abb. 18:
Auswahl des Level-1-SPSS-Datensatzes
Als Kontextkennung oder ID-Variable wählen wir das Merkmal „BLOCKICT“aus, welche die
numerische Straßenblock-im-Census-Tact-Kennung enthält. Als Kontextkennung läßt HLM
sowohl numerische als auch alphanumerische Variablen zu, die maximal zwölf Stellen umfassen
dürfen. Bei letzteren haben wir darauf zu achten, dass in beiden Level-1 und Level-2 Datensätzen die Buchstabenkennung gleichermaßen links oder rechtsbündig eingetragen ist.
Abb. 19:
Auswahl der Kontextkennung und der
Level-1-Variablen
Abb. 20:
WiSe 2001/2002
67
Auswahl weiterer Level-1-Variablen
Die Kontextmerkmale der Nachbarschaft lesen wir ebenfalls aus unserer Datendatei
„miethewhlm.sav“ ein, wobei wir zunächst die Kontextkennung „BLOCKICT“ als ID-Variable
auswählen und anschießend die in die SSM-Datei zu übernehmenden Kontextmerkmale jeweils
durch ein „Häkchen“ markieren.
Abb. 21:
Festlegung der Level-2-Kennung im Level-2Datensatz
Abb. 22:
WiSe 2001/2002
68
Auswahl der Kontextmerkmale im Level-2
Datensatz
Nachdem wir im Importhauptmenü den vollständigen Dateinamen „miethepw.ssm“ und die
absolute Pfadadressierung der SSM-Datei „d:\multilev\hlm5\“ angegeben haben, vereinbaren wir
weiterhin das Vorliegen von „fehlenden Angaben“ bei den Level-1-Variablen. HLM 5 bietet als
Möglichkeiten ihrer Behandlung den fallweisen bzw. paarweisen Ausschluss der zugehörigen
Beobachtungseinheiten an. Bei ersterem schließt HLM alle Fälle bei der Erstellung der SSMDatei aus, die bereits auf einer einzigen Variable einen fehlenden Wert aufweisen. Da wir
verschiedene abhängige Variablen haben, empfiehlt es sich den paarweisen Ausschluss zu
wählen. Hierbei übernimmt HLM zunächst alle Fälle in die SSM-Datei und schließt erst bei den
konkreten Mehrebenenanalyse Fälle mit fehlenden Angaben aus. Für die Ebenen 2 und 3 läßt
HLM nur Kontexteinheiten zu, deren Kontextmerkmale keine fehlenden Angaben aufweisen.
Vor der eigentlichen Erstellung der SSM-Arbeitsdatei, speichern wir die von uns im Importmenü vorgenommenen Einträge und Auswahlen in einer Befehlsdatei, dem sogenannten
„Response-File“. Es empfiehlt sich, bei jeder Generierung einer hierarchischen Datenstruktur
mit HLM eine eigene Kommandodatei anzulegen, die HLM über die Dateiendung „*.rsp“
eindeutig identifiziert. Alternativ zur Vorgehensweise des paarweisen Ausschluß haben wir eine
HLM-Arbeitsdatei „miethelw.ssm“ auf der Basis der fallweisen Eliminierung fehlender Angaben erstellt, deren Steuerdatei unter dem Namen „miethelw.rsp“ gespeichert worden ist.
Bei den späteren Mehrebenenanalysen haben wir darauf zu achten, dass die SSM-Datei und die
zu ihrer Generierung verwendeten SPSS-SAV-Dateien im selben Arbeitsverzeichnis auf dem
lokalen PC bzw. dem Netzlaufwerk liegen, wo der „Sufficient-Statistics-Metafile“zuvor erstellt
worden ist. Bei der Schätzung der „Verallgemeinerten Hierarchischen Linearen Modelle“ liest
WHLM 5 im Rahmen des iterativen Schätzverfahrens mehrfach die ursprünglichen SPSS-Daten.
Abb. 23:
WiSe 2001/2002
69
Vereinbarung des „paarweisen Ausschlusses“ für fehlende Angaben der Level-1Variaben bei der Erstellung der „Sufficient-Statistics-Matrix“ (SSM-Arbeitsdatei)
Abb. 24:
Speicherung der Befehlsdatei (*.rsp) für den
Datenimport und die Generierung der
hierarchischen Datenstruktur in der HLMArbeitsdatei „MIETHEPW.SSM“
Wir starten die Erstellung der SSM-Arbeitsdatei durch das Drücken des Schaltknopfes „Make
SSM“. Nach der Betätigung des Schaltknopf „Check Stats“, ruft HLM 5 im Notespad-Editor
von Windows die Datei „hlm2ssm.sts“ auf, welche deskriptive Statistiken zu den Level-1 und
WiSe 2001/2002
70
Level-2 Variablen enthält. Mit ihrer Hilfe erkennen wir, ob HLM 5 bei der Anforderung der
„Pairwise Deletion“ die fehlenden Angaben der Level-1 Variablen korrekt identifiziert hat. Die
Anzahl gültiger Fälle schwankt hierbei auf der Level-1-Ebene zwischen 4.713 und 5.302
Befragten.
LEVEL-1 DESCRIPTIVE STATISTICS
VARIABLE NAME
PERCRISK
FEARPATT
FEARBURG
FEARWALK
DVICBURG
DVICVIOL
ALTER
AGEGROUP
FRAU
MANN
MINORITY
INCOME
LIVALONE
DANGACT
CARRYVAL
SAFEPREC
EXPGOODS
ASSESS
GBARRIER
CORNER
BUSYPLAC
INCIVILI
INTEGRAT
Q100
Q155
N
5180
5190
5221
5302
5291
5301
5296
5296
5302
5302
5236
4713
5230
5302
5180
5302
5302
5302
5302
5295
5302
5302
5302
5206
5291
MEAN
2.10
1.83
2.16
0.40
0.19
0.05
48.58
4.36
0.50
0.50
0.15
3.35
0.26
0.87
6.29
3.85
2.45
1.22
0.45
0.21
3.44
1.32
3.51
1.78
0.53
SD
0.74
1.09
1.15
0.49
0.39
0.21
17.95
1.72
0.50
0.50
0.36
1.42
0.44
0.81
5.23
1.51
1.46
0.61
0.57
0.41
1.91
1.35
1.81
1.97
0.50
MINIMUM
1.00
1.00
1.00
0.00
0.00
0.00
17.00
1.00
0.00
0.00
0.00
1.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
MAXIMUM
4.00
4.00
4.00
1.00
1.00
1.00
97.00
7.00
1.00
1.00
1.00
7.00
1.00
3.00
16.00
9.00
5.00
2.00
2.00
1.00
9.00
5.00
6.00
7.00
1.00
MINIMUM
0.00
0.00
0.00
0.00
1.44
0.82
1.33
2.17
0.00
0.00
11.11
MAXIMUM
0.25
25.00
93.33
3.33
5.30
7.24
5.31
5.50
55.56
35.71
100.00
VARIABLE NAME
NETHHET
PNETHHET
PMINORI
MINCIVIL
MNINTEGR
MBUSYPLA
MINCOME
MSAFEPRE
PVICBURG
PVICVIOL
PVICTION
N
300
300
300
300
300
300
300
300
300
300
300
MEAN
0.09
9.21
15.51
1.33
3.51
3.45
3.36
3.85
18.97
4.85
59.75
SD
0.08
7.95
19.76
0.70
0.79
1.34
0.66
0.67
11.30
7.24
15.47
Wenn wir die „Listwise Deletion“ anfordern und in der SSM-Datei „miethelw.ssm“ abspeichern, erhalten wir die folgende Kennziffern für die univariaten Verteilungen der Level-1 und
Level-2-Variablen, wobei die zugehörige SSM-Datei 4391 Befragte in 300 Nachbarschaften
umfaßt.
WiSe 2001/2002
71
VARIABLE NAME
PERCRISK
FEARPATT
FEARBURG
FEARWALK
DVICBURG
DVICVIOL
ALTER
AGEGROUP
FRAU
MANN
MINORITY
INCOME
LIVALONE
DANGACT
CARRYVAL
SAFEPREC
EXPGOODS
ASSESS
GBARRIER
CORNER
BUSYPLAC
INCIVILI
INTEGRAT
Q100
Q155
N
4391
4391
4391
4391
4391
4391
4391
4391
4391
4391
4391
4391
4391
4391
4391
4391
4391
4391
4391
4391
4391
4391
4391
4391
4391
MEAN
2.11
1.85
2.17
0.40
0.20
0.05
47.27
4.24
0.49
0.51
0.14
3.38
0.25
0.91
6.39
3.82
2.59
1.23
0.46
0.21
3.49
1.37
3.53
1.87
0.51
SD
0.74
1.09
1.13
0.49
0.40
0.21
17.32
1.67
0.50
0.50
0.35
1.42
0.43
0.82
5.20
1.50
1.41
0.61
0.57
0.41
1.91
1.37
1.82
1.98
0.50
MINIMUM
1.00
1.00
1.00
0.00
0.00
0.00
17.00
1.00
0.00
0.00
0.00
1.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
MAXIMUM
4.00
4.00
4.00
1.00
1.00
1.00
97.00
7.00
1.00
1.00
1.00
7.00
1.00
3.00
16.00
9.00
5.00
2.00
2.00
1.00
9.00
5.00
6.00
7.00
1.00
MINIMUM
0.00
0.00
0.00
0.00
1.44
0.82
1.33
2.17
0.00
0.00
11.11
MAXIMUM
0.25
25.00
93.33
3.33
5.30
7.24
5.31
5.50
55.56
35.71
100.00
VARIABLE NAME
NETHHET
PNETHHET
PMINORI
MINCIVIL
MNINTEGR
MBUSYPLA
MINCOME
MSAFEPRE
PVICBURG
PVICVIOL
PVICTION
N
300
300
300
300
300
300
300
300
300
300
300
MEAN
0.09
9.21
15.51
1.33
3.51
3.45
3.36
3.85
18.97
4.85
59.75
SD
0.08
7.95
19.76
0.70
0.79
1.34
0.66
0.67
11.30
7.24
15.47
Nach der Generierung der SSM-Arbeitsdatei ruft HLM 5 direkt den graphischen Editor für die
Erstellung der Gleichungen für die Binnen- und Zwischenkontextregressionen auf, wobei HLM
die Level-1 und Level-2 Merkmale in getrennten Variablenlisten verwaltet.
7.2 Arbeitsschritt 2: Die Schätzung des Random-Intercept-Only-Logit-Model
Mit Hilfe des Random-Intercept-Only-Logit-Model schätzen wir die Obergrenze der Varianzaufklärung bei der Viktimisierung durch Gewaltdelikte, welche durch die Berücksichtigung der
Kontextzugehörigkeit maximal erzielbar ist. Hierfür benötigen wir die folgenden Schätzgleichungen, die wir mit HLM 5 graphisch spezifizieren.
WiSe 2001/2002
72
Die Schätzgleichungen des Logit&Random&Intercept&Only&Model :
2 ) Logistic Random Intercept: β 0 j
β0j ' γ00 % u0j
1) ln
P ( DVICVIOL ' 1)
' β0j % eij
ij
Im ersten Arbeitsschritt wählen wir die Kriteriumsvariable aus, indem wir mit dem Pfeil der
Computermaus die Variable „DVICVIOL“ auswählen und die linke Maustaste drücken. Sie
erscheint dann in roter Schrift, wobei wir sie im zugehörigen Kontextmenü als „Outcome
Variable“ definieren. Sie gibt uns an, ob der Befragte innerhalb der letzten zwei Jahre Opfer
einer „Gewalttat“ im Sinne eines Raubüberfalls oder einer erlittenen Körperverletzung in der
eigenen Nachbarschaft geworden ist.
Abb. 25:
Auswahl der abhängigen Variablen des 2-Ebenen-Modells im graphischen Editor
für die Spezifikation der „Within-“ und „Between-Context-Regression“Gleichungen
WiSe 2001/2002
73
HLM 5 spezifiziert automatisch ein Random-Intercept-Only-Model, um zu ermitteln, in welchem Ausmaß die Kriteriumsvariable vom untersuchten Kontext abhängt.8 Im linearen Modell
gibt uns die zugehörige Interklassenkorrelation den Varianzanteil der Kriteriumsvariable an, der
maximal durch die Kontextzugehörigkeit des Befragten erklärbar ist. Um das Random-InterceptOnly-Model der logistischen Regression für Individualdaten zu schätzen, müssen wir zunächst
zwei weitere Arbeitsschritte absolvieren. Zuerst rufen wir das „Basic Specification“-Menü von
HLM auf, um dort die wichtigsten Grundeinstellungen vorzunehmen. Hierzu zählen im Bereich
der linearen Mehrebenenmodelle die Obergrenze der Iterationen, das Konvergenzkriterium
sowie die Auswahl des Schätzverfahrens. Zusätzlich legen wir fest, wie HLM verfahren soll,
wenn die Obergrenze der Iterationen ohne Konvergenz überschritten wird oder die Kovarianzmatrix der Level-2-Residuen fast keine Varianz aufweist.
Abb. 26:
8
Automatische Spezifikation des „Random-Intercept-Only-Models“ als
Ausgangsmodell für die Mehrebenenanalyse
Im Gegensatz zur von Busing et.al.(1994) übernommenen Formelnotation bezeichnen
Raudenbush, Bryk, Cheong&Congdon (2001) die Residuen der ersten Ebene mit dem
Buchstaben „r“.
Abb. 27:
WiSe 2001/2002
74
Auswahl des Schätzverfahrens, der Iterationsobergrenze
und Angabe der Ausgabedatei sowie ihrer Titelzeile
Zusätzlich vereinbaren wir neben dem Namen der Ausgabedatei eine Titelzeile zur eindeutigen
Beschreibung des spezifizierten Modells. Darüber hinaus bietet uns HLM 5 die Möglichkeit,
neben den OLS- und Empirical-Bayes-Residuen der kontextspezifischen Schätzer sie selbst als
„fitted values“ sowie eine Auswahl der Kontextvariablen der zweiten Ebene in einer externen
Datei zu speichern. HLM 5 fügt die zum Einlesen in SPSS, SYSTAT oder SAS benötigten
Steuerbefehle selbsttätig ein. Hierzu drücken wir den Schaltkopf „Create Residual File“. Über
die Schaltfläche „Graph Equations“ fordern wir HLM 5 auf, zunächst eine spezielle Datei mit
dem Suffix „*.geq“ anzulegen, in der HLM 5 das Ergebnis der Schätzung der „fixed-effects“
speichert. Nach der Schätzung des Mehrebenenmodells rufen wir über die Option „Graph
Equations“ des Dateimenüs den eigentlichen Grafikeditor auf, der uns die Auswahl der darzustellenden Effekte exogener Individual- und Kontextmerkmale ermöglicht.
Für die Spezifikation des logistischen Regressionsmodells für Individualdaten rufen wir das
„Optional-Specifications“-Menü auf und wählen die Option „Setup Nonlinear Model“. Es dient
dazu, für die erste Analyseebene das logistisches Regressionsmodell mit einer binären, multinomialen oder ordinalen Kriteriumsvariablen anzufordern. Für unser binäres logistisches Regressionsmodell wählen wir die „Bernoulli“-Option. Bei ordinalen oder multinomialen Logitmodellen haben wir zusätzlich die Anzahl der Antwortkategorien der Kriteriumsvariable anzugeben.
Ebenfalls lassen sich dort Poisson- und Negativ-Binomial-Regressionsmodelle für Zählvariablen
mit HLM 5 auf der Basis von Individual- und Aggregatdaten schätzen. Letztere erlauben es, die
Effekte exogener Merkmale auf die Häufigkeit oder Rate seltener Ereignisse zu bestimmen,
wobei das Nichteintretens im Sinne der Nullhäufigkeit einer Linkszensierung entspricht. Bei der
Modellierung von Raten ist zusätzlich die Angabe derjenigen Variablen erforderlich, welche die
Größe der Risikopopulation („exposure“) für die einzelnen Kontexteinheiten enthält.
Abb. 28:
WiSe 2001/2002
Anforderung der logistischen Regression als nichtlinearen
Wahrscheinlichkeitsmodells für die Level-1-Gleichung im
„Optional Specifications“-Menü
Abb. 29:
Auswahl des logistischen Regressionsmodells für
binäre Wahlalternativen mit Individualdaten
(Bernoulli-Modell) mit der Laplace6-Schätzung
75
Abb. 30:
WiSe 2001/2002
76
Speichern der Modellspezifikation in der HLMBefehlsdatei „dvicviolriom.hlm“
Abb. 31:
HLM 5-Aufforderung das
modifizierte RIOM extern zu
speichern
Nach der Konvergenz des Iterativen Schätzverfahrens rufen wir im Datei-Menü die Option
„View Output“ auf, welche das Ausgabeprotokoll im Windows-eigenen Notepad-Editor zur
Bearbeitung öffnet:
Abb. 32:
WiSe 2001/2002
77
Edition der von HLM erstellten Protokolldatei
Die Datei „dvicviolriom.out“ enthält das zum logistischen Random-Intercept-Only-Model
gehörende Ausgabeprotokoll von HLM 5, die hier zunächst ungekürzt dokumentiert wird. Die
Autoren präsentieren zunächst die Kleinste-Quadrate-Lösung der Startschätzung. Hieran
schließen sich die mit PQL und Laplace6 geschätzten „fixed“- und „random-effects“ des
logistischen Regressionsmodells an, wobei die Autoren zwischen der kontextspezifischen und
der Populationsschätzung unterscheiden.
Program:
Authors:
Publisher:
HLM 5 Hierarchical Linear and Nonlinear Modeling
Stephen Raudenbush, Tony Bryk, & Richard Congdon
Scientific Software International, Inc. (c) 2000
[email protected]
www.ssicentral.com
------------------------------------------------------------------------------Module:
HLM2.EXE (5.04.21205.1)
Date:
28 February 2002, Thursday
Time:
15: 7:11
------------------------------------------------------------------------------SPECIFICATIONS FOR THIS NONLINEAR HLM2 RUN
Thu Feb 28 15:07:11 2002
------------------------------------------------------------------------------Problem Title: MIETHE: VIKTIMISIERUNGSRISIKO GEWALTDELIKTE RIOM
The data source for this run = D:\MULTILEV\HLM5\MIETHEPW.SSM
The command file for this run = D:\multilev\hlm5\dvicviolriom.hlm
Output file name
= D:\MULTILEV\HLM5\DVICVIOLRIOM.OUT
The maximum number of level-2 units = 300
The maximum number of micro iterations = 100
Method of estimation: full PQL
Maximum number of macro iterations = 100
Distribution at Level-1: Bernoulli
The outcome variable is DVICVIOL
WiSe 2001/2002
78
The model specified for the fixed effects was:
---------------------------------------------------Level-1
Coefficients
---------------------INTRCPT1, B0
Level-2
Predictors
--------------INTRCPT2, G00
The model specified for the covariance components was:
--------------------------------------------------------Tau dimensions
INTRCPT1
Summary of the model specified (in equation format)
--------------------------------------------------Level-1 Model
Prob(Y=1|B) = P
log[P/(1-P)] = B0
Level-2 Model
B0 = G00 + U0
Level-1 variance = 1/[P(1-P)]
Level-1 OLS regressions
----------------------Level-2 Unit
INTRCPT1
-----------------------------------------------------------------------------11
0.00000
12
0.00000
13
0.05263
21
0.00000
22
0.05556
23
0.00000
31
0.05882
32
0.05556
33
0.00000
41
0.00000
The average OLS level-1 coefficient for INTRCPT1 =
0.04850
Least Squares Estimates
----------------------sigma_squared =
0.04527
Least-squares estimates of fixed effects
---------------------------------------------------------------------------Standard
Fixed Effect
Coefficient
Error
T-ratio
d.f.
P-value
---------------------------------------------------------------------------For
INTRCPT1, B0
INTRCPT2, G00
0.047529
0.002922
16.266
5301
0.000
---------------------------------------------------------------------------The outcome variable is DVICVIOL
Least-squares estimates of fixed effects
(with robust standard errors)
---------------------------------------------------------------------------Standard
Fixed Effect
Coefficient
Error
T-ratio
d.f.
P-value
---------------------------------------------------------------------------For
INTRCPT1, B0
INTRCPT2, G00
0.047529
0.004067
11.685
5301
0.000
----------------------------------------------------------------------------
WiSe 2001/2002
The least-squares likelihood value = 681.914338
Deviance = -1363.82868
Number of estimated parameters =
2
RESULTS FOR LINEAR MODEL WITH THE IDENTITY LINK FUNCTION
Sigma_squared =
Tau
INTRCPT1,B0
0.04528
0.00250
Standard Errors of Tau
INTRCPT1,B0
0.00041
Tau (as correlations)
INTRCPT1,B0 1.000
---------------------------------------------------Random level-1 coefficient
Reliability estimate
---------------------------------------------------INTRCPT1, B0
0.494
---------------------------------------------------The value of the likelihood function at iteration 7 = 7.246404E+002
Estimation of fixed effects: (linear model with identity link function)
---------------------------------------------------------------------------Standard
Approx.
Fixed Effect
Coefficient
Error
T-ratio
d.f.
P-value
---------------------------------------------------------------------------For
INTRCPT1, B0
INTRCPT2, G00
0.047972
0.004111
11.668
299
0.000
---------------------------------------------------------------------------RESULTS FOR NON-LINEAR MODEL WITH THE LOGIT LINK FUNCTION: Unit-Specific Model
(macro iteration 9)
Tau
INTRCPT1,B0
0.69723
INTRCPT1,B0
0.18184
INTRCPT1,B0 1.000
---------------------------------------------------INTRCPT1, B0
0.300
---------------------------------------------------The value of the likelihood function at iteration 2 = -5.544347E+003
Final estimation of fixed effects: (Unit-specific model)
---------------------------------------------------------------------------Standard
Approx.
Fixed Effect
Coefficient
Error
T-ratio
d.f.
P-value
---------------------------------------------------------------------------For
INTRCPT1, B0
INTRCPT2, G00
-3.090842
0.088074
-35.094
299
0.000
----------------------------------------------------------------------------
79
WiSe 2001/2002
Final estimation of variance components:
----------------------------------------------------------------------------Random Effect
Standard
Variance
df
Chi-square P-value
Deviation
Component
----------------------------------------------------------------------------INTRCPT1,
U0
0.83500
0.69723
299
406.80083
0.000
----------------------------------------------------------------------------RESULTS FOR LAPLACE-6 ITERATION 9
Tau
INTRCPT1,B0
0.94148
INTRCPT1,B0
0.26969
INTRCPT1,B0 1.000
---------------------------------------------------INTRCPT1, B0
0.363
---------------------------------------------------The likelihood at Laplace iteration 10 is -4.859557E+003
Final estimation of fixed effects
(Laplace)
---------------------------------------------------------------------------Standard
Approx.
Fixed Effect
Coefficient
Error
T-ratio
d.f.
P-value
---------------------------------------------------------------------------For
INTRCPT1, B0
INTRCPT2, G00
-3.381974
0.130082
-25.999
299
0.000
---------------------------------------------------------------------------Statistics for current covariance components model
-------------------------------------------------Deviance
= 9719.113140
Number of estimated parameters = 2
RESULTS FOR NON-LINEAR MODEL WITH THE LOGIT LINK FUNCTION:
Population Average Model
The value of the likelihood function at iteration 3 = -6.115471E+003
Final estimation of fixed effects: (Population-average model)
---------------------------------------------------------------------------Standard
Approx.
Fixed Effect
Coefficient
Error
T-ratio
d.f.
P-value
---------------------------------------------------------------------------For
INTRCPT1, B0
INTRCPT2, G00
-2.979408
0.089126
-33.429
299
0.000
(Population-average model with robust standard errors)
---------------------------------------------------------------------------Standard
Approx.
Fixed Effect
Coefficient
Error
T-ratio
d.f.
P-value
---------------------------------------------------------------------------For
INTRCPT1, B0
INTRCPT2, G00
-2.979408
0.087965
-33.870
299
0.000
----------------------------------------------------------------------------
80
WiSe 2001/2002
81
HLM 5 protokolliert das auf dem Bildschirm spezifizierte Random-Intercept-Only-Models für
die Schätzung des Viktimisierungsrisikos durch Gewaltdelikte in der Befehlsdatei
„dvicviolriom.hlm“, die wir über das File-Menü mit dem Eintrag „Manually edit command file“
aufrufen.
Abb. 33:
HLM 5 Befehlsdatei für die Schätzung des Random-Intercept-Only-Logit-Modell
mit PQL und Laplace 6
Für die Schätzung des „reinen Nullmodells“ entfernen wir den zur logistischen Regressionskonstanten gehörenden „Fehlerterm“ der zweiten Ebene, indem wir das Kästchen für den „Error
term for currently selected level-2 equation“ anklicken. Hierdurch nehmen wir die zur logistischen Regressionskonstanten gehörende Varianzkomponente aus der Gleichung heraus. HLM
5 schätzt zwar mit PQL das reine Nullmodell im Sinne des kontextübergreifenden durchschnittlichen Risikos der Viktimisierung, aber das Programm gibt für das binäre Logitmodell nicht die
zugehörige Devianz an. Daher können wir keinen globalen Likelihood-Ratio-χ2-Test durchführen, der simultan die „fixed“ und „random-effects“ auf ihre statistische Signifikanz hin prüft.
Für die Berechnung des Intra-Class-Correlation-Koeffizienten verwenden wir die mit Laplace6
geschätzte Varianzkomponente der kontextspezifischen logistischen Regressionskonstanten
„Tau INTRCPT1, B0". Dieses Verfahren unterschätzt im Gegensatz zur PQL-Methode die
Varianz der kontextspezifischen Logitkoeffizienten nicht, wie Raudenbush&Yang (1998)
eindeutig gezeigt haben.
WiSe 2001/2002
82
Berechnung der Intra&Class&Correlaton ρI :
ρI '
τ20
τ
2
% π / 3
2
0
'
0,94148
' 0,2225 . 22,25 %
0,94148 % 3,29
Die Kontextzugehörigkeit der Befragten erklärt maximal 22,25% der Variation der Viktimisierungslogits. Daher ist es erforderlich, ein Mehrebenenmodell mit exogenen Individal- und
Kontextvariablen zu schätzen. Im Vergleich zur explorativen logistischen Regression in Abschnitt 6.1 (Tabelle 6) fällt die Varianzaufklärung etwas niedriger als das ∆-Aldrich&NelsonPseudo-R2 mit Veall&Zimmermann-Korrektur aus. Dies ist darauf zurückzuführen, dass wir im
explorativen Modell bereits die exogenen Individualmerkmale auspartialisiert haben, während
wir im Logit-RIOM ausschließlich den Effekt der Kontextzugehörigkeit ermitteln.
7.3 Arbeitsschritt 3: Schätzung Random-Intercept-Logit-Model mit exogenen
Individualmerkmalen
Wir entwickeln zunächst ein logistisches Regressionsmodell mit ausgewählten Level-1-Prädiktoren , sprich Personenmerkmalen, für die Vorhersage der Viktimisierung durch Gewaltdelikte
innerhalb der eigenen Nachbarschaft. Hierzu benötigen wir die folgenden Schätzgleichungen:
Die Schätzgleichungen des Logit&Random&Intercept&Model : M.1
2 a) Logistic Random Intercept: β 0 j
β0j ' γ00 % u0j
Fixed Logistic Slopes:
2 b)
2 c)
2 d)
2 e)
2 f)
2 g)
β1j
β2j
β3j
β4j
β5j
β6j
'
'
'
'
'
'
γ10
γ20
γ30
γ40
γ50
γ60
1) ln
P ( DVICVIOL ' 1)
ij
WiSe 2001/2002
83
HLM 5 geht per Voreinstellung davon aus, dass alle logistischen Steigungskoeffizienten der
Within-Context-Regression über die Kontexte hinweg variieren dürfen. Im unserem ersten
Alternativmodell M1 verwenden wir zur Vorhersage des Viktimisierungsrisikos durch Gewaltdelikte das Alter (ALTER), Geschlecht (FRAU), den ethnischen Status (MINORITY), die
Einkommensklasse (INCOME), den Single-Indikator (LIVALONE) sowie die Anzahl risikoträchtiger Freizeitaktivitäten des Befragten (DANGACT). Um die logistischen Regressionskonstanten aus inhaltlicher Sicht zu festzulegen, zentrieren wir wie bei der explorativen Analyse das
Lebensalter, die Einkommensklasse sowie die risikoträchtigen Freizeitaktivitäten an ihrem
jeweiligen Gesamtmittelwert. Die kontextspezifische Regressionskonstante schätzt nunmehr das
Logit der Opferwahrscheinlichkeit für die Referenzgruppe der verheirateten weißen Männer im
Durchschnittsalter, die über ein mittleres Einkommen verfügen und sich im durchschnittlichem
Maße Risiken außerhalb ihres Hauses aussetzen. Bei der Auswahl der einzelnen exogenen
Indvidualmerkmale entscheiden wir, ob wir sie unzentriert, group-mean- oder grand-meanzentriert in die Level-1-Gleichung aufnehmen. Am Gruppen-/Kontextmittelwert zentrierte
Individualmerkmale stellt HLM fett dar, während es am Gesamtmittelwert zentrierte Merkmale
zusätzlich kursiv unterlegt. Die nicht-zentrierten exogenen Merkmale erhalten keine zusätzlichen Textattribute. Die zu den exogenen Variablen gehörenden „random-effects“ entfernen wir,
indem wir jeweils mit Hilfe des Schaltkästchen „Error term for currently selected level-2
equation“ den jeweiligen „uk“-Term entfernen. Über die „Save as“-Option des Datei-Menüs
speichern wir die zugehörige Kommandodatei unter dem Dateinamen „dvicviom1.hlm“ extern
ab.
Abb. 34:
Graphische Spezifikation des Alternativmodells 1 mit „random-intercept“
WiSe 2001/2002
84
HLM 5 merkt sich die Spezifikation des logistischen Regressionsmodells für unsere erste Ebene.
Nach dem Programmaufruf über den Menüpunkt „Run Analysis“, fordert uns HLM 5 auf, das
geänderte Mehrebenenmodell von dem eigentlichen Start in einer Befehlsdatei zu speichern. Wir
erhalten das folgende um die OLS-Schätzung und die Populationsschätzung gekürzte Ausgabeprotokoll für das erste Alternativmodell, das mit Modellspezifikation in der Gleichungsform
beginnt. Mit der Schätzung des „Population-average model“ beschäftigen wir uns ausführlich
nach der Diskussion des Alternativmodells M.4.
--------------------------------------------------Level-1 Model
Prob(Y=1|B) = P
log[P/(1-P)] = B0 + B1*(ALTER) + B2*(FRAU) + B3*(MINORITY) + B4*(INCOME)
+ B5*(LIVALONE) + B6*(DANGACT)
Level-2
B0 =
B1 =
B2 =
B3 =
B4 =
B5 =
B6 =
Model
G00 + U0
G10
G20
G30
G40
G50
G60
RESULTS FOR NON-LINEAR MODEL WITH THE LOGIT LINK FUNCTION: Unit-Specific Model
(macro iteration 9)
Tau
INTRCPT1,B0
0.49759
INTRCPT1,B0
0.16334
INTRCPT1,B0 1.000
---------------------------------------------------INTRCPT1, B0
0.235
---------------------------------------------------The value of the likelihood function at iteration 2 = -5.658150E+003
WiSe 2001/2002
---------------------------------------------------------------------------Standard
Approx.
Fixed Effect
Coefficient
Error
T-ratio
d.f.
P-value
---------------------------------------------------------------------------For
INTRCPT1, B0
INTRCPT2, G00
-3.287995
0.132424
-24.829
299
0.000
For
ALTER slope, B1
INTRCPT2, G10
-0.007222
0.004551
-1.587
4384
0.112
For
FRAU slope, B2
INTRCPT2, G20
0.024606
0.147030
0.167
4384
0.867
For MINORITY slope, B3
INTRCPT2, G30
-0.028085
0.207135
-0.136
4384
0.893
For
INCOME slope, B4
INTRCPT2, G40
-0.140200
0.058068
-2.414
4384
0.016
For LIVALONE slope, B5
INTRCPT2, G50
0.453327
0.161461
2.808
4384
0.005
For DANGACT slope, B6
INTRCPT2, G60
0.279542
0.090779
3.079
4384
0.003
---------------------------------------------------------------------------Final estimation of variance components:
----------------------------------------------------------------------------Random Effect
Standard
Variance
df
Chi-square P-value
Deviation
Component
----------------------------------------------------------------------------INTRCPT1,
U0
0.70540
0.49759
299
347.36580
0.028
----------------------------------------------------------------------------RESULTS FOR LAPLACE-6 ITERATION 17
Tau
INTRCPT1,B0
0.64469
INTRCPT1,B0
0.20952
INTRCPT1,B0
1.000
---------------------------------------------------INTRCPT1, B0
0.282
---------------------------------------------------The likelihood at Laplace iteration 18 is -4.843457E+003
(Laplace)
---------------------------------------------------------------------------Standard
Approx.
Fixed Effect
Coefficient
Error
T-ratio
d.f.
P-value
---------------------------------------------------------------------------For
INTRCPT1, B0
INTRCPT2, G00
-3.507118
0.163042
-21.511
299
0.000
For
ALTER slope, B1
INTRCPT2, G10
-0.007577
0.004686
-1.617
4384
0.106
For
FRAU slope, B2
INTRCPT2, G20
0.025334
0.159463
0.159
4384
0.874
INTRCPT2, G30
-0.046630
0.207379
-0.225
4384
0.822
For
INCOME slope, B4
INTRCPT2, G40
-0.140606
0.050116
-2.806
4384
0.005
INTRCPT2, G50
0.456312
0.176947
2.579
4384
0.010
INTRCPT2, G60
0.285527
0.094558
3.020
4384
0.003
----------------------------------------------------------------------------
85
WiSe 2001/2002
86
Statistics for current covariance components model
-------------------------------------------------Deviance
= 9686.914928
Um zu überprüfen, ob die Einbeziehung der exogenen Individualmerkmale zu einer statistisch
bedeutsamen Verbesserung der Vorhersage des Opferrisiko führt, berechnen wir einen partiellen
Likelihood-Ration-χ2 auf der Basis der Devianzen des RIOM und 1.Alternativmodells, wobei
wir von den Ergebnissen der Laplace6-Approximation ausgehen.
Partieller L.R.χ2&Test ' DevianceRIOM & DevianceM.1
' 9.719,11 & 9.686,91 ' 32,20
Anzahl der Freiheitsgrade ' ParameterzahlM.1 & ParameterzahlRIOM ' 8 & 2 ' 6
Kritischer χ2&Wert (F.G.' 6 ; α ' 0,05 ) ' 12,59
Da L.R.χ2 $ χ2kritisch ist; muß H0 verworfen werden !
Die Einbeziehung der exogenen Individualmerkmale führt zu einer signifikanten Verbesserung
der Vorhersage des Risikos, Opfer einer Gewalttat in der eigenen Nachschaft zu werden, da wir
die Nullhypothese des partiellen Likelihood-Ratio-χ2-Tests mit einer Irrtumswahrscheinlichkeit
von weniger als 5 % verwerfen. Um die Verbesserung des Modellfits im Sinne der praktischen
Signifikanz zu bestimmen, berechnen wir das PRE-R2 auf der Basis der vorliegenden Devianzen
des RIOM und Alternativmodells 1.
der Devianzen von RIOM und M.1:
PRE&R 2 '
DevianceRIOM & DevianceM.1
DevianceRIOM
'
9.719,11 & 9.686,91
' 0,0033
9.719,11
Im Vergleich zum Random-Intercept-Only-Model erzielen wir lediglich eine Reduktion der
Devianz um 0,33 %, die somit eher bescheiden ausfällt. Da HLM 5 die Log-Likelihood des
reinen Nullmodell mit der logistischen Regressionskonstanten als „fixed effect“ nicht schätzt,
fällt uns die Grundlage, um die Gesamtanpassung mit Hilfe des Aldrich&Nelson Pseudo-R2 und
seiner von Veall&Zimmermann (1992,1994) vorgeschlagenen Korrektur zu bestimmen.
Formal gesehen berücksichtigt unser Random-Intercept-Logit-Modell M.1 in hinreichendem
Maß bei der Schätzung der fixed-effects die Klumpenbildung der Substichproben auf der
Nachbarschaftsebene. Seine Varianzkomponente σ2u0j ermittelt hierbei die Varianz des Viktimisierungslogits der Referenzgruppe über die 300 Nachbarschaften hinweg. Seine Varianz hat
einen Wert von 0,64 und erweist sich, gemessen am geschätzten Standardfehler von 0,21 gemäß
der Daumenregel für T-Werte, als statistisch signifikant, da dieser Varianzschätzer rd. dreimal
WiSe 2001/2002
87
so groß ist wie sein eigener Standardfehler. Im Vergleich zum gepoolten logistischen WithinContext-Regressionsmodell der explorativen Analyse zeichnen sich sowohl Gemeinsamkeiten
als auch Unterschiede ab. Alle im explorativen Modell signifikanten Effekte der exogenen
Individualmerkmale erweisen sich auch im Logit-Random-Intercept-Modell als statistisch
signifikant, wobei ihre Vorzeichen der Effektrichtung ebenfalls übereinstimmen. Hingegen
fallen ihre Effektstärken im Logit-Random-Intercept-Modell deutlich geringer als im explorativen Logitmodell aus. Der Einfluß der Einkommensklasse sinkt gemessen an seinem Logitschätzer von -0,187 auf -0,141. Der risikoträchtige Effekt des Singledaseins verringert sich von
+0,577 auf +0,456. Gleichermaßen sinkt der Einfluß der außerhäuslichen Aktivitäten von
+0,319 auf +0,286. Ebenfalls verringt sich das durch die logistische Regressionskonstante
geschätzte Logit des Opferrisikos der Referenzgruppe von -3,295 auf -3,507. In beiden Modellen
unterscheiden sich die Logitschätzer des Geschlechtseffekts nur nach der zweiten Kommastelle.
Hingegen wechselt der Logitschätzer für den Effekt des Minderheitenstatus sein Vorzeichen
(+0,115 vs. -0,025), ohne aber die Signifikanzschwelle zu erreichen.
7.4 Arbeitsschritt 4: Schätzung des Random-Logit-Intercept-Random-LogitSlope-Model
Beim zweiten Alternativmodell (M2) schätzen wir zusätzlich die Varianzkomponente des
kontextabhängigen Effektes der „Rassenzugehörigkeit“. Sowohl die logistischen Regressionskonstante als auch der Effekt der „Rassenzugehörigkeit“ dürfen daher im Alternativmodell 2
über die Kontexte hinweg variieren.
Die Schätzgleichungen des Logit&Random&Intercept&Random&Slope&Model : M.2
Logistic Random Intercept: β 0 j
2 a) β 0 j ' γ 0 0 % u 0 j
2 b) β 1 j ' γ 1 0
2 c) β 2 j ' γ 2 0
Random Logistic Slope: β 3 j
2 d) β 3 j ' γ 3 0 % u 3 j
2 e) β 4 j ' γ 4 0
2 f) β 5 j ' γ 5 0
2 g) β 6 j ' γ 6 0
WiSe 2001/2002
88
1) ln
P ( DVICVIOL ' 1)
ij
Um in HLM 5 die Varianzkomponente des Minderheiteneffekts zu schätzen, klicken wir das vor
β3 stehende Kästchen mit der linken Maustaste an, woraufhin HLM den Term u3 in die zugehörige Gleichung einfügt. Seine Varianz erklären wir später mit Hilfe der bereits genannten
Kontextmerkmale der Nachbarschaften.
Abb. 35:
Graphische Spezifikation des Alternativmodells 2 als „random-intercept / randomslope“ Logitmodell
Wir erhalten das folgende ebenfalls um die OLS-Startschätzung und die Populationsschätzung
gekürzte Ausgabeprotokoll, das mit den zu schätzenden Gleichungen der Binnen- und
Zwischen-Kontext-Regressionen beginnt:
WiSe 2001/2002
--------------------------------------------------Level-1 Model
Prob(Y=1|B) = P
Level-2
B0 =
B1 =
B2 =
B3 =
B4 =
B5 =
B6 =
Model
G00 + U0
G10
G20
G30 + U3
G40
G50
G60
(macro iteration 304)
Tau
INTRCPT1,B0
MINORITY,B3
0.61762
-0.43430
-0.43430
0.63817
INTRCPT1,B0
0.19618
MINORITY,B3
0.36002
0.36002
0.81362
INTRCPT1,B0 1.000 -0.692
MINORITY,B3 -0.692 1.000
---------------------------------------------------INTRCPT1, B0
0.236
MINORITY, B3
0.053
---------------------------------------------------Note: The reliability estimates reported above are based on only 212 of 300
units that had sufficient data for computation. Fixed effects and variance
components are based on all the data.
---------------------------------------------------------------------------Standard
Approx.
Fixed Effect
Coefficient
Error
T-ratio
d.f.
P-value
---------------------------------------------------------------------------For
INTRCPT1, B0
INTRCPT2, G00
-3.304502
0.134729
-24.527
299
0.000
For
ALTER slope, B1
INTRCPT2, G10
-0.007119
0.004562
-1.560
4384
0.118
For
FRAU slope, B2
INTRCPT2, G20
0.032845
0.147349
0.223
4384
0.824
INTRCPT2, G30
0.105929
0.210828
0.502
299
0.615
For
INCOME slope, B4
INTRCPT2, G40
-0.138964
0.058142
-2.390
4384
0.017
INTRCPT2, G50
0.449720
0.161965
2.777
4384
0.006
INTRCPT2, G60
0.275432
0.091057
3.025
4384
0.003
----------------------------------------------------------------------------
89
WiSe 2001/2002
----------------------------------------------------------------------------Random Effect
Standard
Variance
df
Chi-square P-value
Deviation
Component
----------------------------------------------------------------------------INTRCPT1,
U0
0.78589
0.61762
211
293.20839
0.000
MINORITY slope, U3
0.79886
0.63817
211
226.05524
0.227
----------------------------------------------------------------------------Note: The chi-square statistics reported above are based on only 212 of 300
RESULTS FOR LAPLACE-6 ITERATION 66
Tau
INTRCPT1,B0
MINORITY,B3
0.84159
-0.59384
-0.59384
0.98301
INTRCPT1,B0
0.27830
MINORITY,B3
0.39799
0.39799
1.08501
INTRCPT1,B0 1.000 -0.653
MINORITY,B3 -0.653 1.000
---------------------------------------------------INTRCPT1, B0
0.293
MINORITY, B3
0.078
The likelihood at Laplace iteration 67 is -4.841572E+003
(Laplace)
---------------------------------------------------------------------------Standard
Approx.
Fixed Effect
Coefficient
Error
T-ratio
d.f.
P-value
---------------------------------------------------------------------------For
INTRCPT1, B0
INTRCPT2, G00
-3.583221
0.176167
-20.340
299
0.000
For
ALTER slope, B1
INTRCPT2, G10
-0.007510
0.004825
-1.556
4384
0.119
For
FRAU slope, B2
INTRCPT2, G20
0.036200
0.163523
0.221
4384
0.825
INTRCPT2, G30
0.130763
0.416451
0.314
299
0.753
For
INCOME slope, B4
INTRCPT2, G40
-0.138806
0.051456
-2.698
4384
0.007
INTRCPT2, G50
0.454781
0.178727
2.545
4384
0.011
INTRCPT2, G60
0.281963
0.099641
2.830
4384
0.005
----------------------------------------------------------------------------
90
WiSe 2001/2002
91
-------------------------------------------------Deviance
= 9683.143038
Der Effekt der Minderheitenzugehörigkeit auf das Viktimisierungsrisiko hat nach der Laplace6Approximation eine kontextübergreifende Varianz von 0,983, die sich gemessen an ihrem
geschätzten Standardfehler von 1,085 als nicht signifikant erweist. Da die Variation der kontextabhängigen Logitschätzer im Vergleich zu den linearen Schätzer der klassischen Mehrebenenanalyse immer deutlich niedriger ausfällt, sollten wir uns davor hüten, diesen „random-effect“
vorschnell aus der weiteren Modellbildung zu eliminieren.
7.5Arbeitsschritt 5:
Schätzung der Coefficient-as-Outcome-Logit-Models
Im Alternativmodell 3 erklären wir die Variation der kontextspezifischen Logitkonstanten und der logistischen Steigung des Minoritäteneffekts durch die beiden
Kontextmerkmale des „Minoritätenanteils in Prozent“ (PMINORI) und der „sozialen Integration“ der Nachbarschaft (MNINTGR), die ebenfalls das Ausmaß der
„informellen sozialen Kontrolle“ erfasst. Ihm liegt das folgende Gleichungssystem zugrunde.
ie Schätzgleichungen des Alternativmodells 3 : M.3
evel / Ebene 2: Between&Context&Regression
a) Logistic Intercept&as&Outcome: β 0 j
β 0 j ' γ 0 0 % γ 0 1 ( ( PMINORI. j& PMINORI.. ) % γ 0 2 ( ( MNINTEGR. j& MNINTEGR.. ) % u 0 j
b) β 1 j ' γ 1 0
c) β 2 j ' γ 2 0
Logistic Slope&as&Outcome: β 3 j
d) β 3 j ' γ 3 0 % γ 3 1 ( ( PMINORI. j& PMINORI.. ) % γ 3 2 ( ( MNINTEGR. j& MNINTEGR.. ) % u 3 j
Fixed&Logistic Slopes:
e) β 4 j ' γ40
f) β 5 j ' γ50
g) β 6 j ' γ60
WiSe 2001/2002
92
1) ln
P ( DVICVIOL ' 1)
ij
Um dieses „Logit-Coefficient-as-Outcome-Model“ in HLM 5 zu spezifizieren,
klicken wir auf das Auswahlmenü der „LEVEL-2 VARS“ und wählen mit der
linken Maustaste das entsprechende Kontextmerkmal aus. HLM 5 bietet uns nun
an, es in die ausgewählte Level-2 Gleichung einzufügen, wobei wir die Entscheidung zwischen seiner Grand-Mean-Zentrierung und keiner Zentrierung zu
treffen haben. Mit Hilfe dieser beiden Optionen bestimmen wir inhaltlich die
Zusammensetzung des Referenzkontextes. Da wir innerhalb der Kontexteinheiten
die Abweichung des Viktimisierungsrisikos „farbiger“ Befragter von ihren weißen Nachbarn schätzen, besteht die Gefahr, dass wir ein reines Artefakt schätzen,
wenn wir den Minderheitenanteil unzentriert als Prädiktor verwenden. In diesem
Fall würden wir die Differenz der Viktimisierungslogits für Farbige und Weiße
schätzen, ohne dass in dieser Nachbarschaft ein Angehöriger ethnischer Minoritäten wohnt. Daher zentrieren wir den Minoritätenanteil an seinem eigenen GrandMean der 300 untersuchten Nachbarschaften. Da eine völlig sozial desintegrierte
Nachbarschaft ebenfalls nicht zu erwarten ist, zentrieren wir die „soziale Integration“ ebenfalls an ihrem Gesamtmittelwert. Die Nichtzentrierung von Level2-Prädiktoren empfiehlt sich nur bei Dummyvariablen als Kontextmerkmalen, da
diese unmittelbar den Niveauunterschied der logistischen Within-Regressionskonstanten zwischen dem Kontext mit vorliegendem Merkmal und einem Vergleichskontext ohne dieses Merkmal erfassen. Bei den kontextabhängigen logistischen
Steigungskoeffizienten („random-effects“) misst der zur „Cross-Level-Interaction“ gehörende γ-Koeffizient unmittelbar den durchschnittlichen Niveauunterschied des zugehörigen Logiteffekts der Dummyvariablen zwischen Kontexten
mit und ohne dieses nominale Level-2-Merkmal.
Abb. 36:
WiSe 2001/2002
93
Auswahl der zur Erklärung der kontextspezifischen Effekte benötigten Level-2Merkmale für das Alternativmodell 3
Im interaktiven Gleichungseditor von HLM erhalten wir dann das folgende
Gleichungssystem mit den zu schätzenden „fixed-“ und „random-effects“:
Abb. 37:
WiSe 2001/2002
94
Spezifikation des Logit-Coefficient-as-Outcome-Model
Unser Vergleichs- oder Referenzkontext besteht aus Nachbarschaften mit einem
durchschnittlichem Minderheitenanteil und einem mittleren Ausmaß an „sozialer
Integration“ bzw. „informeller sozialer Kontrolle“. Die zur „Between-ContextRegression“ gehörende Logitkonstante γ00 erfasst den Erwartungswert des Logits
der Referenzgruppe im dargestellten Referenzkontext. Die Level-2-Logitkonstante γ30 schätzt unmittelbar die Abweichung des Viktimsierungslogits der
„Farbigen“ in diesem Referenzkontext. Die logistischen Steigungskoeffizienten
der 2.Ebene schätzen die Effekte der Kontextmerkmale auf das jeweilige Viktimisierungslogit als Abweichung vom beschriebenen Referenzkontext. Bei ihnen
handelt es sich um die zu schätzenden „Cross-Level-Interactions“ - die eigentlichen „Wechselwirkungseffekte zwischen den Analyse-ebenen“. Sie geben uns
Aufschluss darüber, wie stark das betrachtete Kontextmerkmal jeweils den Effekt
des exogenen Individualmerkmals innerhalb der Level-2-Einheiten moderiert.
Wir erhalten das folgende Ausgabprotokoll für die PQL und Laplace6-Schätzungen des Logit-Mehrebenenmodells:
--------------------------------------------------Level-1 Model
Prob(Y=1|B) = P
WiSe 2001/2002
95
Level-2 Model
B0
B1
B2
B3
B4
B5
B6
=
=
=
=
=
=
=
G00 + G01*(PMINORI) + G02*(MNINTEGR) + U0
G10
G20
G30 + G31*(PMINORI) + G32*(MNINTEGR) + U3
G40
G50
G60
Tau
INTRCPT1,B0
MINORITY,B3
0.51311
-0.25883
-0.25883
0.46174
INTRCPT1,B0
0.18642
MINORITY,B3
0.31394
0.31394
0.75423
INTRCPT1,B0
1.000
MINORITY,B3
-0.532
-0.532
1.000
¶
¶
¶
Kovarianzmatrix der Level-2-Residuen
u0j und u3j
Geschätzte Standardfehler der Level-2
-Residuen
Geschätzte Korrelation zwischen den
Level-2-Residuen der kontextabhängigen logistische Regressionskonstanten
und Steigungskoeffizienten
---------------------------------------------------INTRCPT1, B0
0.217
MINORITY, B3
0.046
---------------------------------------------------------------------------Standard
Approx.
Fixed Effect
Coefficient
Error
T-ratio
d.f.
P-value
---------------------------------------------------------------------------For
INTRCPT1, B0
INTRCPT2, G00
-3.270516
0.135141
-24.201
297
0.000
PMINORI, G01
0.023051
0.004729
4.875
297
0.000
MNINTEGR, G02
-0.335083
0.119264
-2.810
297
0.005
For
ALTER slope, B1
INTRCPT2, G10
-0.003387
0.004707
-0.720
4380
0.472
For
FRAU slope, B2
INTRCPT2, G20
0.048725
0.148400
0.328
4380
0.742
INTRCPT2, G30
0.256896
0.264264
0.972
297
0.331
PMINORI, G31
-0.030507
0.008895
-3.429
297
0.001
MNINTEGR, G32
0.076769
0.256825
0.299
297
0.765
For
INCOME slope, B4
INTRCPT2, G40
-0.092250
0.059491
-1.551
4380
0.121
INTRCPT2, G50
0.352054
0.166611
2.113
4380
0.034
INTRCPT2, G60
0.245427
0.091979
2.668
4380
0.008
----------------------------------------------------------------------------
WiSe 2001/2002
¶
96
Varianzkomponenten der Level-2-Residuen
----------------------------------------------------------------------------Random Effect
Standard
Variance
df
Chi-square P-value
Deviation
Component
----------------------------------------------------------------------------INTRCPT1,
U0
0.71632
0.51311
209
253.50899
0.019
MINORITY slope, U3
0.67951
0.46174
209
168.25300
>.500
Tau
INTRCPT1,B0
MINORITY,B3
0.67027
-0.33890
-0.33890
0.72828
INTRCPT1,B0
0.25121
MINORITY,B3
0.41222
0.41222
1.02497
INTRCPT1,B0
1.000
MINORITY,B3
-0.485
-0.485
1.000
---------------------------------------------------INTRCPT1, B0
0.264
MINORITY, B3
0.069
(Laplace)
---------------------------------------------------------------------------Standard
Approx.
Fixed Effect
Coefficient
Error
T-ratio
d.f.
P-value
---------------------------------------------------------------------------For
INTRCPT1, B0
INTRCPT2, G00
-3.507357
0.178091
-19.694
297
0.000
PMINORI, G01
0.024293
0.005604
4.335
297
0.000
MNINTEGR, G02
-0.368766
0.139684
-2.640
297
0.009
For
ALTER slope, B1
INTRCPT2, G10
-0.003668
0.004991
-0.735
4380
0.462
For
FRAU slope, B2
INTRCPT2, G20
0.051224
0.168590
0.304
4380
0.761
INTRCPT2, G30
0.212570
0.460109
0.462
297
0.644
PMINORI, G31
-0.031763
0.009341
-3.400
297
0.001
MNINTEGR, G32
0.072430
0.299067
0.242
297
0.809
For
INCOME slope, B4
INTRCPT2, G40
-0.091657
0.053443
-1.715
4380
0.086
INTRCPT2, G50
0.355781
0.186651
1.906
4380
0.056
INTRCPT2, G60
0.251391
0.100592
2.499
4380
0.013
----------------------------------------------------------------------------
WiSe 2001/2002
97
-------------------------------------------------Deviance
= 9650.839697
Bevor wir uns der inhaltlichen Interpretation geschätzten γ-Koeffizienten zuwenden, betrachten
wir zunächst die Anpassung unseres logistischen „Coefficient-as-Outcome-Model“ im Sinne
statistischer und praktischer Signifikanz. Hierzu berechnen wir den zugehörigen partiellen
Likelihood-Ratio-χ2-Test und das partielle PRE-R2 im Vergleich zum in Abschnitt 7.3 geschätzten „Random-Intercept-Only“-Logitmodell.
' 9.719,11 & 9.650,84 ' 68,27
PRE&R 2 '
DevianceRIOM
'
9.719,11 & 9.650,84
' 0,007
9.719,11
Mit einer Irrtumswahrscheinlichkeit von weniger als 5%, verwerfen wir die Nullhypothese des
partiellen Likelihood-Ratio-χ2-Tests, die behauptet, dass alle im Vergleich zum RandomIntercept-Only-Modell zusätzlich berücksichtigten exogenen Individual- und Kontextmerkmale
keinen statistischen bedeutsamen Einfluß auf die Vorhersage der Viktimisierungslogits ausüben.
Die entsprechende Reduktion der zugehörigen Devianz fällt mit 0,7 % eher sehr bescheiden aus.
Dieses partielle PRE-R2 liefert eine aber unrealistische Einschätzung der Modellanpassung, da
es nur die Verbesserung des Fits im Vergleich zum maximalen Erklärungsbeitrag der Kontextzugehörigkeit erfasst. Letzterer hat schätzungsweise rd. 22,25% betragen, wie der Intra-KlassenKorrelationskoeffizient des R-I-O-Logitmodell gezeigt hat.
Um die Erklärungsbeiträge der Kontextmerkale im Hinblick auf die kontextabhängigen logistischen Regressionskonstante und den Minderheiteneffekt zu ermitteln, berechnen wir das von
Bryk&Raudenbush (2002, S. 85) vorgeschlagenen Level-2-PRE-R2 für „random-effects“, das
auf der Logik der Proportionalen Fehlerreduktion beruht. Für den als Kriteriumsvariable
betrachteten kontextabhängigen Koeffizienten ermittelt es die durch die Einbeziehung der Level2-Merkmale erzielte Reduktion der Varianzkomponente und setzt sie ins Verhältnis zu seiner
Variation im einfachen „random-coefficient-model“. Dieses Level-2-PRE-R2 ist zwar theore-
WiSe 2001/2002
98
tisch auf den Wertebereich von Null bis Eins begrenzt, aber bei einer hohen Multikollinearität
der Level-2-Prädiktoren können negative Werte auftreten.
Berechnung des Bryk & Raudenbush&R 2 für die Ebene 2 :
Bryk & Raudenbush&R
2
Level 2
'
σ̂ 2uqj ( MRandom Intercept&Slope ) & σ̂ 2uuqj ( MCoefficient as Outcome )
σ̂ 2uqj ( MRandomIntercept&Slope )
Level 2&PRE&R 2 (β 0 j ) '
0,84159 & 0,67027
' 0,2036 ( 100 ' 20,36 %
0,84159
0,98301 & 0,72828
' 0,2591 ( 100 ' 25,91 %
0,98301
Legende:
σ̂ 2u 0 j :
Geschätzte Varianz der Residuen der kontextspezifischen
σ̂
2
u kj :
logistischen Steigungskoeffizienten β kj
MCoefficient as Outcome : Coefficient&as&Outcome&Model mit den Level&2&Kontextvariablen
MRandom Intercept&Slope : Random&Intercept&Random&Slope&Logitmodell ohne Kontextmerkmale
Unsere beiden Nachbarschaftsmerkmale Prozentsatz ethnischer Minoritäten und Ausmaß der
sozialen Integration erklären rd. 20,36% der Variation des Opferrisikos der Referenzgruppe, die
aus weißen verheirateten Männern im Durchschnittsalter mit mittleren Einkommen und Freizeitaktivitäten besteht. Die zu ihnen gehörenden Wechselwirkungseffekte zwischen den Ebenen
erklären rd. 25,91% der Abweichung der Opferwahrscheinlichkeit ihrer „farbigen Nachbarn“.
Diese Begrifflichkeit ist insofern ungenau, da sich die auf die Kontextmerkmale zurückzuführende Varianzaufklärung nicht auf die Wahrscheinlichkeit selbst sondern auf deren geschätztes
Logit bezieht. Beide Kontextmerkmale üben folglich einen hohen praktisch deutsamen Einfluß
auf die differentiellen Opferrisiken der Referenz- und Minderheitengruppen innerhalb der
untersuchten Nachbarschaften aus, den es anhand der geschätzten γ-Koeffizienten der Laplace6Approximation inhaltlich zu bestimmen gilt.
Um die Interpretation des im Alternativmodell 3 geschätzten „fixed-effects“ und „cross-levelinteractions“ zu erleichtern, tragen wir sie in das Gleichungssystem des geschätzten logistischen
Mehrebenenmodells ein und kennzeichnen signifikante Effekt jeweils mit einem Sternchen. Bei
Irrtumswahrscheinlichkeiten zwischen 5 und 10% setzen wir das Sternchen in Klammern.
WiSe 2001/2002
99
chätzgleichungen mit Fixed&Effect&Koeffizienten des Alternativmodells 3 :
β 0 j ' &3,51( % 0,02( ( ( PMINORI.j& PMINORI.. ) & 0,37( ( ( MNINTEGR. j& MNINTEGR.. ) % u 0 j
b) β 1 j ' &0,00
c) β 2 j ' %0,05
d) Logistic Slope&as&Outcome: β 3 j
β 3 j ' %0,21 & 0,03( ( ( PMINORI.j& PMINORI.. ) % 0,07 ( ( MNINTEGR. j& MNINTEGR.. ) % u 3 j
e) β 4 j ' &0,09 (()
f) β 5 j ' %0,36(
g) β 6 j ' %0,25(
evel / Ebene 1: Logistic Within&Context Regression
) ln
P ( DVICVIOL ' 1)
ij
% β 3 j ( MINORITY ij % β 4 j ( ( INCOME ij& INCOME.. )
% β 5 j ( LIVALONE ij % β 6 j ( ( DANGACT ij& DANGACT.. ) % e ij
Der Koeffizient γ00 von -3,51 erfasst das Logit des Opferrisikos der Referenzgruppe im Durchschnittskontext, der durch einen Anteil ethnischer Minoritäten von 15,51 % und einem Ausmaß
der sozialen Integration von 3,51 gekennzeichnet ist. Diesem Logit entspricht ein geschätztes
Opferrisiko von rd. 2,9 %, wie sich leicht anhand der Prognosegleichung der logistischen
Regression berechnen läßt. Pro Prozentpunkt, den sich der Anteil der ethnischen Minoritäten in
der Nachbarschaft erhöht, nimmt das Logit der Referenzgruppe um +0,02 Einheiten zu. Wie
dem T-Test zu entnehmen ist, erweist sich dieser Kontexteffekt als statistisch signifikant. Erhöht
sich aber das Ausmaß der sozialen Integration um eine Einheit, so verringert sich das Logit des
Opferrisikos der Referenzgruppe um -0,37 Einheiten. Dieser Effekt ist ebenfalls statistisch
signifikant, wie der T-Wert von 2,64 belegt. Hingegen üben weder das Alter (γ10) noch das
Geschlecht (γ20) kontextübergreifend einen statistisch bedeutsamen Effekt auf das Opferrisiko
aus, da beide Logitkoeffizienten das übliche Signifikanzniveau weit verfehlen.
Im Durchschnittskontext haben zwar Angehörige ethnischer Minoritäten mit einem Logitkoeffizienten γ30 von +0,21 ein höheres Opferrisiko als ihre weißen Nachbarn. Dieser Effekt ist mit
einem T-Wert von 0,46 statistisch aber nicht signifikant. Erhöht sich hingegen der Minderhei-
WiSe 2001/2002
100
tenanteil der Nachbarschaft, so nimmt ihre geschätzte Abweichung beim Opferlogit (γ31) um
einen Wert von -0,032 pro Prozentpunkt ab. Mit einem T-Wert von -3,40 ist dieser Wechselwirkungseffekt statistisch signifikant. Steigt der Minoritätenanteil um deutlich mehr als 7 %, so
weisen die „Farbigen“ ein deutlich geringeres Opferrisiko als ihre weißen Nachbarn auf.
Hingegen nimmt das Opferrisiko der Farbigen zumindest tendenziell zu, wenn das Ausmaß der
sozialen Integration ansteigt, wie der γ32-Koeffizient von +0,07 belegt. Gemessen an seinem TWert von 0,24 ist er aber nicht statistisch signifikant. Kontextübergreifend sinkt das Opferrisiko,
wenn die Befragten, gemessen an ihrer Einkommensklasse, einer höhereren Schicht angehören.
Der zugehörige Logitkoeffizient γ40 verfehlt mit einem Wert von -0,09 knapp das übliche 5%Signifikanzniveau. Kontextübergreifend erhöhen das Singledasein und außerhäusliche Freizeitaktivitäten das Risiko, Opfer einer Gewalttat zu werden. Der zum Singledasein gehörende
Logitkoeffizient (γ50) verfehlt mit einem Wert von +0,36 sehr knapp die 5%-Schwelle der
Irrtumswahrscheinlichkeit, indiziert aber, dass Alleinstehende ein signifikant höheres Opferrisiko haben die verheirateten Mitglieder der Vergleichsgruppe. Wie dem Logitkoeffizienten (γ60)
von +0,25 zu entnehmen ist, erhöht sich in signifikanten Maße das Risiko, Opfer eines Raubüberfalls oder einer Körperverletzung zu werden, wenn der Befragten verstärkt außerhäuslichen
Freizeitaktivitäten nachgeht.
HLM 5 bietet die Möglichkeit, sich die geschätzten „fixed-effects“ der 2. Ebene graphisch
darzustellen. Dies erleichtert in erheblichen Maße die Interpretation der Wechselwirkungseffekt
zwischen den Analyseebenen. Hierzu rufen wir im Dateimenü die Option „Graph Equations“
auf.
Abb. 38:
Aufruf des Graph Equations-Menüs für die graphische Darstellung der
geschätzten „fixed effects“
Abb. 39:
WiSe 2001/2002
101
Anforderung der geschätzten Viktimisierungswahrscheinlichkeiten
für Minderheiten und Weiße in Abhängigkeit von
Kontextmerkmalen Minoritätenanteil und soziale Integration der
Nachbarschaft
Der Grafikeditor von HLM 5 bietet uns die Möglichkeit, unsere Grafiken interaktiv zu gestalten,
wobei wir die Möglichkeit haben, die Effekte von bis zu drei exogenen Individual- und Kontextmerkmalen auf die Kriteriumsvariable als Liniendiagramme darzustellen. Bei nicht-linearen
Wahrscheinlichkeismodellen wie dem binären, ordinalen oder multinomialen Logit plottet HLM
direkt die geschätzten Wahlwahrscheinlichkeiten in Richtung der Y-Achse. Das entlang XAchse abzubildende Merkmal wählen wir im Optionsfeld „X-focus“ aus, wobei wir uns zwischen den Merkmalen der ersten und zweiten Entscheiden entscheiden müssen. In unserem Fall
wählen wir für die X-Achse die Variable PMINORI, die den Prozentsatz ethnischer Minderheiten in der Nachbarschaft enthält. Im zweiten Auswahlfeld legen wir „For continuous X“ den
Wertebereich unserer Kontextvariablen fest. Voreingestellt ist der Bereich zwischem dem 10und 90er Percentil. Neben dem Interquartilsabstand, dem Mittelwert +/- 2 Standardfehlern steht
uns auch der gesamte Wertebereich von X zur Verfügung. Hierbei haben wir zu beachten, dass
die vor der Schätzung durchgeführten Zentrierungen am Grand-Mean auch für die Grafik gelten.
Über das „Z focus(1)“-Menü wählen wir unser exogenes Individualmerkmal Minoritätenstatus
(MINORITY) aus, wobei HLM 5 selbst feststellt, dass es sich um eine Dummyvariable handelt.
Per Voreinstellung wählt HLM beide Gruppen für die Darstellung der zugehörigen Funktionsscharen aus. Im „Z-focus(2)“-Menü wählen wir als drittes Merkmal das Ausmaß der sozialen
Integration der Nachbarschaft (MNINTEGR) aus, wobei wir uns auf neben dem Median auf die
untere und obere Quartilsgrenze in der Darstellung beschränken. Hierdurch gewährleisten wir
die Übersichtlichkeit unsere Grafik, da sie nur eine Schar von sechs Funktionen enthält, jeweils
drei Integrationsstufen für die Weißen und drei für die „Farbigen“. In den „Choose up to 6"Feldern können wir aber auch für jede unserer Z-Variablen bis zu sechs Funktionswerte vorgeben, die dann als Funktionsscharen gezeichnet werden. Im Menü „Categories / transforms /
WiSe 2001/2002
102
interactions“ können wir für die Ausprägungen unserer nominalen Prädiktoren Werteetiketten
vergeben, die dann HLM als Gruppennamen in die Grafik aufnimmt. Außerdem stellt uns HLM
für metrische Variablen als mathematische Transformationen neben dem natürlichem Logarithmus die e- und quadratische Funktion zur Verfügung. Darüber hinaus können wir dort die
Interaktion der beiden ausgewählten Z-Variablen spezifizieren. Im Auswahlmenü „Ranges /
Titles / Color“ legen wir die Wertebereiche der Y- und X-Achse fest, geben die jeweiligen
Achsenbeschriftungen vor und wählen zwischen der Schwarzweiß- und farbigen Darstellung.
Abb. 40:
Übersicht der Optionen des Grafikeditors von HLM 5
(Raudenbush,Bryk,Cheong&Congdon 2001, S.229)
Abb. 41:
Abb. 42:
WiSe 2001/2002
103
Angabe der Wertebereiche, der
Achsenbeschriftungen sowie des
Abbildungstitels
Graphische Darstellung der geschätzten „Wechselwirkungseffekte zwischen den
Ebenen“ auf das Viktimisierungsrisiko durch Gewaltdelikte
WiSe 2001/2002
104
In Abbildung 42 zeichnet sich deutlich der Wechselwirkungseffekt zwischen der Zugehörigkeit
zur ethnischen Minorität der Befragten und dem Minderheitenanteil der Nachbarschaft in seiner
Wirkung auf das Opferrisiko bei Gewaltdelikten ab. Während für die Weißen der Referenzgruppe mit zunehmenden Minderheitenanteil ihr Opferrisiko stetig steigt (drei oberen blauen
Linien), nimmt vice versa die Opferwahrscheinlichkeit der „Farbigen“ stetig ab (drei unteren
roten Linien). Durch die Unterschiede der sozialen Integration auf der Nachbarschaftsebene wird
dieser negative Wechselwirkungseffekt nur geringfügig moderiert, wobei er seine Richtung
beibehält. Hieraus ist inhaltlich zu schließen, dass in Nachbarschaften mit überdurchschnittlichem Anteil ethnischer Minderheiten das Opferrisko stark ansteigt, wobei vor allem die dort
lebenden Weißen Opfer eines Raubüberfalls oder einer Körperverletzung geworden sind.
Umgekehrt sinkt bei einem unterdurchschnittlichen Anteil ethnischer Minoritäten das Opferrisiko insgesamt, wobei es aber für die dort lebenden Farbigen höher als für ihre weißen Nachbarn
ausfällt.
Wir können die mit WHLM erstellte Grafik mit den Tastenkombinationen STRG c und STRG
v in jedes beliebige Windows-Programm exportieren, wenn wir die Grafik mit dem Mauszeiger
zuvor markiert haben.
Abb. 43:
Speichern der erstellten Grafik als „enhanced (Windows) metafile“ (*.emf)
WiSe 2001/2002
105
Im Alternativmodell 4 berücksichtigen wir als weiteres Kontextmerkmal die „Zeichen des
Verfalls“ der jeweiligen Nachbarschaft und verwenden sie zur Erklärung der Variation der
logistischen Konstanten sowie des Steigungskoeffizienten der Minoritätenzugehörigkeit. Wir
erhalten das folgende Gleichungssystem:
Die Schätzgleichungen des Alternativmodels 4 : M.4
2 b) β 1 j ' γ 1 0
2 c) β 2 j ' γ 2 0
Logistic Slope&as&Outcome: β 3 j
2 d) β 3 j ' γ 3 0 % γ 3 1 ( ( PMINORI. j& PMINORI.. ) % γ 3 2 ( ( MNINTEGR. j& MNINTEGR.. )
2 e) β 4 j ' γ40
2 f) β 5 j ' γ50
2 g) β 6 j ' γ60
1) ln
P ( DVICVIOL ' 1)
ij
Im interaktiven Gleichungseditor von HLM sieht das zu schätzende Gleichungssystem folgendermaßen aus:
Abb. 44:
WiSe 2001/2002
Graphische Spezifikation des Alternativmodells M4 mit den „Zeichen des Verfalls“
als Kontextmerkmal
Wir erhalten das folgende gekürzte Ausgabeprotokoll:
--------------------------------------------------Level-1 Model
Prob(Y=1|B) = P
log[P/(1-P)] = B0 + B1*(ALTER) + B2*(FRAU) + B3*(MINORITY)
+ B4*(INCOME) + B5*(LIVALONE) + B6*(DANGACT)
Level-2
B0 =
B1 =
B2 =
B3 =
B4 =
B5 =
B6 =
106
Model
G00 + G01*(PMINORI) + G02*(MINCIVIL) + G03*(MNINTEGR) + U0
G10
G20
G30 + G31*(PMINORI) + G32*(MINCIVIL) + G33*(MNINTEGR) + U3
G40
G50
G60
Tau
INTRCPT1,B0
MINORITY,B3
0.18353
-0.11654
-0.11654
0.33397
Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse Standard Errors of Tau
INTRCPT1,B0
0.14380
MINORITY,B3
0.27029
INTRCPT1,B0
1.000
MINORITY,B3
-0.471
WiSe 2001/2002
0.27029
0.71413
-0.471
1.000
---------------------------------------------------INTRCPT1, B0
0.091
MINORITY, B3
0.033
---------------------------------------------------------------------------Standard
Approx.
Fixed Effect
Coefficient
Error
T-ratio
d.f.
P-value
---------------------------------------------------------------------------For
INTRCPT1, B0
INTRCPT2, G00
-3.404381
0.138166
-24.640
296
0.000
PMINORI, G01
0.010320
0.004820
2.141
296
0.032
MINCIVIL, G02
1.024933
0.135675
7.554
296
0.000
MNINTEGR, G03
-0.081511
0.116844
-0.698
296
0.485
For
ALTER slope, B1
INTRCPT2, G10
0.000011
0.004727
0.002
4378
0.998
For
FRAU slope, B2
INTRCPT2, G20
0.087578
0.148295
0.591
4378
0.554
INTRCPT2, G30
0.358099
0.280262
1.278
296
0.202
PMINORI, G31
-0.022985
0.009617
-2.390
296
0.017
MINCIVIL, G32
-0.532944
0.322755
-1.651
296
0.098
MNINTEGR, G33
-0.085273
0.265723
-0.321
296
0.748
For
INCOME slope, B4
INTRCPT2, G40
-0.050135
0.059449
-0.843
4378
0.399
INTRCPT2, G50
0.290290
0.166545
1.743
4378
0.081
INTRCPT2, G60
0.189072
0.092482
2.044
4378
0.041
----------------------------------------------------------------------------
----------------------------------------------------------------------------Random Effect
Standard
Variance
df
Chi-square P-value
Deviation
Component
----------------------------------------------------------------------------INTRCPT1,
U0
0.42840
0.18353
208
220.41062
0.264
MINORITY slope, U3
0.57790
0.33397
208
196.59113
>.500
107
WiSe 2001/2002
108
Tau
INTRCPT1,B0
MINORITY,B3
0.21500
-0.12664
-0.12664
0.45844
INTRCPT1,B0
0.20103
MINORITY,B3
0.33321
0.33321
0.97157
INTRCPT1,B0
1.000
MINORITY,B3
-0.403
-0.403
1.000
---------------------------------------------------INTRCPT1, B0
0.104
MINORITY, B3
0.045
(Laplace)
---------------------------------------------------------------------------Standard
Approx.
Fixed Effect
Coefficient
Error
T-ratio
d.f.
P-value
---------------------------------------------------------------------------For
INTRCPT1, B0
INTRCPT2, G00
-3.494678
0.176545
-19.795
296
0.000
PMINORI, G01
0.010460
0.005148
2.032
296
0.042
MINCIVIL, G02
1.044556
0.143394
7.285
296
0.000
MNINTEGR, G03
-0.083892
0.125448
-0.669
296
0.503
For
ALTER slope, B1
INTRCPT2, G10
-0.000119
0.005067
-0.023
4378
0.982
For
FRAU slope, B2
INTRCPT2, G20
0.088024
0.166573
0.528
4378
0.597
INTRCPT2, G30
0.274493
0.477687
0.575
296
0.565
PMINORI, G31
-0.023375
0.010922
-2.140
296
0.032
MINCIVIL, G32
-0.543821
0.342188
-1.589
296
0.112
MNINTEGR, G33
-0.098314
0.328649
-0.299
296
0.765
For
INCOME slope, B4
INTRCPT2, G40
-0.050291
0.054800
-0.918
4378
0.359
INTRCPT2, G50
0.293539
0.187360
1.567
4378
0.117
INTRCPT2, G60
0.192665
0.098673
1.953
4378
0.050
----------------------------------------------------------------------------
-------------------------------------------------Deviance
= 9597.729712
Die Verbesserung gegenüber dem Random-Intercept-Only-Logitmodell beurteilen wir erneut
anhand des partiellen Likelihood-Ratio-χ2-Tests und des partiellen Deviance PRE-R2. Die
festgestellte Devianzreduktion von 1,25 % erweist sich als statistisch signifikant.
WiSe 2001/2002
109
' 9.719,11 & 9.597,73 ' 121,38
PRE&R 2 '
DevianceRIOM
'
9.719,11 & 9.597,73
' 0,0125
9.719,11
Aufschluß über die Erklärungsbeiträge der verwendeten Kontextmerkmale geben uns die beiden
Level-2-PRE-R2 die kontextabhängige logistische Konstante und die Steigung des Minderheitenstatus.
Berechnung des Bryk & Raudenbush&R 2 für die Ebene 2 :
Bryk & Raudenbush&R
2
Level 2
'
0,84159 & 0,21500
' 0,7445 ( 100 ' 74,45 %
0,84159
0,98301 & 0,45844
' 0,5336 ( 100 ' 53,36 %
0,98301
Legende:
σ̂ 2u 0 j :
σ̂
2
u kj :
Die drei Nachbarschaftsmerkmale Prozentsatz ethnischer Minoritäten, Ausmaß sozialer Integration sowie des wahrgenommenen „Verfalls“ (MINCIVIL) erklären rd. 74,45 % der Variation des Opferlogits der Referenzgruppe und rd. 53,36 % der Variation der Abweichung des
Opferlogits der „Farbigen“ innerhalb der Nachbarschaft. Sie sind folglich hervorragend geeignet,
WiSe 2001/2002
110
die Variabilität der kontextabhängigen Effekt zu erklären. Um die Interpretation der geschätzten
fixed-effects zu erleichtern, setzen wir die mit der Laplace6-Approximation geschätzten γKoeffizienten in das zugrunde liegende Gleichungssystem wieder ein, wobei wir sie nach der
zweiten Kommastelle aufrunden und ihre 5 %-Signifikanz mit einem Sternchen markieren. Bei
Irrtumswahrscheinlichkeiten zwischen 5 und 15 % setzen wir das Sternchen wieder in
Klammern. Hierdurch gewinnen wir einen Überblick über die Kontextabhängigkeit des Opferrisikos der Referenzgruppe und ihrer „farbigen“ Nachbarn:
Schätzgleichungen mit Fixed&Effect&Koeffizienten des Alternativmodells 4 :
β 0 j ' &3,49( % 0,01( ( ( PMINORI.j& PMINORI.. ) & 0,08 ( ( MNINTEGR. j& MNINTEGR.. )
% 1,04( ( ( MINCIVIL. j& MINCIVIL.. ) % u 0 j
2 b) β 1 j ' &0,00
2 c) β 2 j ' %0,09
β 3 j ' %0,27 & 0,02( ( ( PMINORI.j& PMINORI.. ) & 0,10 ( ( MNINTEGR. j& MNINTEGR.. )
& 0,54 (() ( ( MINCIVIL.j& MINCIVIL.. ) % u 3 j
2 e) β 4 j ' & 0,05
2 f) β 5 j ' %0,29 (()
2 g) β 6 j ' %0,19(
1) ln
P ( DVICVIOL ' 1)
ij
Für unsere Referenzgruppe der weißen verheirateten Männer im Durchschnittskontext haben wir
ein Logit, Opfer einer Gewalttat zu werden, von -3,49 geschätzt, welches einem Opferrisiko von
rd. 2,96% entspricht. Im Vergleich zum Alternativmodell 4 hat sich die geschätzte Operwahr-
WiSe 2001/2002
111
scheinlichkeit der Referenzgruppe nur unwesentlich verändert. Hingegen halbiert sich der Effekt
des Nachbarschaftsmerkmals Prozentsatz ethnischer Minoritäten auf das geschätzte Opferlogit
der Referenzgruppe. Pro Prozentpunkt farbiger Nachbarn steigt es nur noch um einen Wert von
+0,01, wobei dieser Kontexteffekt statistisch signifikant ist. Nehmen hingegen die „Zeichen des
Verfalls“ um eine Einheit im Vergleich zum Durchschnittskontext , so steigt das Opferlogit der
Vergleichsgruppe um einen Wert von +1,04. Bei einem Zuwachs von mehr als drei Indikatoren
des Verfalls überschreitet das geschätzte Opferrisiko der Referenzgruppe bereits die 50 %
Marke. Dieser Kontexteffekt erweist sich ebenfalls als statistisch bedeutsam. Verglichen mit
dem Alternativmodell 4 büßt das Nachbarschaftsmerkmal Ausmaß der sozialen Integration
seinen Einfluß mit einem γ-Koeffizienten von -0,08 fast vollständig ein und verliert seine
statistische Signifikanz. Hierin spiegelt sich der starke Einfluß der „Zeichen des Verfalls“ wider,
den wir bereits bei den explorativen Analysen der Nachbarschaftsebene identifiziert haben. Das
Ausmaß der sozialen Integration und die „Zeichen des Verfalls“ haben bereits dort mit einem
Koeffizienten von -0,40 negativ miteinander korreliert, wobei die Korrelation ersterer mit der
Gewaltopferrate mit -0,27 nur halb so hoch aus wie diejenige der „Zeichen des Verfalls“ mit
einem Pearsons r von +0,55. Dies erklärt den Einflussverlust des Kontextmerkmals soziale
Integration. Wie im Alternativmodell 3 üben weder das Alter noch das Geschlecht der Befragten einen signifikanten Einfluß auf das Logit der Viktimisierung aus. Beide Effekt sind weder
praktisch noch statistisch bedeutsam. Im Durchschnittskontext steigt zwar das Opferlogit der
„Farbigen“ im Vergleich zu ihren weißen Nachbarn um +0,26 an, aber dieser Gruppenunterschied erweist sich ebenso wie im Modell 4 nicht als statistisch signifikant. Wenn der Prozentsatz der Farbigen um einen Punktwert zunimmt, sinkt der geschätzte Viktimisierungsunterschied
um einen Logitwert von -0,02. Im Vergleich zum Durchschnittskontext unterschreitet ihr
Opferrisiko dasjenige ihrer weißen Nachbarn bereits bei einem Zuwachs um mehr als 15 %.
Diese schon im Modell 4 identifizierte „Cross-Level-Interaction“ ist ebenfalls statistisch
signifikant. Nehmen hingegen die „Zeichen des Verfalls“ um eine Einheit zu, so reduziert sich
das Opferlogit der ethnischer Minoritäten um einen Logitwert von -0,54. Hierdurch sinkt das
geschätzte Risiko der Farbigen, Opfer einer Gewalttat zu werden, deutlich unterhalb desjenigen
ihrer weißen Nachbarn. Mit einer Irrtumswahrscheinlichkeit von rd. 11 % verfehlt dieser
Kontexteffekt die übliche Signifikanzgrenze von 5 %. Ebenso wie im Alternativmodell 4 wirkt
sich das Ausmaß der sozialen Integration nicht statistisch bedeutsam auf den Viktimisierungsunterschied von farbigen und weißen Nachbarn aus, die Tür an Tür leben. Im Vergleich zum
Alternativmodell 4 halbiert sich der kontextübergreifend geschätzte Effekt sozialer Ungleichheit
von -0,09 auf -0,05, wobei er sich als statistisch nicht signifikant erweist. Der ebenfalls kontextübergreifend geschätzte Effekt des Singledaseins erreicht einen um +0,29 höheren Logitwert als
die Referenzgruppe, büßt aber im Vergleich zum Alternativmodell 4 seine statistische Signifikanz ein. Hingegen behauptet sich der Effekt der außerhäuslichen Freizeitaktivitäten auf das
Viktimisierungsrisko bei Gewaltdelikten. Mit einem mit ihm verbundenen Anstieg des Opferlogits um +0,19 Einheiten entpuppt er sich erneut als statistisch signifikant.
Summa summarum zeigt sich, dass die untersuchten Kontextmerkmale Prozentsatz ethnischer
Minoritäten, Ausmaß der sozialen Integration sowie die „Zeichen des Verfalls“ sehr gut dazu
geeignet sind, die Unterschiede der Viktimisierung durch Gewaltdelikte zwischen Farbigen und
ihren weißen Nachbarn zu erklären. Hingegen üben die exogenen Individualmerkmale Alter,
Geschlecht und Einkommensklasse keinen bedeutsamen Einfluß auf die Wahrscheinlichkeit aus,
Opfer einer Gewalttat innerhalb der eigenen Nachbarschaft zu werden. Lediglich das Singledasein als „Lebensstil“ und das Ausmaß an außerhäuslichen Freizeitaktivitäten führen zu einem
zumindest tendenziell signifikant höherem Opferrisiko. Ihr Effekte variieren selbst aber nicht
WiSe 2001/2002
112
bedeutsam über die Nachbarschaften hinweg, wie explorative Analysen im Vorfeld gezeigt
haben.
Für die Vorhersage des Viktimisierungsrisikos auf der Grundgesamtheitsebene, in unserem Falle
aller Nachbarschaften Seattles im Jahre 1990, haben Raudenbush et.al. (2000) das „Population
Average Model“ entwickelt, dessen γ-Koeffizienten sie mit konventioniellen und „robusten“
Standardfehlern präsentieren. Letztere reagieren ihres Erachtens weniger sensitiv auf die
Fehlspezifikation der Kovarianzstruktur zwischen den Ebenen sowie die Verletzung ihrer
Verteilungsannahmen.
RESULTS FOR NON-LINEAR MODEL WITH THE LOGIT LINK FUNCTION:
Population Average Model
Final estimation of fixed effects: (Population-average model)
---------------------------------------------------------------------------Standard
Approx.
Fixed Effect
Coefficient
Error
T-ratio
d.f.
P-value
---------------------------------------------------------------------------For
INTRCPT1, B0
INTRCPT2, G00
-3.384627
0.130059
-26.024
296
0.000
PMINORI, G01
0.010204
0.004729
2.158
296
0.031
MINCIVIL, G02
1.024644
0.131766
7.776
296
0.000
MNINTEGR, G03
-0.083251
0.113775
-0.732
296
0.464
For
ALTER slope, B1
INTRCPT2, G10
-0.000128
0.004513
-0.028
4378
0.978
For
FRAU slope, B2
INTRCPT2, G20
0.085503
0.140690
0.608
4378
0.543
INTRCPT2, G30
0.371528
0.258051
1.440
296
0.150
PMINORI, G31
-0.022621
0.009059
-2.497
296
0.013
MINCIVIL, G32
-0.550148
0.305372
-1.802
296
0.071
MNINTEGR, G33
-0.091648
0.250170
-0.366
296
0.714
For
INCOME slope, B4
INTRCPT2, G40
-0.049054
0.056459
-0.869
4378
0.385
INTRCPT2, G50
0.283468
0.159072
1.782
4378
0.074
INTRCPT2, G60
0.187070
0.087936
2.127
4378
0.033
(Population-average model with robust standard errors)
---------------------------------------------------------------------------Standard
Approx.
Fixed Effect
Coefficient
Error
T-ratio
d.f.
P-value
---------------------------------------------------------------------------For
INTRCPT1, B0
INTRCPT2, G00
-3.384627
0.109568
-30.891
296
0.000
PMINORI, G01
0.010204
0.004606
2.215
296
0.027
MINCIVIL, G02
1.024644
0.128331
7.984
296
0.000
MNINTEGR, G03
-0.083251
0.105999
-0.785
296
0.432
For
ALTER slope, B1
INTRCPT2, G10
-0.000128
0.004392
-0.029
4378
0.977
For
FRAU slope, B2
INTRCPT2, G20
0.085503
0.126685
0.675
4378
0.500
INTRCPT2, G30
0.371528
0.233490
1.591
296
0.111
PMINORI, G31
-0.022621
0.008420
-2.687
296
0.008
MINCIVIL, G32
-0.550148
0.301488
-1.825
296
0.068
MNINTEGR, G33
-0.091648
0.217278
-0.422
296
0.673
For
INCOME slope, B4
INTRCPT2, G40
-0.049054
0.061167
-0.802
4378
0.423
INTRCPT2, G50
0.283468
0.151276
1.874
4378
0.060
INTRCPT2, G60
0.187070
0.082750
2.261
4378
0.024
----------------------------------------------------------------------------
WiSe 2001/2002
113
Um die Interpretation zu erleichtern, setzen wir wieder die γ-Koeffizienten des PopulationAverage-Model in das zugehörige Gleichungssystem ein und weisen die Signifikanzen auf der
Grundlage der „robusten Standardfehler“ jeweils mit enem Sternchen bei höchstens 5% bzw.
einem eingeklammerten Sternchen für den Bereich zwischen 5 und 15% aus.
Schätzgleichungen des Population Average Model ( M.4 ) mit robusten Standardfehlern:
β 0 j ' &3,38( % 0,01( ( ( PMINORI.j& PMINORI.. ) & 0,08 ( ( MNINTEGR. j& MNINTEGR.. )
% 1,02( ( ( MINCIVIL. j& MINCIVIL.. )
2 b) β 1 j ' &0,00
2 c) β 2 j ' %0,09
β 3 j ' %0,37 (() & 0,02( ( ( PMINORI. j& PMINORI.. ) & 0,09 ( ( MNINTEGR.j& MNINTEGR.. )
& 0,55 (() ( ( MINCIVIL.j& MINCIVIL.. )
2 e) β 4 j ' & 0,05
2 f) β 5 j ' %0,28 (()
2 g) β 6 j ' %0,19(
1) ln
P ( DVICVIOL ' 1)
ij
Im Vergleich zu unser kontextspezifischen Analyse („Unit-specific model“) des Alternativmodells 4 mit der Laplace6-Approximation weist das Grundgesamtheitsmodell („PopulationAverage-Model“) weder im Bereich der γ-Koeffizienten noch der identifizierten Signifikanzen
bedeutsame Unterschiede auf. Bis auf die zweite Kommastelle entsprechen sich die γ-Koeffizienten beider Modelle weitgehend, wobei die Signifikanzeinschätzung auf der Basis „robuster
Standardfehler“ zu keiner neuen Bewertung führt. Dies dürfte daran liegen, dass unsere Studie
WiSe 2001/2002
114
mit 300 untersuchten Nachbarschaften mit durchschnittlich rd. 18 Befragten eine ausreichende
Stichprobengröße für die Schätzung der Kontexteffekt und ihrer Wechselwirkungen bereitstellt.
Die relative geringe Anzahl von Befragten innerhalb der einzelnen Nachbarschaften reicht für
eine Schätzung weiterer kontextabhängiger Effekt exogener Individualmerkmale nicht aus, da
wir gemäß der Daumenregel von Long (1997, S. 54) mindestens 10 Fälle pro Logitschätzer der
Within-Regression benötigen.
8. Schätzung des logistischen Zweiebenenmodells mit dem Freeware-Programm
MIXOR
Die beiden an der Univeristy of Illionois at Chicago tätigen Biometriker Hedeker&Gibbons
haben das von ihnen entwickelte DOS-Extender Programm MIXOR zur Schätzung von logistischen Zweiebenenmodell 1996 erstmals der Fachöffentlichkeit vorgestellt. Seine Version 2, die
über eine Windows-basierte Bedienungsoberfläche verfügt, kann der interessierte Leser sich
über die folgende Internetadresse beschaffen: url://www.uic.edu/~Hedeker/mixwin.html. Dort
findet er neben Patchen zu Windows XP ein Handbuch und einführende Literatur als PDFDateien.
MIXOR gehört zu einer umfangreichen Familie von Zweiebenenmodellen, die Hedeker &
Gibbon (1999) als „Random-Regression-Models“ bezeichnen. Sie haben Zweiebenenmodelle
für metrische, binäre, ordinale und multinomiale Kriteriumsvariablen entwickelt. Hinzu kommt
noch ein Poisson-Regressionsmodell für Zählvariablen mit zu schätzenden Varianzkomponenten. Da es sich beim binären Logit um einen Spezialfall des ordinalen, kumulativen Logits
handelt, welches in der Biometrie unter der Bezeichnung „Proportional Odds Model“9 firmiert,
wenden wir uns kurz seiner spezifischen Schätzgleichung zu.
Vereinfachte Schätzgleichung des ordinalen, kumulativen Logits:
ˆ
Logit
K
P (Y # j )
P (Y # j )
ˆ
' Logit
' µ j & Σ βk xki
1 & P (Y # j )
P(Y > j)
k ' 0
Restriktion: 1) µ 1 ' 0
2) βk ist für alle Schwellenübergänge identisch
Legende:
i :
k :
j :
µj :
Fälle
Unabhängige Variablen
Betrachtete Kategorie des ordinalen Indikators Y
Zur Ausprägung Y j gehörende Schwellenwert von Y (
Das kumulative Logit geht von der Messannahme, dass es sich bei der ordinalen Kriteriumsvariable Y um eine ungenaue Erhebung einer sich dahinter verbergenden latenten Variable Y*
9
S. in der Biometrie: McCullagh (1980); McCullagh&Nelder (19892, S. 151 ff.); in den
Sozialwissenschaften: McKelvey&Zavoina (1975), Greene (20035, S. 736 ff.)
WiSe 2001/2002
115
handelt, die als Verteilung entweder der logistischen oder Normalverteilungsdichte folgt. Die
Kategorien der Indikatorvariablen Y markieren hierbei die Übergänge auf dieser latenten
Variable im Sinne von Schwellenwerten. Unter den Annahmen, dass erstens der erste Schwellenwert Null sei und zweitens dass die Effekte der exogenen Merkmale für alle Übergänge
gleich seien, schätzt MIXOR jeweils das kumulative Logit der Wahrscheinlichkeiten höchsten
die betrachtete Schwelle zu erreichen vs. sie zu überspringen. Im Vergleich zum klassischen
Logitmodell vertauscht das kumulative Logit zwar Zähler und Nenner, wobei beide gleichermaßen den ersten Schwellenwert auf Null fixieren. Durch die Substraktion des linearen Prädiktors
modellieren wir aber die Wahrscheinlichkeit, den vorgegebenen Schwellenwert der ordinalen
Indikatorvariablen zu überschreiten. Aufgrund der ersten Restriktion können wir ein logistischen
Regressionsmodell für binäre Wahlalternativen schätzen, das eine Regressionskonstante für das
Logit der Referenzgruppe bei Dummykodierung enthält und als reines „fixed-effect“-Modell
identische Schätzer wie die logistische Regression in SPSS liefert. Im ordinalen Fall entspricht
die in MIXOR gewählte Voreinstellung der Parametrisierung von McKelvey & Zavaoina (1975),
die ebenfalls Greene (2003) für sein Programm LIMDEP gewählt hat. Sie liegt ebenfalls dem
verallgemeinerten hierarchisch linearen Modell des Programms HLM 5 zugrunde. Hingegen
erfordert die von McCullagh (1980) für sein Programm PLUM entwickelte Parametrisierung des
frei zu schätzenden ersten Schwellenwerts, dass wir für jede Ausprägung einer nominalen
exogenen Variablen eine eigene Dummyvariable im Modell angeben. Diese spezielle Form des
„Proportional Odds Model“ ist in SPSS seit der Version 10.0 unter der Bezeichnung PLUM
implementiert.
Im Gegensatz zu HLM 5 handelt es sich bei MIXOR um ein übersetztes FORTRAN 77-Programm, dessen Steuerung und Modellspezifikation ursprünglich über fünf „Lochkarten“ bzw.
Kommandozeilen erfolgt ist. Seine Version 2 stellt uns fünf Menüs zur Verfügung, die dem
Einlesen der Daten, der Modellauswahl sowie seiner Spezifikation dienen. MIXOR führt erstens
keine Zentrierungen der exogenen Individual- und Kontextmerkmale durch und bildet zweitens
nicht die zu den Wechselwirkungseffekten gehörenden Interaktionsterme zwischen den zugehörigen Individual- und Kontextmerkmalen. Beides müssen wir zuvor in einem Statistikpaket
wie SPSS oder STATA durchführen und als ASCII-Rohdaten herausschreiben, wobei wir für die
fehlenden Werte Codes wie „9" für einstellige und „99" für mehrstellige Variabeln selbst zu
vergeben haben. Wir können sie später als fehlende Angaben in MIXOR vereinbaren, so dass
das Programm entsprechend einen fallweisen Ausschluß der zugehörigen Beobachtungen
selbständig ausführt. Außerdem bildet MIXOR nicht selbständig den Vektor der Einsen, den wir
für die Schätzung der Regressionskonstanten im Verallgemeinerten Linearen Modell benötigen.
Letzten erstellen wir daher ebenfalls in SPSS mit einer Compute-Anweisung.
Hedeker&Gibbons (1996, S.7ff.) haben zur Approximation der exakten Maximum-LikelihoodLösung die Maximum-Marginal-Likelihood-Schätzung entwickelt, die basierend auf dem
Fisher-Scoring-Algorithmus eine Gauss-Hermite-Quadratur zur Lösung der mehrdimensionalen
Integrale verwendet, die zu den Varianzkomponenten gehören. Der Vorteil ihres Schätzverfahrens besteht darin, dass es die geschätzte Log-Likelihood oder Devianz (-2*LnL) für das
Nullmodell berechnet, welches nur die logistische Regressionskonstante als „fixed effect“
enthält. Dies versetzt uns in die Lage, einen globalen Likelihood-Ratio-χ2-Test für alle geschätzten „fixed“ und „random effect“ gleichzeitig durchzuführen. Außerdem liefert es uns
hierdurch die Grundlage für die Berechnung diverser Pseudo-R2, welche auf der Log-Likelihood
des Nullmodells basieren.
Mit MIXOR können wir maximal 8 Varianzkomponenten schätzen, wobei die Anzahl der
exogenen Individual- und Kontextmerkmale 40 nicht überschreiten darf. Die Anzahl der
WiSe 2001/2002
116
analysierbaren Fälle hängt allein von der Größe der Hauptspeichers des PCs ab. Das MIXORÄquivalent zum Alternativmodell 5 mit 5301 Fällen ließ sich problemlos im Rahmen eines
Testlaufs auf einem PIII-500-PC mit 128 MB Hauptspeicher schätzen.
8.1Aufbereitung der Miethe-Viktimisierungsdaten in SPSS
Da MIXOR weder Zentrierungen selbst durchführt noch die für die Cross-Level-Effekte benötigen Interaktionsterme selbst bildet, müssen wir die drei genannten Arbeitsschritte zuvor in SPSS
durchführen und die Daten anschließend als ASCII-Rohdatensatz herausschreiben. Hierbei
haben wir zu beachten, dass MIXOR als amerikanisches Programm den Punkt als Dezimaltrenner verwendet.
* Aufbereitung der „miethe.sav“-Daten fuer die MIXOR-Analysen.
* Einlesen der Gesamtdatei.
GET
FILE='D:\LEHRE\METH6W2K\multilev\miethe\SPSSFWIN\miethe.sav'.
recode frau (1=1) (2=0).
value labels frau 1 'Frau' 0 'Mann'.
freq /variables=frau.
recode minority (1=1) (2=0).
value labels minority 1 'Black, others' 0 'White'.
freq /variables=minority.
* Konstruktion der Indizes fuer Multi-Level-Analysis mit ordinalen A.V.s.
recode q166 (1=1) (2=2) (3=3) (4=4) (9=9) into fearpatt.
recode q167 (1=1) (2=2) (3=3) (4=4) (9=9) into fearburg.
recode q76 (0=0) (1=1) (9=9) into fearwalk.
recode q77 (1=1) (2=2) (3=3) (4=4) (9=9) into percrisk.
var labels fearpatt 'Furcht vor taetl.Angriff/Koerperletzung'/
fearburg 'Furcht vor Einbruch in eigenes Haus/Wohnung'/
fearwalk 'Furcht nachts allein durch die Nachbarschaft zu gehen'/
percrisk 'Subjektives Sicherheitsgefuehl in eigener Nachbarschaft'.
value labels fearpatt 1 'weniger als 1-mal pro Monat' 2 '1-mal im Monat' 3 '1-mal in der Woche'
4 'jeden Tag'/
fearburg 1 'weniger als 1-mal pro Monat' 2 '1-mal im Monat' 3 '1-mal in der Woche' 4 'jeden Tag'/
fearwalk 1 'ja' 0 'nein' /
percrisk 1 'sehr sicher' 2 'ziemlich sicher' 3 'ziemlich unsicher' 4 'sehr unsicher'.
* Recodierung der fehlenden Angaben auf den Wert „9" für einstellige Variablen.
missing values fearpatt fearburg fearwalk percrisk (9).
freq /variables=fearpatt to percrisk.
recode frau,minority (SYSMIS=9).
missing values frau, minority (9).
freq /variables=frau minority.
recode dvicburg (SYSMIS=9).
recode dvicviol (SYSMIS=9).
missing values dvicburg,dvicviol (9).
freq /variables=dvicburg,dvicviol.
WiSe 2001/2002
117
* Aufbereitung der Nachbarschaftsindikatoren als GRAND-MEAN-CENTERED Variablen.
* Zentrierung am Mittelwert der Gesamtstichprobe.
compute ngmcethh=nethhet - 9.11.
compute ngmcpmin=(aminori - 0.1515)*100.
compute ngmcbusy=mbusypla - 3.4427.
compute ngmcintg=mnintegr - 3.5140.
compute ngmcinci=mincivil - 1.3240.
compute ngmcburg=(avicburg - 0.1879)*100.
compute ngmcviol=(avicviol - 0.0475)*100.
var labels ngmcethh 'Nachbarschaft (GMC): Ethnische Heterogenitaet' /
ngmcpmin 'Nachbarschaft (GMC): Prozentsatz ethnischer Minoritaeten'/
ngmcbusy 'Nachbarschaft (GMC): Mittlere soziale Dichte'/
ngmcintg 'Nachbarschaft (GMC): Mittelwert soziale Integration'/
ngmcinci 'Nachbarschaft (GMC): Mittelwert Zeichen des Verfalls'/
ngmcburg 'Nachbarschaft (GMC): Prozent Einbruchsopfer i.l.2 J.'/
ngmcviol 'Nachbarschaft (GMC): Prozent Gewaltopfer i.l.2 J.'.
* Bildung der Interaktionseffekte: MINORITY mit NGMCPMIN,NGMCINTG,NGMCINCI.
compute iminpmin=minority*ngmcpmin.
compute iminintg=minority*ngmcintg.
compute imininci=minority*ngmcinci.
execute.
* Erstellung des Einservektors für die Regressionskonstante in MIXOR.
compute one=1.
* Rekodierung der „fehlenden Werte“ der mehrstelligen Kontextvariablen „99".
recode ngmcethh,ngmcpmin,ngmcbusy,ngmcintg,ngmcinci,ngmcburg,ngmcviol,
iminpmin,iminintg,imininci gmcalter gmcincom gmcdanga gmccarry gmcsafep gmcegood gmcgbarr
gmcasses (SYSMIS=99).
missing values ngmcethh,ngmcpmin,ngmcbusy,ngmcintg,ngmcinci,ngmcburg,ngmcviol, gmcalter
gmcincom gmcdanga gmccarry gmcsafep gmcegood gmcgbarr gmcasses
iminpmin,iminintg,imininci (99).
freq /variables= ngmcethh,ngmcpmin,ngmcbusy,ngmcintg,ngmcinci,ngmcburg,ngmcviol,gmcalter,
gmcincom,gmcdanga,gmccarry,gmcsafep,gmcegood,gmcgbarr,gmcasses,one .
recode livalone corner (SYSMIS=9).
missing values livalone corner (9).
freq /variables=livalone corner.
* Umstellung auf den Punkt als Dezimaltrenner.
set decimal=dot.
* Herausschreiben des aufbereiteten ASCII-Rohdatensatz: MIETHE3.DAT.
write outfile='D:\LEHRE\METH6W2K\multilev\miethe\SPSSFWIN\miethe3.dat' table
/ blockict probnr one fearpatt fearburg fearwalk percrisk dvicburg dvicviol frau minority gmcalter
gmcincom gmcdanga gmccarry gmcsafep gmcegood gmcgbarr gmcasses corner livalone ngmcbusy
ngmcinci ngmcintg ngmcpmin ngmcethh ngmcburg ngmcviol iminpmin,iminintg,imininci
(F4.0,1X,F5.0,1X,9(F1.0,1X), 8(F8.4,2X), 2(F1.0,1X),10(F9.4,1X)) .
execute.
WiSe 2001/2002
118
Mit Hilfe der Table-Option des Write-Befehls von SPSS erhalten wir einen Auflistung der in die
Datei „miethe3.dat“ herausgeschriebenen Variablen einschließlich ihrer Spaltenangaben. Diese
Übersicht benötigen wir, um später in MIXOR über die zugehörige Variablennummer die
entsprechenden Merkmale im Modell als endogene oder exogene Variablen zu spezifizieren und
ihre fehlenden Werte zu vereinbaren. Daher ist es erforderlich, das SPSS-Ausgabeprotokoll um
die Angabe der Variablennummer zu ergänzen.
Write will generate the following
Nr. Variable
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
BLOCKICT
PROBNR
ONE
FEARPATT
FEARBURG
FEARWALK
PERCRISK
DVICBURG
DVICVIOL
FRAU
MINORITY
GMCALTER
GMCINCOM
GMCDANGA
GMCCARRY
GMCSAFEP
GMCEGOOD
GMCGBARR
GMCASSES
CORNER
LIVALONE
NGMCBUSY
NGMCINCI
NGMCINTG
NGMCPMIN
NGMCETHH
NGMCBURG
NGMCVIOL
IMINPMIN
IMININTG
IMININCI
Rec
Start
End
Format
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
6
12
14
16
18
20
22
24
26
28
30
40
50
60
70
80
90
100
110
112
114
124
134
144
154
164
174
184
194
204
4
10
12
14
16
18
20
22
24
26
28
37
47
57
67
77
87
97
107
110
112
122
132
142
152
162
172
182
192
202
212
F4.0
F5.0
F1.0
F1.0
F1.0
F1.0
F1.0
F1.0
F1.0
F1.0
F1.0
F8.4
F8.4
F8.4
F8.4
F8.4
F8.4
F8.4
F8.4
F1.0
F1.0
F9.4
F9.4
F9.4
F9.4
F9.4
F9.4
F9.4
F9.4
F9.4
F9.4
Die „miethe3.dat“-Datei weist die folgende hierarchische Datenstruktur auf, bei der die Fälle
innerhalb ihrer Nachbarschaft geschachtelt sind. Aus Platzgründen stellt das Bildschirmfenster
des Programmer‘s File Editor nur jeweils 80 von insgesamt 212 Spalten dar. Die erste Spalte
enthält die Level-2-Nachbarschaftskennung, die zweite die Probandennummer, gefolgt vom
Vektor der Einsen sowie den ordinalen bzw. binären Kriteriumsvariablen zur Risikoeinschätzung, Furcht vor Kriminalität sowie den eigenen Opfererfahrungen. Danach schließen sich die
zuvor Grand-Mean-zentrierten exogenen Individual- und Kontextmerkmale an.
Abb. 45:
WiSe 2001/2002
119
Hierarchische Datenstruktur der für MIXOR aufbereiteten Miethe-Daten
(miethe3.dat)
8.2Schätzung des Fixed-Logit-Intercept-Modells mit MIXOR
Für die Berechnung des globalen Likelihood-Ratio-χ2-Tests und diverser Pseudo-R2 benötigen
wir die Log-Likelihood bzw. Deviance des logistischen Nullmodells, welches nur die Regressionskonstante als „fixed effect“ enthält. Mit ihm schätzen wir kontextübergreifend das Logit
der Wahrscheinlichkeit, Opfer eines Raubüberfalls oder einer Körperverletzung zu werden.
Nach dem Aufruf von MIXOR steht uns dessen in Abb. 46 gezeigtes Hauptmenü zur Verfügung.
MIXOR bietet uns die Möglichkeit, zwei maximal 60 Zeichen lange Titelzeilen zu definieren,
mit denen es später das Ausgabeprotokoll kommentiert. Während die erste Zeile die näheren
Angaben zum Datensatz enthält, dokumentiert die zweite Zeilen den geschätzten Modelltypus.
MIXOR unterscheidet drei Arten von Dateitypen, die es für seinen Ablauf benötigt. Der „Definition File Name:“ enthält als Kommandodatei alle zur Steuerung von MIXOR und zur
Modellspezifikation benötigten Befehle in der für FORTRAN-Programme üblichen Kurzform,
die noch aus den Zeitalter der Lochkarten stammend, in bestimmten Spaltenbereichen Zahlenoder Buchstabenangaben erwartet. In dieser speziellen Kommandodatei legt MIXOR alle
relevanten Befehle aus den Steuermenüs ab, so dass wir diese Datei jederzeit per doppelten
linken Mausklick aus dem Dateimenü auswählen und über die Bedienungsmenüs verändern
können. Über das Eingabefeld „Input File Name:“ geben wir die einzulesende ASCII-Rohdatendatei an, welche die Variablen jeweils getrennt durch ein Leerzeichen enthält. Die Anzahl
der im Datensatz enthaltenen Variablen spezifizieren wir im Feld „Number of Data Fields“.
WiSe 2001/2002
120
Diejenige Variable, welche die Kontextkennung der Level-2-Einheiten enthält, geben wir über
ihre Ordnungs-/Spaltennummer im Feld „Field for Level-2-Units:“ an. In unserem Fall handelt
es sich um die erste Variable des Rohdatensatzes. Auf einen Ausdruck der Messwerte der
Kontexteinheiten verzichten wir, indem wir im Feld „Level-2 Units to List:“ den Wert Null
eintragen. MIXOR bietet die Möglichkeit, die Level-2-Einheit über eine Designvariable zu
gewichten, die über eine nachträgliche Randanpassung an die Grundgesamtheit die Repräsentativität der Kontexteinheiten oder bei Messwiederholungen der Personen im Nachhinein garantieren soll. Hierzu wählen wir im Feld „Unit Weighting:“ die Option „differential“ anstatt der
Voreinstellung „equal“. MIXOR fordert dann die Angabe der Gewichtungsvariable über ihre
zugehörige Ordnungs-/Spaltennummer an. Über das Feld „Function Model“ bietet die MIXOR
die Möglichkeit zwischen verschiedenen Verteilungs- bzw. „Link“-Funktionen zu wählen.
Neben der logistischen, der kumulativen Normalverteilung stellt es die doppelt logarithmische
(log-log) sowie deren komplementäre Variante (comp.log-log) zur Verfügung. In unserem Fall
wählen wir die logistischen Verteilungsfunktion aus, um eine Vergleichbarkeit mit den HLM 5
Ergebnissen zu gewährleisten. Die Felder „Convergence Criterion:“, „Number of Quadrature
Points:“, „Prior Distribution“ sowie „Prior for Numerical Quadrature:“ beziehen sich auf rein
technische Angaben für die „Maximum-Marginal-Likelihood“-Schätzung, wobei wir für die zu
schätzende Modellfolge die technischen Voreinstellungen beibehalten.
Abb. 46:
MIXOR-Hauptmenü für das Einlesen des Rohdatensatzes,
Festlegung der Ausgabedatei sowie des zu schätzenden
Modelltyps
Im Feld „Output File Name“ geben wir den Namen der Ausgabe-/ Protokolldatei an, wobei
MIXOR per Voreinstellung denselben verwendet wie die Befehlsdatei. Im Variablenmenü
spezifizieren wir anschließend das zu schätzende Modell, indem wir die zugehörigen Variablen
über ihre Ordnungs-/Spaltennummer aufrufen. Zuerst wählen wir unsere ordinale Kriteriumsvariablen im Feld „Ordinal Outcome Variable Field:“ aus. In unserem Fall entspricht der
WiSe 2001/2002
121
Variablen DVICVIOL die neunte Datenspalte. Über das Feld „Ordinal Outcome Var. Label:“
vergeben wir ein maximal acht Zeichen langes Etikett für die Kriteriumsvariable, unter dem sie
im Ausgabeprotokoll eindeutig geführt wird. Im Feld „Ordinal Outcome Variable Categories:“
geben wir die Anzahl der Kategorien von Y an und definieren ihre zugehörigen Zahlenkodes im
rechts daneben liegenden Feld. Da das „fixed-intercept-logit-model“ keine Varianzkomponente
enthält, setzen wir im Feld „Number of Random Effects:“ den Wert auf Null. Im rechts daneben
liegenden Feld „Number of Explanatory Var.Effects:“ geben wir an, dass wir nur den „festen
Effekt“ der logistischen Regressionskonstante schätzen wollen. Im darunter liegenden Auswahlfeld geben wir unter „Field“ an, an welcher Spaltenposition sich der Vektor der Einsen befindet,
den wir für die Schätzung der Zweiebenenmodelle benötigen und den MIXOR nicht automatisch
bildet. Für die zuschätzenden „fixed“ und „random“-Effekte vergeben wir jeweils ein maximal
acht Zeichen langes Etikett, das zu seiner Bezeichnung in der Ausgabedatei verwendet wird. In
unserem Fall geben wir die Abkürzung „intrcpt“ für die Regressionskonstante an.
Abb. 47:
MIXOR-Untermenü für die Definition der „fixed-“ und
„random-effects“ sowie ihrer Etiketten
Wenn wir im Feld „Perform Crosstabulation:“ die Option „yes“ wählen, fordert MIXOR uns
auf, die Spaltennummer und Ausprägungsanzahl des exogenen Merkmals für die zu berechnende Kreuztabelle mit der abhängigen Variablen anzugeben.
Im Menü „Starting Values“ bietet uns MIXOR neben der automatischen Wahl der Startwerte
die Möglichkeit an, sie für die einzelnen „fixed“- und „random-effects“ per Hand vorzugeben.
Die bisherigen Erfahrungen zeigen aber, dass die automatisch gewählten Startwert meistens zu
einer konvergierenden Lösung führen. Daher sollten wir die Startwerte nur dann manuell
eingeben, wenn der Lösungsalgorithmus zuvor nicht konvergiert hat.
WiSe 2001/2002
Abb. 48:
MIXOR-Untermenü für die Festlegung der Startwerte für die
Maximum-Marginal-Likelihood-Schätzung
Abb. 49:
MIXOR-Untermenü für die Definition der „fehlenden Werte“
der verwendeten endogenen und exogenen Variablen
122
Im „Missing Values“-Menü geben wir für die Kriteriumsvariable und die exogenen Merkmale
WiSe 2001/2002
123
die Kodes für die „fehlenden Angaben“ an, sofern wir deren Existenz mit der Angabe des Werts
„true“ im „Missing Values Present:“-Feld bejahen. In unserem Fall haben wir den Wert „9" für
die fehlenden Angaben der abhängigen Variablen und des Einser-Vektor der logistischen
Regressionskonstante gewählt.
Abb. 50:
MIXOR-Untermenü für weitere Modelloptionen wie
Rechtszensierung, Vorzeichenwechsel des Linearen Prädiktors
sowie speziellere Interaktionseffekte
Im „Advanced“-Menü die Möglichkeit, das „proportional hazard model“ der Ereignisdatenanalyse zu spezifizieren, bei dem zunächst wir die für die Rechtszensierung zuständige Statusvariable auswählen und anstatt seiner Subtraktion die Addition des linearen Prädiktors fordern.
Im Feld „Transform to Estimate:“ wir die Schätzung von gruppenspezifischen Schwellenwerten
vereinbaren. Wählen wir beim klassischen ordinalen Logitmodell die Option „Model Terms:
subtract“ so führt dies dazu, dass der Effekt des „linearen Prädiktors“ zum Schwellenwert
addiert wird. Inhaltlich gesehen führt dies dazu, dass wir dann ein Modellen spezifizieren, das
nicht mehr das Verharren bis zum Schwellenwert sondern direkt sein Überspringen schätzt.
Hierdurch drehen sich die Vorzeichen der logistischen Steigungskoeffizienten um, wie dies bei
den kumulativen Logitmodellen in BMDP und SAS der Fall ist. Wir fixieren zusätzlich den
Erwartungswert des „random-effecs“ auf Null im Feld „Random Effect Mean Vector:“ , so dass
er als Erwartungswert den Wert des geschätzten „fixed-effects“ annimmt. Diese technischen
Optionen behalten wir für alle in MIXOR zu schätzenden Modell bei.
Nach der erfolgreichen Schätzung des Modells ruft MIXOR seinen Editor für die Ausgabedatei
auf, der aber nur das Ausdrucken der Protokolldatei „dvicviol.out“ gestattet. Letztere können wir
aber mit jedem beliebigen Editor öffnen und bearbeiten.
Abb. 51:
WiSe 2001/2002
124
MIXOR-Ausgabefenster mit der Druckoption für das Ausgabeprotokoll
MIXOR speichert das Ausgabeprotokoll der Abb. 51 in der Datei: „dviolm0.out“, die sich
jederzeit nachbearbeiten läßt:
MIXOR - The program for mixed-effects ordinal regression analysis
(version 2)
Seattle Viktimisierungsstudie 1990 Miethe Daten ICPSR 2/1997
Opfer von Gewaltkriminalitaet: Fixed-Logit-Intercept-Model
Response function: logistic
Covariate(s) and random-effect(s) mean subtracted from thresholds
==> positive coefficient = positive association between regressor
and ordinal outcome
Numbers of observations
----------------------Level 1 observations =
5301 <-
Anzahl gültiger Fälle nach fallweisem
Ausschluß fehlender Werte
Descriptive statistics for all variables
---------------------------------------Variable
Minimum
Maximum
Mean
Stand. Dev.
dvicviol
intrcpt
0.00000
1.00000
1.00000
1.00000
0.04754
1.00000
0.21281
0.00000
WiSe 2001/2002
125
Categories of the response variable dvicviol
-------------------------------------------Category
Frequency
Proportion
0.00
1.00
5049.00
252.00
0.95246
0.04754
Starting values
--------------covariates
-2.998
--------------------------------------------------------* Final Results - Maximum Marginal Likelihood Estimates *
--------------------------------------------------------Total Iterations
Log Likelihood
Deviance (-2logL)
Ridge
Variable
-------intrcpt
=
=
=
=
1
-1013.561
2027.122
0.000
Estimate
------------2.99752
Stand. Error
-----------0.06455
Z
------------46.43930
p-value
-----------0.00000 (2)
note: (1) = 1-tailed p-value
(2) = 2-tailed p-value
Kontext- und personenübergreifend beträgt das geschätzte Logit der Viktimisierung durch
Gewaltdelikte wie Raub und Körperverletzung -2,99752. Dies entspricht einer Opferwahrscheinlichkeit von 4,75 %, dem Anteilswert der Ausprägung Eins von DVICVIOL in Prozent.
Die zugehörige Log-Likelihood beträgt -1013,561. Wenn wir diesen Wert mit -2 multiplizieren,
erhalten wir die zugehörige Deviance von 2027,122. Beide dienen uns als Basis für die Berechnung des globalen Likelihood-Ratio-χ2-Tests sowie der auf ihnen beruhenden Pseudo-R2e
von McFadden und Aldrich&Nelson.
8.3Schätzung des Random-Intercept-Only-Logit-Modell mit MIXOR
Die folgende Darstellung beschränkt sich aus Platzgründen allein auf für die Spezifikation der
Alternativmodelle notwendigen Änderungen in den MIXOR „Variables“ und „Missing Values“
Menüs. Im „Configuration“-Menü ändern wir lediglich neben der zweiten Titelzeile die laufenden Nummern der Befehls- und Ausgabedateien. In unserem ersten Modell schätzen wir analog
zum Vorgehen der HLM-Analysen das „Random-Intercept-Only“-Logitmodell, dessen Befehlssatz wir in der Datei „dviolm1.def“ ablegen. Hierzu fordern wir im Variablenmenü die Angabe
eines kontextabhängigen Effektes für die Regressionskonstante an, wählen den Vektor der
Einsen über seine Ordnungs-/Spaltennummer aus und vereinbaren mit „intrcpt“ dasselbe Etikett
wie für den „fixed-effect“.
WiSe 2001/2002
Abb. 52:
Spezifikation des „Random-Intercept-Only-Logitmodel“
Abb. 53:
Definition des „fehlenden Werts 9“ für die kontextabhängige
Regressionskonstante
126
WiSe 2001/2002
127
Wir erhalten von MIXOR in der Datei „dviolm1.out“ das folgende Ausgabeprotokoll:
(version 2)
Opfer von Gewaltkriminalitaet: Random-Intercept-Only-Logit-M.
Random-effects distribution: normal
and ordinal outcome
Level 2 observations =
5301 <- Anzahl der Fällle innerhalb der Kontexte
300 <- Anzahl der Kontexte
Anzahl der Fälle pro Nachbarschaftú
The number of level 1 observations per level 2 unit are:
18
19
19
18
18
18
18
18
17
18
18
18
18
18
18
16
18
18
18
18
18
17
18
18
18
18
18
16
14
17
18
18
19
18
20
18
18
18
20
18
17
18
18
17
13
18
18
17
18
19
18
18
17
18
15
18
18
18
18
18
15
17
16
19
18
18
18
16
18
18
21
18
18
18
18
18
18
15
17
17
18
20
16
18
18
16
17
18
18
18
18
17
16
17
18
18
17
17
21
20
18
16
18
17
18
18
17
18
18
18
19
18
18
18
21
18
19
16
18
18
17
16
18
16
16
17
19
18
18
19
17
18
18
18
18
18
18
18
18
16
21
16
17
15
16
18
19
18
18
18
18
18
17
18
17
15
18
18
17
18
18
18
18
19
15
19
18
18
18
18
18
18
18
18
18
17
19
18
18
18
16
18
18
18
18
17
18
18
19
17
14
18
18
18
19
17
17
18
18
18
17
18
18
16
17
17
18
18
19
19
19
16
16
17
17
18
18
18
18
18
18
18
18
18
17
18
17
18
17
18
18
18
18
18
17
18
17
17
18
19
19
18
18
18
17
18
19
18
18
18
18
16
18
18
14
18
17
18
17
18
18
18
16
18
18
18
18
18
18
18
15
17
19
18
18
17
18
17
16
16
18
17
17
18
17
20
16
16
18
18
16
18
18
17
17
18
15
18
19
18
---------------------------------------Variable
Minimum
Maximum
Mean
Stand. Dev.
dvicviol
intrcpt
intrcpt
0.00000
1.00000
1.00000
1.00000
1.00000
1.00000
0.04754
1.00000
1.00000
0.21281
0.00000
0.00000
Categories of the response variable dvicviol <-Verteilung der Kriteriumsvariablen
-------------------------------------------Category
Frequency
Proportion
0.00
1.00
5049.00
252.00
0.95246
0.04754
WiSe 2001/2002
128
Starting values
var. terms
0.000
0.574
==> The number of level 2 observations with non-varying responses
=
161 ( 53.67 percent ) <-Angabe der Anzahl von Nachbarschaften
ohne Varianz auf der Kriteriumsvariablen
Quad Pts per Dim
Log Likelihood
Deviance (-2logL)
Ridge
Variable
-------intrcpt
=
=
=
=
=
16
10
-977.802
1955.604
0.000
Estimate
------------3.45478
Stand. Error
-----------0.12433
Z
------------27.78749
Random effect variance term (standard deviation)
intrcpt
1.03675
0.13006
7.97109
p-value
-----------0.00000 (2)
0.00000
(1)
Calculation of the intracluster correlation
------------------------------------------residual variance = pi*pi / 3 (assumed)
cluster variance = (1.037 * 1.037) = 1.075
intracluster correlation =
1.075 / ( 1.075 + (pi*pi/3)) = 0.2461
Im Gegensatz zu HLM 5 berechnet MIXOR automatisch die Interklassenkorrelation ρ2 nach der
bereits vorgestellten Formel. Die Kontextzugehörigkeit der Befragten erklärt maximal 24,61%
ihres Viktimisierungslogits durch Gewaltdelikte. Dieser Erklärungsbeitrag des Universums von
Nachnachschaftsmerkmalen liegt um 2,36 % höher als derjenige der Laplace6-Schäzung mit
HLM 5 (ρ2= 0,225). Dies ist darauf zurückzuführen, dass geschätzte Varianz der kontextabhängigen Logitkonstanten in MIXOR mit 1,075 höher als in HLM 5 mit einem Wert von
0,9415 ausfällt. MIXOR gibt das Ausmaß der Variation des kontextabhängigen Effekts jeweils
als seine geschätzte Standardabweichung an. Der von Hedeker&Gibbons mit Z bezeichnete
einseitige T-Test prüft, ob die geschätzte Standardabweichung des „random effect“ signifikant
von Null verschieden ist. Mit einem Wert von -3,455 liegt die logistische Regressionskonstante
des „fixed effects“ nur knapp über derjenigen des mit HLM 5 geschätzten R-I-O-Logitmodells.
Ihr zweiseitiger T-Test zeigt, dass sie ebenfalls signifikant von Null verschieden ist. Unter
adäquater Berücksichtigung der geklumpten Stichprobenstruktur erwarten wir ein durchschnittliches Risiko, Opfer einer Gewalttat innerhalb der eigenen Nachbarschaft zu werden, von 3,06
%. Mit Hilfe des globalen Likelihood-Ratio-χ2 überprüfen wir, ob alle geschätzten „fixed“- und
„random-effects“ signifikant von Null verschieden sind. Mit der Log-Likelihood des logisti-
WiSe 2001/2002
129
schen Nullmodells berechnen wir ihn folgendermaßen:
Globaler L.R.χ2&Test ' DevianceNullmodell & DevianceM.1
' 2.027,122 & 1955,605 ' 71,52
Anzahl der Freiheitsgrade ' ParameterzahlM.1 & ParameterzahlNullmodell ' 2 & 1 ' 1
Da L.R. χ2 $ χ2kritisch ist; muß H0 verworfen werden !
Mit einer Irrtumswahrscheinlichkeit von weniger als 5 %, verwerfen wir die Nullhypothese des
globalen Likelihood-Ratio-χ2-Werts. Wir können daher davon ausgehen, dass die geschätzte
maximale Varianzaufklärung der Opferlogits auch für die Grundgesamtheit aller Nachbarschaften Seattles gilt.
8.4Schätzung des Random-Intercept-/Random-Slope-Logit-Modell mit MIXOR
Als nächsten Schritt schätzen wir mit MIXOR das „random-intercept-/random-slope“-Logitmodell (M.2), um die Variabilitäten der Viktimisierungslogits der Referenzgruppe sowie ihrer
farbigen Nachbarn abzuschätzen. Als exogene Individualmerkmale verwenden wir dieselben wir
im HLM 5 Modell, um die Vergleichbarkeit der Ergebnisse zu gewährleisten. Wir legen die
zugehörigen Steuerbefehle und das Ausgabeprotokoll in den Dateien „dviolm2.def“ bzw.
„dviolm2.out“ ab. Im „Variables“-Menü definieren wir zunächst die sieben exogenen Individualmerkmale, wobei wir dieselben Variablennamen wie in SPSS benutzen. Die Regressionskonstante („intrcpt“) mit dem Vektor von Einsen zählt hierbei als „Erklärungsmerkmal“ mit. Als
exogene feste Individualmerkmale vereinbaren wir die Variablen über ihre Ordnungs-/Spaltennummern und ihren Variablennamen aus SPSS: intrcpt (3), gmcalter (12), frau (10), minority
(11), gmincome (13), livalone (21) sowie gmcdanga (14). Zusätzlich fordern wir einen zweiten
„random effect“ an, indem wir die Spaltenzahl 11 und das Wort „minority“ als Etikett eintragen.
Es empfiehlt sich für die „random“ und „fixed effects“ dieselben Labels zu verwenden, um den
Ausgabeprotokoll übersichtlich und inhaltlich eindeutig zu gestalten.
Im „Missing Values“-Menü geben wir die Kodes für die fehlenden Angaben bei den exogenen
Merkmalen an, wobei wir mit Ausnahme der Grand-Mean-zentrierten Variablen den Wert „9"
verwenden. Bei letzteren definieren wir den Wert „99" als fehlende Angabe.
Im „Advanced“-Menü bietet uns MIXOR die Option an, die Kovarianz bzw. Korrelation der
beiden kontextabhängigen Effekte zu schätzen. Bejahen wir im Feld „Random Effects Grouping“ mit „yes“ die Angabe, dass es sich bei den kontextabhängigen Schätzern um solche für
Dummyvariablen handelt, so schätzt MIXOR deren Kovarianz nicht. Behandeln wir sie hingegen als „metrische Variablen“, so ermittelt MIXOR per Voreinstellung die Kovarianz ihrer
kontextabhängigen Schätzer.
WiSe 2001/2002
Abb. 54:
Variablen-Menü-Eintragungen des Alternativmodells 2
Abb. 55:
„Missing Values“-Menü Eintragungen für die exogenen
Merkmale des Alternativmodell 2
130
WiSe 2001/2002
131
Abb. 56:
Zusätzliche Optionen des MIXOR „Advanced“-Menü bei
Alternativmodell 2
In der Datei „dviolm2.out“ legt MIXOR das folgende Ausgabeprotokoll ab:
(version 2)
Gewaltopfer: Random-Intercept-Random-Slope-Logitmodell
and ordinal outcome
4659
300
16
18
18
17
13
15
15
18
17
11
15
17
11
17
19
15
13
16
16
15
16
16
14
17
18
16
14
14
15
17
18
14
17
14
17
16
19
13
16
16
10
13
15
13
19
18
14
15
14
17
15
19
17
18
12
16
17
13
14
16
17
10
14
15
17
14
17
18
16
14
16
17
16
18
14
16
15
18
16
18
17
15
16
17
15
17
17
16
13
13
14
16
14
17
13
15
16
17
17
15
17
15
13
16
17
17
17
16
16
16
16
18
16
17
16
15
15
17
15
15
14
18
15
13
14
18
19
12
12
14
18
15
18
14
17
17
18
17
13
14
13
17
14
15
18
15
16
17
17
14
16
18
Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse 15
14
16
17
16
17
14
12
17
17
13
15
13
16
17
16
12
17
16
15
12
12
17
14
18
18
15
18
13
14
15
18
14
14
17
17
15
14
15
15
17
16
17
16
12
15
16
15
16
14
15
17
16
16
18
14
17
15
18
15
13
14
16
13
16
17
18
16
21
13
10
12
14
15
14
14
16
18
14
14
16
17
16
16
15
14
15
14
16
15
17
15
19
15
14
18
WiSe 2001/2002
15
18
16
12
16
13
15
12
17
16
15
14
16
17
16
17
18
18
17
16
16
14
17
15
18
16
13
13
17
17
10
132
17
18
17
15
16
15
14
15
13
16
14
15
17
16
16
15
15
15
14
16
15
---------------------------------------Variable
Minimum
Maximum
Mean
Stand. Dev.
dvicviol
intrcpt
minority
intrcpt
gmcalter
frau
minority
gmincome
livalone
gmcdanga
0.00000
1.00000
0.00000
1.00000
-31.57670
0.00000
0.00000
-2.00000
0.00000
-0.87500
1.00000
1.00000
1.00000
1.00000
48.42330
1.00000
1.00000
4.00000
1.00000
2.12500
0.04786
1.00000
0.14746
1.00000
-0.81709
0.48895
0.14746
0.35716
0.25563
0.02584
0.21350
0.00000
0.35460
0.00000
17.49663
0.49993
0.35460
1.42055
0.43626
0.81556
-------------------------------------------Category
Frequency
Proportion
0.00
1.00
4436.00
223.00
0.95214
0.04786
Starting values
var. terms
0.000
1.814
0.000
0.000
0.000
0.907
0.000
0.000
0.000
0.000
=
169 ( 56.33 percent )
Quad Pts per Dim
Log Likelihood
Deviance (-2logL)
Ridge
=
=
=
=
=
32
10
-852.067
1704.134
0.000
Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse Variable
-------intrcpt
gmcalter
frau
minority
gmincome
livalone
gmcdanga
Estimate
------------3.56389
-0.00622
0.02909
0.38785
-0.15358
0.48888
0.29239
Stand. Error
-----------0.17673
0.00457
0.16133
0.33333
0.05128
0.17674
0.09741
WiSe 2001/2002
Z
------------20.16518
-1.35898
0.18033
1.16355
-2.99500
2.76606
3.00172
133
p-value
-----------0.00000 (2)
0.17415 (2)
0.85690 (2)
0.24461 (2)
0.00274 (2)
0.00567 (2)
0.00268 (2)
Random effect variance&covariance terms (Cholesky of var-covariance matrix)
intrcpt
0.92913
0.15277
6.08203
0.00000 (1)
covariance
-0.73524
0.32000
-2.29762
0.02158 (2)
minority
0.30419
1.02492
0.29679
0.38331 (1)
Calculation of the random effects variance-covariance matrix
-----------------------------------------------------------intrcpt variance = (0.929 * 0.929) = 0.863
covariance = (0.929 * -.735) = -.683
minority variance = (-.735 * -.735) + (0.304 * 0.304) = 0.633
Covariance expressed as a correlation = -.924
Bevor wir die einzelnen Effekt näher betrachten, überprüfen wir zunächst mit Hilfe des globalen
Likelihood-Ratio-χ2, ob alle „fixed“- und „random-effects“ in der Grundgesamt signifikant von
Null verschieden sind.
Globaler L.R.χ2&Test ' DevianceNullmodell & DevianceA.M.2
' 2.027,122 & 1704,134 ' 322,99
Anzahl der Freiheitsgrade ' ParameterzahlA.M.2 & ParameterzahlNullmodell ' 10 & 1 ' 9
Mit einer Irrtumswahrscheinlichkeit von deutlich weniger als 5 % können wir die Nullhypothese
des globalen Likelihood-Ratio-χ2-Tests verwerfen. Mindestens einer unserer geschätzten „fixed“
und „random-effects“ ist in der Grundgesamtheit signifikant von Null verschieden.
Um die Modellanpassung im Sinne der praktischen Signifikanz zu bestimmen, verwenden wir
zur Bestimmung der praktischen Signifikanz neben dem Deviance-PRE-R2 diejenigen von
McFadden sowie Aldrich&Nelson (1984) mit der von Veall&Zimmermann (1994) vorgeschlagenen Korrektur an seiner empirischen Obergrenze.
WiSe 2001/2002
134
PRE&R 2 '
'
DevianceNullmodell
DevianceA.M.2
DevianceNullmodell
2.027,12 & 1.704,13
' 0,1593
2.027,12
' 1 &
1.704,13
' 0,1593
2.027,12
Da das McFadden Pseudo-R2 und das PRE-R2 von ihrem Konstruktionsprinzip her identisch
sind, liefert sie beide denselben Wert für die auf die exogenen Merkmale zurückzuführende
proportionale Reduktion der Deviance. Sie beträgt in beiden Fällen rd. 15,93%. Einen etwas
realistischeren Aufschluß über die Modellanpassung vermittelt das Aldrich&Nelson Pseudo-R2
mit der von Veall&Zimmermann vorgeschlagenen Korrektur an seiner Obergrenze.
Berechnung des Aldrich&Nelson Pseudo&R 2 mit Veall&Zimmermann&Korrektur
für das Zweiebenen&Logitmodell M.2:
2 ( (lnLA & lnL0 )
2 ( (lnL A & lnL0 ) % 3,29(n
&2 ( lnL0
3,29 ( n & 2 ( lnL0
L.R.&χ2A.M.2
322,99
322,99 % 3,29 ( 4659
0,0206
'
'
'
DevianceM
2027,22
0,1168
0
2027,22 % 3,29 ( 4659
DevianceM % 3,29 ( n
L.R.&χ2A.M.2 % 3,29 ( n
0
' 0,1764 oder 17,65 %
Unsere exogenen Individualmerkmale und die Varianzkomponenten erklären rd. 17,65% der
Varianz der geschätzten Viktimisierungslogits bei Gewaltdelikten. Dieser Anteil fällt im
Vergleich zum Deviance PRE-R2 oder McFadden-Pseudo-R2 etwas höher aus und belegt eine für
Feldstudien relativ gute Modellanpassung.
Um die Interpretation der Effekte und ihren Vergleich mit denjenigen von HLM 5 zu erleichtern,
tragen wir sie zunächst in das zugehörige Gleichungssystem ein.
WiSe 2001/2002
135
Die Schätzgleichungen des Logit&Random&Intercept&Random&Slope&Model : M.2
Logistic Random Intercept: β 0 j
2 a) β 0 j ' &3,56( % u 0 j
2 b) β 1 j ' & 0,01
2 c) β 2 j ' % 0,03
Random Logistic Slope: β 3 j
2 d) β 3 j ' % 0,39 % u 3 j
2 e) β 4 j ' & 0,15(
2 f) β 5 j ' % 0,49(
2 g) β 6 j ' %0,29(
1) ln
P ( DVICVIOL ' 1)
ij
Die geschätzten Kovarianz der kontextabhängigen logistischen Effekte stellen wir ebenfalls als
Θ-Matrix dar:
Kovarianzmatrix Ω der kontextabhängigen logistischen Effekte
Ω' '
Pearson )s ru
0j , u3j
σ2u
0j
σu ( u
0j
3j
σu ( u
0j
3j
σ2u
3j
'
0,863() &0,683()
&0,683()
0,633
' & 0,924
Legende:
() : Irrtumswahrscheinlichkeit α # 0,05
Für den Vergleich der mit MIXOR und HLM 5 geschätzten „fixed-effects“ haben wir die γ-
WiSe 2001/2002
136
Koeffizienten nach der zweiten Kommastelle gerundet. Wenn wir die γ-Koeffizienten der
Maximum-Marginal-Likeli-hood-Schätzung und der Laplace6-Approximation gegenüberstellen,
so weichen sie mit Ausnahme der logistischen Steigung des Minoritätenstatus (γ30) nur sehr
geringfügig im Bereich der zweiten Kommastelle ab. Die zugehörigen T-Test liefern nahezu
identische Ergebnisse. Den γ30-Koeffizienten Farbiger schätzt MIXOR mit einem logistischen
Steigungskoeffizienten von +0,39 rd. dreimal so groß wie HLM 5 (+0,13) ein. Aber beide
Programme identifizieren gleichermaßen diesen Effekt als nicht statistisch signifikant. D.h.,
trotz der numerischen Unterschiede beider γ30-Koeffizienten begehen wir keinen Fehlschluss im
Hinblick auf die Grundgesamt aller Nachbarschaften Seattles, wenn wir MIXOR anstatt HLM
5 benutzen.
Für den Vergleich der geschätzten Varianzkomponenten runden wir die Elemente der Ω-Matrix
beider Programme jeweils nach ihrer dritten Kommastelle. Ihre Gegenüberstellung ergibt, dass
zum einen beide Programme die Varianz der kontextabhängigen logistischen Regressionskonstanten nahezu identisch einschätzen. Zum anderen zeichnen sich deutliche Unterschiede bei der
geschätzten Varianz des logistischen Minderheiteneffekts sowie dessen Kovarianz mit der
Regressionskonstanten ab. MIXOR schätzt die Varianz der Abweichung des Opferlogits
Farbiger von demjenigen ihrer weißen Nachbarn mit einem σ2u3j-Koeffizienten von 0,633 rd. ein
Drittel niedriger ein als die Laplace6-Approximation von HLM 5 (0,983). Beide Programme
weisen gemäß dem zugehörigen einseitigen T-Test bzw. χ2-Test diese Varianzkomponente als
statistisch nicht signifikant aus. Trotz der numerischen Differenz beider Schätzer begehen wir
daher keinen Fehlschluss, wenn wir auf die Grundgesamtheit verallgemeinern. Gleichermaßen
weicht die geschätzte Kovarianz der kontextabhängigen Effekt in beiden Programmen voneinander ab. Mit einem Wert von -0,43 unterschätzt HLM 5 im Vergleich zu MIXOR (-0,683)
deutlich die Kovarianz bzw. Korrelation (-0,692 vs. -0,924) der beiden kontextabhängigen
Effekte. In MIXOR bezieht sich der zweiseitige T-Test nicht auf die Kovarianz der kontextabhängigen Schätzer sondern auf die Cholesky-Zerlegung der zugehörigen Kovarianzmatrix.
Hingegen führt HLM 5 keinen Test für die Kovarianz der kontextabhängigen Schätzer durch.
Daher können wir aus inferenzstatistischer Sicht die Unterschiede der mit beiden Programmen
geschätzten Kovarianzen der Level-2-abhängigen Schätzer nicht beurteilen.
8.5 Schätzung des Coefficient-as-Outcome-Logit-Modells mit MIXOR
Um das Alternativmodell 4 zu schätzen, müssen wir im Variablenmenü von MIXOR die vier zu
den beiden exogenen Kontextmerkmalen Minderheitenanteil und Ausmaß der sozialen Integration gehörenden „Haupt“- und „Wechselwirkungseffekte zwischen den Ebenen“ über ihre
Spalten-/Ordnungsnummer im Rohdatensatz spezifizieren. Zu ihrer eindeutigen Kennzeichnung
verwenden wir die Variablennamen aus SPSS. Hierdurch erhöht sich die Anzahl der zu schätzenden „fixed effects“ inklusive der logistischen Regressionskonstante auf insgesamt elf. Im
Configuration-Menü haben wir zuvor für die Befehls- und Ausgabedatei den Namen „dviolm3.def /out“ vereinbart und in der zweiten Titelzeile als Modellbezeichnung „Coefficient-asOutcome-Logitmodell M.4" eingetragen.
Abb. 57:
WiSe 2001/2002
137
Benötigte zusätzliche Eintragungen für das Alternativmodell 3
in das Variables-Menü von MIXOR
Für die vier zusätzlichen Variablen „gmcpmin“, „gmcintg“, „iminpmin“ und „iminintg“ vereinbaren wir im Missing-Values-Menü von MIXOR jeweils den Kode „99" für fehlende Angaben.
Abb. 58:
benötigte zusätzliche Eintragungen für das Alternativmodell 3
im Missing-Menü von MIXOR
WiSe 2001/2002
138
Wir erhalten in der Datei „dviolm3.out“ von MIXOR das folgende Ausgabeprotokoll:
(version 2)
Gewaltopfer: Coefficient-as-Outcome-Logitmodell: M.3
and ordinal outcome
4659
300
16
18
18
17
13
15
15
14
15
14
16
17
16
17
14
12
18
17
11
15
17
11
17
17
17
17
13
15
13
16
17
16
19
15
13
16
16
15
16
17
12
17
16
15
12
12
17
14
16
14
17
18
16
14
14
18
18
18
15
18
13
14
15
18
15
17
18
14
17
14
17
17
14
14
17
17
15
14
15
15
16
19
13
16
16
10
13
13
17
16
17
16
12
15
16
15
15
13
19
18
14
15
14
14
16
14
15
17
16
16
18
14
17
15
19
17
18
12
16
13
17
15
18
15
13
14
16
13
17
13
14
16
17
10
14
17
16
17
18
16
21
13
10
12
15
17
14
17
18
16
14
14
14
15
14
14
16
18
14
14
16
17
16
18
14
16
15
15
16
17
16
16
15
14
15
14
18
16
18
17
15
16
17
18
16
15
17
15
19
15
14
18
15
17
17
16
13
13
14
15
15
18
16
12
16
13
15
12
16
14
17
13
15
16
17
16
17
16
15
14
16
17
16
17
17
15
17
15
13
16
17
17
18
18
17
16
16
14
17
15
17
17
16
16
16
16
18
17
18
16
13
13
17
17
10
16
17
16
15
15
17
15
14
17
18
17
15
16
15
14
15
14
18
15
13
14
18
16
15
13
16
14
15
17
16
19
12
12
14
18
15
18
18
16
15
15
15
14
16
15
---------------------------------------Variable
Minimum
Maximum
Mean
Stand. Dev.
dvicviol
intrcpt
minority
intrcpt
gmcalter
frau
minority
gmincome
livalone
gmcdanga
gmcpmin
gmcintg
iminpmin
iminintg
0.00000
1.00000
0.00000
1.00000
-31.57670
0.00000
0.00000
-2.00000
0.00000
-0.87500
-15.15000
-2.06960
-10.15000
-2.06960
1.00000
1.00000
1.00000
1.00000
48.42330
1.00000
1.00000
4.00000
1.00000
2.12500
78.18330
1.78600
78.18330
1.78600
0.04786
1.00000
0.14746
1.00000
-0.81709
0.48895
0.14746
0.35716
0.25563
0.02584
-0.00869
-0.01263
3.59405
-0.01532
0.21350
0.00000
0.35460
0.00000
17.49663
0.49993
0.35460
1.42055
0.43626
0.81556
19.31404
0.79097
13.22336
0.29598
WiSe 2001/2002
139
-------------------------------------------Category
Frequency
Proportion
0.00
1.00
4436.00
223.00
0.95214
0.04786
Starting values
covariates
var. terms
0.000
0.000
0.000
1.814
0.000
0.000
0.000
0.907
0.000
0.000
0.000
0.000
0.000
0.000
=
169 ( 56.33 percent )
--------------------------------------------------------Total Iterations = 37
Quad Pts per Dim = 10
Log Likelihood
=
-836.624
Deviance (-2logL) =
1673.247
Ridge
=
0.300
Variable
Estimate
Stand. Error
-----------------------------intrcpt
-3.50639
0.17688
gmcalter
-0.00283
0.00469
frau
0.03943
0.16536
minority
0.40821
0.38073
gmincome
-0.10776
0.05353
livalone
0.41046
0.18336
gmcdanga
0.26208
0.09761
gmcpmin
0.02426
0.00548
gmcintg
-0.35329
0.13833
iminpmin
-0.02696
0.00841
iminintg
0.18012
0.26875
Z
------------19.82333
-0.60307
0.23844
1.07217
-2.01308
2.23854
2.68507
4.42366
-2.55394
-3.20432
0.67020
p-value
-----------0.00000 (2)
0.54646 (2)
0.81154 (2)
0.28364 (2)
0.04411 (2)
0.02519 (2)
0.00725 (2)
0.00001 (2)
0.01065 (2)
0.00135 (2)
0.50273 (2)
Random effect variance&covariance terms (Cholesky of var-covariance matrix)
intrcpt
0.81109
0.15809
5.13068
0.00000 (1)
covariance
-0.54127
0.39584
-1.36741
0.17150 (2)
minority
0.35931
0.92946
0.38658
0.34953 (1)
–
Geschätzte Risidualvarianzen der kontextabhängigen Effekte:
Calculation of the random effects variance-covariance matrix
-----------------------------------------------------------intrcpt variance = (0.811 * 0.811) = 0.658
covariance = (0.811 * -.541) = -.439
minority variance = (-.541 * -.541) + (0.359 * 0.359) = 0.422
Covariance expressed as a correlation = -.833
WiSe 2001/2002
140
Um die Modellanpassung im Sinne der statistischen und praktischen Signifikanz zu bestimmen,
berechnen wir zunächst die zugehörige Likelihood-Ratio-χ2-Prüfgröße. Danach fällen wieder
unsere Testentscheidung, ob sämtliche geschätzten „fixed“- und „random-effects“ in der
Grundgesamtheit Null sind.
Globaler L.R.χ2&Test ' DevianceNullmodell & DevianceA.M.3
' 2.027,122 & 1.673,247 ' 353,88
Anzahl der Freiheitsgrade ' ParameterzahlA.M.3 & ParameterzahlNullmodell ' 14 & 1 ' 13
Mit einer Irrtumswahrscheinlichkeit von deutlich weniger als 5 % verwerfen wir die Nullhypothese des globalen Likelihood-Ratio-χ2-Tests und gehen daher davon aus, dass die im Mehrebenenmodell berücksichtigten exogenen Individual- und Kontextmerkmale einen statistischen
bedeutsamen Erklärungsbeitrag für das Logit der Viktimisierung durch Gewaltdelikte leisten. Im
Vergleich zum Nullmodell beträgt die Reduktion der Deviance rd. 17,46 %, wie der folgende
Formel zu entnehmen ist.
PRE&R 2 '
DevianceNullmodell
'
DevianceA.M.3
DevianceNullmodell
2.027,12 & 1.673,25
' 0,1746
2.027,12
' 1 &
1.673,25
' 0,1746
2.027,12
WiSe 2001/2002
141
Berechnung des Aldrich&Nelson Pseudo&R 2 mit Veall&Zimmermann&Korrektur
für das Zweiebenen&Logitmodell M.3:
L.R.&χ2A.M.3
L.R.&χ2A.M.3 % 3,29 ( n
DevianceM
0
DevianceM % 3,29 ( n
0
353,88
353,88 % 3,29 ( 4659
0,0226
'
'
2027,22
0,1168
2027,22 % 3,29 ( 4659
' 0,1935 oder 19,35 %
Unter Berücksichtigung der extremen Ungleichverteilung der Opferwahrscheinlichkeit und ihres
Komplements beträgt die durch die einbezogenen exogenen Merkmale erfolgte Varianzaufklärung rd. 19,35 %. Sie liegt somit deutlich höher als in den meisten Feldstudien.
Um die Erklärungsbeiträge der exogenen Kontextmerkmale im Hinblick auf die Opferlogit der
weißen Referenzgruppe und ihrer farbigen Nachbarn zu bestimmen, berechnen wir zunächst das
von Bryk&Raudenbush vorgeschlagene PRE-R2 für die kontextabhängige Logitschätzer der
Konstanten und der Steigung für die Minoritäten. Anschließend berechnen wir einen partiellen
Likelihood-Ratio-χ2-Test, um die erzielte Varianzaufklärung der kontextabhängigen Schätzer
signifikant von Null verschieden ist.
Mit Hilfe unserer beiden Nachbarschaftsmerkmale Minoritätenanteil und Ausmaß sozialer
Integration erklären wir rd. 23,75% der Variation des Opferlogits der Referenzgruppe. Bei der
geschätzten Abweichung des Opferlogits ihrer farbigen Nachbarn erzielen wir so gar ein Anteil
von 33,33% erklärter Varianz. Um die statistische Signifikanz dieser Erklärungsbeiträge
gemeinsam zu überprüfen, führen wir den partiellen Likelihood-Ratio-χ2-Tests im Vergleich
zum Random-Intercept/Random-Slope-Logitmodell (M.2) durch. Mit einer Irrtumswahrscheinlichkeit von deutlich weniger als 5 % verwerfen wir die Nullhypothese des partiellen
Likelihood-Ratio-χ2-Tests, die besagt, dass die Effekte der einbezogenen exogenen Kontextmerkmale jeweils Null sind.
WiSe 2001/2002
142
Berechnung des Bryk & Raudenbush&R 2 für die Ebene 2 des Modells M.3:
Bryk & Raudenbush&R
2
Level 2
'
0,863 & 0,658
' 0,2375 ( 100 ' 23,75 %
0,863
0,633 & 0,422
' 0,3333 ( 100 ' 33,33 %
0,633
Legende:
σ̂ 2u 0 j :
σ̂
2
u kj :
Partieller L.R.χ2&Test ' DevianceA.M.2 & DevianceA.M.3
' 1.704,134 & 1.673,247 ' 30,89
Anzahl der Freiheitsgrade ' ParameterzahlA.M.3 & ParameterzahlA.M.2 ' 14 & 10 ' 4
Um die von MIXOR geschätzten „fixed-effects“ besser mit denjenigen von HLM 5 vergleichen
zu können, setzen wir sie in das Gleichungssystem des geschätzten Zweiebenen-Logitmodells
M.3 ein. Hierbei kennzeichnen wir die signifikante Effekte jeweils durch ein Sternchen.
WiSe 2001/2002
143
chätzgleichungen des Alternativmodells 3 mit fixed&effect&Koeffizienten von MIXOR :
β 0 j ' &3,51( % 0,02( ( ( PMINORI. j& PMINORI.. ) & 0,35( ( ( MNINTEGR.j& MNINTEGR.. ) % u 0 j
b) β 1 j ' & 0,00
c) β 2 j ' % 0,04
d) Logistic Slope&as&Outcome: β 3 j
β 3 j ' %0,41 & 0,03( ( ( PMINORI. j& PMINORI.. ) % 0,18 ( ( MNINTEGR.j& MNINTEGR.. ) % u 3 j
e) β 4 j ' & 0,11(
f) β 5 j ' % 0,41(
g) β 6 j ' % 0,26(
evel / Ebene 1: Logistic Within&Context Regression
) ln
P ( DVICVIOL ' 1)
' β 0 j % β 1 j ( ( ALTERìj& ALTER.. ) % β 2 j ( FRAU ij
ij
Beim Vergleich der mit MIXOR und HLM 5 geschätzten γ-Koeffizienten zeichnen sich deutlich
sowohl Gemeinsamkeiten als auch Unterschiede ab. Bei den Effekten der beiden Nachbarschaftsmerkmalen Minoritätenanteil und Ausmaß sozialer Integration auf das Opferlogit der
Referenzgruppe (β0j) weist nur der Effekt der Integration eine geringfügige Abweichung an der
zweiten Kommastelle auf. Beide Programme identifizieren diese Kontexteffekte als statistisch
signifikant. Der Erwartungswert für das Opferlogit der Referenzgruppe (γ00) in Nachbarschaften
mit durchschnittlichem Farbigenanteil und Ausmaß an sozialer Kontrolle ist ebenfalls in beiden
Programmen und gleichermaßen statistisch signifikant. Die von beiden Programmen geschätzten
„fixed-effects“ des Alters und Geschlechts sind weitestgehend identisch und ebenfalls nicht
signifikant. Ebenfalls geringe Abweichungen der γ-Koeffizienten treten bei den „fixed-effects“
der Einkommensklasse, des Singledaseins sowie der außerhäuslichen Freizeitaktivitäten auf,
wobei bis auf die Einkommensklasse die zugehörigen T-Tests nahezu identische Ergebnisse
liefern. Im Gegensatz zu MIXOR weist HLM 5 den Effekt der Einkommensklasse nur als
tendenziell signifikant aus, da die zugehörige Irrtumswahrscheinlichkeit des T-Tests bei 8,6 %
WiSe 2001/2002
144
liegt. Die größten Unterschiede der von beiden Programmen geschätzten γ-Koeffizienten finden
wir beim zweiten „random-effect“, nämlich der geschätzten Abweichung des Opferlogits der
Farbigen von ihren weißen Nachbarn. Dieser geschätzte logistische Gruppenunterschied (γ30)
fällt in Durchschnittsnachbarschaften mit +0,41 in MIXOR nahezu doppelt so hoch wie in HLM
5 aus. In beiden Programmen erreicht der Gruppenunterschied nicht die Signifikanzgrenze. Den
Wechselwirkungseffekt des Minderheitenanteils zwischen den Analyseebenen (γ31) schätzen
beide Programme mit einem Wert von -0,03 gleich hoch ein und weisen ihn gleichermaßen als
statistisch signifikant aus. Hingegen schätzt MIXOR den Effekt der sozialen Integration (γ32) mit
einem γ-Koeffizienten von +0,18 nahezu dreimal so hoch wie HLM 5 ein, wobei beide Programme ihn als statistisch nicht signifikant ausweisen.
Die Unterschiede beider Programme bei der Varianzaufklärung der kontextabhängigen Effekte
ist darauf zurückzuführen, dass beide im jeweiligen Random-Intercept/Random-Slope-Logitmodell die als Bezugsbasis dienenden Varianzkomponenten für β0j und β3j unterschiedlich hoch
ermittelt haben. Desweiteren dürften die Unterschiede der geschätzten „fixed-effects“ zwischen
MIXOR und HLM 5darauf zurückzuführen sein, dass wir bei beiden Programme verschiedene
Formen der Grand-Mean-Zentrierung exogenen metrischer Merkmale vorgenommen haben.
Während HLM 5 zunächst für die Variablen des aktuellen Modells einen fallweisen Auschluß
fehlender Werte durchführt und danach erst am Grand-Mean der verbleibenden Gesamtstichprobe zentriert, haben wir bei der Datenaufbereitung für MIXOR in SPSS an den jeweiligen
Mittelwerten der Ausgangsstichprobe mit 5.301 Fällen die Zentrierung vorgenommen. Die
Schätzung des Alternativmodell 3 beruht aber nur noch auf 4.659 Fällen. Diese erhebliche
Fallreduzierung führt dazu, dass die Mittelwerte für die zuvor am Grand-Mean der Ausgangsstichprobe zentrierten exogenen Merkmale Alter, Einkommensklasse und Ausmaß der sozialen
Integration von ihrem Erwartungswert Null deutlich abweichen. Da aufgrund der nicht-linearen
Verknüpfungsfunktion des Logitmodells die Effekt einzelner Variablen vom linearen Prädiktor
aller exogenen Merkmale abhängen, ist nicht auszuschließen, dass die beobachteten Unterschiede der γ-Koeffizienten in beiden Programmen auf die unterschiedlichen Zentrierungen
zurückzuführen sind. Ebenfalls ist noch nicht hinreichend geklärt, inwieweit die in beiden
Programmen verwendeten Algorithmen der Maximum-Marginal-Likelihood-Schätzung und der
Laplace6-Approximation für die beschriebenen Unterschiede der γ-Koeffizienten verantwortlich
sind.
Summa summarum bleibt festzuhalten, dass bei gegebener Finanzausstattung HLM 5 eher als
MIXOR dem angewandten Sozialforscher zu empfehlen ist, da es erstens über einen komfortablen Datenimport verfügt, der alle gängigen Statistikprogramme unterstützt. Zweitens bietet
sein graphischer Editor dem Nutzer die Möglichkeit, das zu schätzende Mehrebenenmodell sehr
einfach zu spezifizieren, wobei das Programm die Zentrierung der exogenen Merkmale auf
Anforderung selbst durchführt. Drittens stellt HLM 5 die Ergebnisse der Schätzung, insbesondere die Wechselwirkungseffekte der exogenen Merkmale zwischen den Ebenen, mit Hilfe seines
Grafikeditors sehr anschaulich dar. Viertens sind in HLM 5 eine Vielzahl von Modellklassen der
Mehrebenenanalyse implementiert, die MIXOR als einzelnes Programm nicht bietet. Zum
Nachteil gereicht HLM 5, dass es weder bei der Penalized-Quasi-Likelihood- noch der
Laplace6-Schätzung die Log-Likelihood des logistischen Nullmodells die Log-Likelihood oder
Deviance ermittelt. Daher können für die mit HLM 5 geschätzten Logitmodellen weder einen
globalen Likelihood-Ratio-χ2 noch diverse Pseudo-R2e für die Beurteilung der Modellanpassung
berechnen. Angesichts des notwendigen erheblichen Aufwands der Datenaufbereitung spricht
für MIXOR lediglich sein Status als „freeware“-Programm und die Möglichkeit der Schätzung
von Nullmodellen für die binäre und ordinale logistische Regression. Wenn der Anwender nur
WiSe 2001/2002
145
an statistisch signifikanten γ-Koeffizienten interessiert ist, so sitzt er bei der Verwendung
MIXOR zumindest bei derVerallgemeinerung auf die Grundgesamtheit keinen Fehlschlüssen
auf. Was die numerischen Differenzen der geschätzten γ-Koeffizienten und Varianzkomponenten angeht, sollten zukünftige Simulationsstudien zeigen, ob sie auf die Unterschiede der
Schätzverfahren oder der Zentrierungen zurückzuführen sind.
Alternativ zu MIXOR kann der Anwender auch auf die kostenlose Studentenedition von HLM
5 für die Schätzung von Mehrebenenmodellen zurückgreifen. Sie bietet, was die Modellklassen
angeht, denselben Leistungsumfang wie die kommerzielle Version des Programms. Lediglich
bei der Anzahl der berücksichtbaren Kontexte und der schätztbaren Parametern muß der Anwender Abstriche machen. Bei Zweiebenenmodellen liegt die Begrenzung der Fallzahl bei 7.200
Befragten in 350 Level-2-Kontexten. Dreiebenenmodelle können bis zu 7.500 Befragten in
1.700 Level-2 und 60 Level-3-Kontexten berücksichtigen. Pro Within- bzw. Between-Regressionsgleichung lassen maximal 5 Parameter schätzen, wobei die Gesamtzahl der β und γKoeffizienten auf 25 begrenzt ist. Die Studentenversion unterstützt lediglich den Import von
Daten aus SPSS, SYSTAT oder SAS, wobei die Option des Einlesens von ASCII-Rohdaten
weiterhin besteht. Sie enthält aber eine vollständige Online-Hilfe, die weitgehend das Programmhandbuch abdeckt, sowie alle Anwendungsbeispiele der Vollversion.
Die Studentenversion von HLM 5 kann der Anwender von der folgenden Internetadresse
kostenlos beziehen: url: http://www.ssicentral.com/other/hlmstu.htm.
9. Literaturverzeichnis
Aldrich, J.H.& Nelson, F.D. (1984):
Linear probability, logit, and probit models. Newbury Park: SAGE
(Quantitative Applications in the Social Sciences, 45)
Amemiya, T. (1981):
Qualitative response models: a survey. In: Journal of Economic Literature, 21, S. 1483-1536
Busing, F.M.T.A, Meijer, E. & van der Leeden, R. (1994):
MLA. Software for MultiLevel Analysis of Data with Two Levels. User‘s Guide for Version
1.0b. Leiden: Department of Psychometrics and Research Methodology at Leiden University.
Cragg, S.G.& Uhler, R. (1970):
The demand for automobiles. In: Canadian Journal of Economics, 3, S. 386-406
DeMaris, A. (2002):
Explained Variance in Logistic Regression. A Monte Carlo Study of Proposed Measures. In:
Sociological Methods&Research, 31, 1, S. 27-74
Efron, B. (1978):
Regression and Anova with zero-one data. Measures of residual variation. In: Journal of
American Statistical Association, 73, S. 113-121
Gibbons, R.D. & Hedeker, D. (1998):
Applications of Mixed-Effect Models in Biostatistics. Chicago, Ill.: Division of Epidemiology & Biostatistics, School of Public Health, University of Illinois at Chicago.
url: http://www.uic.edu/~hedeker/works.html (Pdf-Datei: sankhya3.pdf)
WiSe 2001/2002
146
Goldstein, H. (19993):
Multilevel Statistical Models. London: Multilevel Models Project, Institute of Education,
University of London (url: http://www.arnoldpublishers.com/support/goldstein.htm)
Greene, W.H. (20035):
Econometric Analysis. Upper Saddle River, New Jersey: Prentice Hall
Greene, W.H. (2003):
EA/LimDep. For Econometric Analysis, 5th edition Version 2.0. Upper Saddle River, New
Jersey: Prentice Hall. url: http://www.prenhall.com/greene/0130661899.html
Hagle, T.M. & Mitchell II,G.E. (1992):
Goodness of fit measures for probit and Logit. In: American Journal of Political Science,
36, 3, S. 762-784
Hedeker, D. & Gibbons, R.D. (1996a):
MIXOR: a computer program for mixed-effects ordinal regression analysis. In: Computer
Methods and Programs in Biomedicine, 49, S. 157-176
Hedeker,D. & Gibbons, R. D. (1996b):
MIXOR: a computer program for mixed-effects ordinal regression analysis. Chicago, Ill.:
Division of Epidemiology&Biostatistics, School of Public Health, University of Illinois at
Chicago. url: http://www.uic.edu/~hedeker/works.html
Hedeker, D. (1999):
MIXOR (version 2): a program for 2-level cumulative link models. Some enhancements,
extensions, and examples. Chicago, Ill.: Division of Epidemiology&Biostatistics, School of
Public Health, University of Illinois at Chicago.
url: http://www.uic.edu/~hedeker/manuals.html
Hox, J. (2002):
Multilevel Analysis. Techniques and Applications. Mahwah, New Jersey: Lawrence Earlbaum
Langer, W. (2000):
The Assessment of Fit in the Class of Logistic Regression Models: A Pathway out of the
Jungle of Pseudo-R2. Köln: RC33-Kongress der ISA. Beziehbar über:
url: http://www.soziologie.uni-halle.de/langer/papers.shtml
Maddala, G.S. (1983):
Limited-dependent and qualitative variables in econometrics. Cambridge: Cambridge
University Press
McCullagh, P. (1980):
Regression Models for Ordinal Data. In: Journal of Royal Statistical Society, B, 42, 2,
S.109-144
McCullagh, P. & Nelder, J.A. (19892):
Generalized Linear Models. London: Chapman&Hall
McFadden, D. (1979):
Quantitative methods for analysing travel behaviour of individuals: some recent developments. In: Hensher, D.A.& Stopher, P.R.: (eds): Behavioural travel modelling. London:
Croom Helm, S. 279-318
McKelvey, R. & Zavoina, W. (1975):
A statistical model for the analysis of ordinal level dependent variables. In: Journal of
Mathematical Sociology, 4, S. 103-20
WiSe 2001/2002
147
Miethe, T.D.(1991):
Citizen-Based Crime Control Activity and Victimization Risks:
An Examination of Displacement and Free-Rider Effects. In: Criminology, 29, S. 419-439
Miethe, T.D.(1997):
Testing Theories of Criminality and Victimization in Seattle 1960-1990.
Ann Arbor, Michigan: Inter-Univeristy-Consortium of Political and Social Research (ICPSR
Study No. 9741, 1st edition), url: http://www.icpsr.umich.edu
Miethe, T.D. & Meier, R.F. (1994):
Crime and Its Social Context. Toward an Integrated Theory of Offenders, Victims and
Situations. Albany, N.Y.: State University of New York Press
Nagelkerke, N.J.D. (1991):
A note on a general definition of the coefficient of determination. Biometrika, 78, 3, S.
691-693
Rasbash, J., Browne, W., Goldstein, H., Yang, M., Plewis, I., Healy, M., Woodhouse, G.,
Draper,D., Langford, I. & Lewis, T. (2000):
A user‘s guide to MlwinN. Version 2.1. London: Multilevel Models Project, Institute of
Education, University of London
Raudenbush, S.W. & Bryk, A.S. (20022):
Hierarchical Linear Models. Applications and Data Analysis Methods. Thousand Oaks, Ca:
SAGE (Advanced Quantitative Techniques in the Social Sciences Series, 1)
Raudenbush, S.W., Bryk,A.S., Cheong, Y.F. & Congdon (2001):
HLM 5. Hierarchical Linear and Nonlinear Modelng. Chicago, Ill.: Scientific Software
International
Raudenbush, S.W. & Yang, M. (1998):
Numerical Integration via High-Order, Multivariate LaPlace Approximation with Application to Multilevel Models. In: Multilevel Modelling Newsletter, 10, 2 (Internetzeitschrift des Multilevel Models Project des Institute of Education, University of London:
url: http://www.ioe.ac.uk/multilevel/
Raudenbush, S.W., Yang, M. & Yosef, M. (2000):
Maximum Likelihood for hierarchical models via high-order, multivariate LaPlace approximation. In: Journal of Computational and Graphical Statistics, 9, 1, S. 141-157
Rountree, P.W., Land, K.C. & Miethe, T.D.(1994): Macro-Micro Integration in the Study of
Victimization: A Hierarchical Logistic Model Analysis across Seattle Neighborhoods. In:
Criminology, 32 S.387 - 414
Rountree, P.W. & Land, K.C. (1996): Perceived Risk versus Fear of Crime: Empirical
Evidence of Conceptually Distinct Reactions in Survey Data. In: Social Forces, 74, 4,
S. 1353-1376
Snijders, T. & Bosker, R. (1999):
Multilevel Analysis. An introduction to basic and advanced multilevel modelling. London:
SAGE
Veall, M.R. & Zimmermann, K.F. (1992):
Pseudo-R2 in the ordinal probit model. In: Journal of Mathematical Sociology, 16, 4, S.
333-342
Veall, M.R. & Zimmermann, K.F. (1994):
Evaluating Pseudo-R2's for binary probit models. In: Quality&Quantity, 28, S. 151- 164
WiSe 2001/2002
148
Windmeijer, F.A.G. (1995):
Goodness-of-fit measures in binary choice models. In: Econometric Reviews, 14, 1, S.
101-116
Zimmermann, K.F. (1993):
Goodness of fit in qualitative choice models: review and evaluation. In: Schneeweiß, H. &
Zimmermann, K. (eds): Studies in applied econometrics. Heidelberg: Physika, S. 25-74

Mehrebenenmodelle für diskrete Kriteriumsvariablen am Beispiel

Transcrição

Documentos relacionados

WISE GUYS

lebenslauf dr. daniela piontek - IFT

Live im Capitol

Golf Park Leipzig-Seehausen e.V., 04356 Leipzig Seehausen

klicken, um PDF runterzuladen.

madmoo

Burgund - Winedine

Fachkraft für Lagerlogistik - Berufsförderungswerk Sachsen

Georg Herwegh, Joseph von Eichendorff und Heinrich Heine

Golfplätze - Grand Hotel National