Mehrebenenmodelle für diskrete Kriteriumsvariablen am Beispiel
Transcrição
Mehrebenenmodelle für diskrete Kriteriumsvariablen am Beispiel
Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 1 Mehrebenenmodelle für diskrete Kriteriumsvariablen am Beispiel des Einsatzes eines 2-Ebenen-Logitmodells in der amerikanischen Viktimisierungsforschung Gliederung: 1. Die theoretischen Ansätze des Seattle-Viktim-Surveys 2 2. Das Erhebungsdesign der Seattle Telephone Survey und die Operationalisierung der theoretischen Begriffe 12 3. 3.1 3.2 Die Dokumentation des für WHLM 5 aufbereiteten MIETHEWHLM-Datensatzes 19 Die erhobenen Individual- und Nachbarschaftsmerkmale 19 Makrosoziale Erklärungsfaktoren der Viktimisierung auf der Census-Tract-Ebene 29 4. Die statistischen Grundlagen „Hierarchischer Verallgemeinerter Linearer Modelle“ am Beispiel der binären logistischen Regression für Individualdaten 35 5. Entwicklung eines Auswertungsdesigns 43 6. 6.1 6.2 1. Arbeitsschritt: Explorative, hypothesengeleitete Analysen 45 Explorative Analyse des Viktimisierungsrisikos innerhalb der Nachbarschaften 45 Explorativen Analysen der Viktimisierungsraten durch Gewaltdelikte auf der Nachbarschaftsebene 53 Entwicklung eines Mehrebenenmodells für die Erklärung des Viktimisierungsrisikos durch Gewaltdelikte 60 6.3 7. 7.1 7.2 7.3 7.4 7.5 8. Die Schätzung des Generalized Hierarchical Linear Model mit HLM 5 Das Importieren von SPSS-Daten in HLM 5 Arbeitsschritt 2: Die Schätzung des Random-Intercept-Only-Logit-Model Arbeitsschritt 3: Schätzung Random-Intercept-Logit-Model mitexogenen Individualmerkmalen Arbeitsschritt 4: Schätzung des Random-Logit-Intercept-Random-Logit-SlopeModel Arbeitsschritt 5: Schätzung der Coefficient-as-Outcome-Logit-Models 63 63 71 82 87 91 8.1 8.2 8.3 8.4 8.5 Schätzung des logistischen Zweiebenenmodells mit dem Freeware-Programm MIXOR Aufbereitung der Miethe-Viktimisierungsdaten in SPSS Schätzung des Fixed-Logit-Intercept-Modells mit MIXOR Schätzung des Random-Intercept-Only-Logit-Modell mit MIXOR Schätzung des Random-Intercept-/Random-Slope-Logit-Modell mit MIXOR Schätzung des Coefficient-as-Outcome-Logit-Modells mit MIXOR 114 116 119 125 129 136 9. Literaturverzeichnis 145 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - 1. WiSe 2001/2002 2 Die theoretischen Ansätze des Seattle-Viktim-Surveys Miethe und sein Projektteam führten 1990 einen Telefonsurvey in Seattle durch, dessen Forschungsschwerpunkt auf den Opferfahrungen der Befragten, ihrer Kriminalitätsfurcht sowie ihrem subjektiven Sicherheitsgefühl lag. Als besonders innovativ erwies sich ihr Forschungsdesign im Hinblick auf die Integration „ökologischer Erklärungsfaktoren“ für die Viktimisierungserfahrungen und die Kriminalitätsfurcht. Um das differentielle Viktimisierungsrisiko unterschiedlicher Bevölkerungsgruppen zu erklären, verwendeten Miethe&Meier (1994) zwei theoretische Ansätze, die den Viktimisierungsprozeß sowohl aus der Sicht des Opfer als auch des Täter beleuchten. Zum einen griffen sie auf den von Hindelang, Gottfredson&Garofalo (1978) entwickelten „Lifestyle“-Ansatz zurück, der die unterschiedlichen Viktimisierungsrisiken bei Gewaltdelikten auf einen „risikoträchtigen“ Lebenstyle des Opfers zurückführt. Zum anderen verwendeten sie den von Hough (1987) vorgeschlagenen Rational-Choice-Ansatz, um aus der Sicht des Täters, die Auswahl eines spezifischen Opfers zu erklären. Miethe&Meier (1994, S. 32ff.) fassen den von Hindelang, Gottfredson&Garofalo (1978) entwickelten „Lifestyle“-Ansatz folgendermaßen zusammen: „THE LIFESTYLE-EXPOSURE THEORY OF VICTIMIZATION One of the first systematic theories of criminal victimization was the lifestyle-exposure approach developed by Hindelang, (Gottfredsem, and Garofalo ( 1978). This theory was originally proposed to account for differences in the risks of violent victimization across different social groups, but has been extended to include property crime, and forms the basis for more elaborate theories of target-selection processes (see Hough 1987; Miethe and Meier 1990). The basic premise underlying the lifestyle-exposure theory is that demographic differences in the likelihood of victimization are attributed to differences in lifestyles. Variations in lifestyles are important because they are related to the differential exposure to dangerous places, times, and others-i.e., situations in which there are high risks of victimization. A graphic representation of this theoretical perspective is presented in Figure 3.1. From this perspective, an individual's lifestyle is the critical factor that determines risks of criminal victimization. Lifestyle is defined in this context as "routine daily activities, both vocational activities (work, school, keeping house, etc.) and leisure activities" (Hindelang et al. 1978, 241 ). Differences in lifestyles arc socially determined by individuals' collective responses or adaptations to various role expectations and structural constraints (see Figure 3.1 ). Under this theoretical model, both ascribed and achieved status characteristics (e.g., age, gender, race, income, marital status, education, occupation) are important correlates of predatory crime because these starts attributes carry with them shared expectations about appropriate behavior and structural obstacles that both enable and constrain one's behavioral choices. Adherence to these cultural and structural expectations leads to the establishment of routine activity patterns and associations with others similarly situated. These lifestyles and associations arc expected to enhance one's exposure to risky or vulnerable situations that, in turn, increase an individual's chances of victimization. Several examples will clarity the basic logic underlying this lifestyle-exposure model. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 3 Despite major efforts to promote greater gender equality in American society, there remain fundamental differences in role expectations and structural opportunities for men and women. Gender stereotyping; results in gender differences in such basic activities as where and with whom time is spent, the degree of supervision in daily activities, the likelihood of contact with strangers, and the exposure to risky and dangerous public places. For example, females spend a greater proportion of their time inside the home because as adolescents they are more closely supervised than males, and as adults they arc more likely to assume housekeeping; and childrearing responsibilities (Hindelang et al. 1978). Greater familial responsibilities and the systematic denial of educational and economic opportunities may severely impede women's participation in public life. Furthermore, even when engaged in public activity, women's routine activities arc more likely than men's to take place in the presence of friends and intimate others, rather than in isolation. These role expectations and structural impediments are assumed to increase private domestic activities among women, increase supervision of their public behavior, decrease their exposure to high risk persons and places, and subsequently decrease their relative risks of criminal victimization. Men, on the other hand, are traditionally socialized to be active in the public domain, assertive and aggressive in social situations, have fewer restrictions on their daily lives, and spend more time away from a protective home environment. Accordingly, gender differences in traditional lifestyles are said to explain the higher victimization risks of men. Other strong determinants of lifestyle and exposure to crime are economic resources and family income. As a fundamental aspect of stratification, income determines whether structural conditions either enable or constrain various aspects of social life. For persons who are economically disadvantaged, low income severely restricts choices with regard to housing, transportation, associations with others, and leisure activities. Individuals' abilities to move out of crime-prone environments, live in apartments or homes with elaborate security measures (e.g., security guards, video surveillance, burglar alarms), avoid contact with potential offenders, and undertake leisure activities in safer areas arc limited when living under conditions of economic despair. As family income increases, there is greater flexibility to adjust one's lifestyle to select the area in which to live, the mode of transportation the daily activities, the amount of time spent in private versus public places, and the type of leisure activities (Hindelang et al. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 4 1978). The greater choices afforded persons with higher economic resources allow them to more easily avoid risky and vulnerable situations. Thus, by patterning the nature of social life, income is a lifestyle characteristic that is expected to lead to differential risks of victimization. From a lifestyle-exposure perspective, differences in risks of violent victimization by gender, income, and other status characteristics are attributed to differences in lifestyles that increase individuals' exposure to risky and vulnerable situations. Given that victimization risks arc not uniformly distributed across time and space, lifestyles are assumed to affect the probability of victimization because different lifestyles are associated with differential risks of being in particular places, at particular times, under particular circumstances, and interacting with particular kinds of people. Accordingly, persons who arc between 18 and 30 years old, male, not married, low income and black should have higher risks of violent victimization than their counterparts because each group is thought to engage in more public activity (especially at night), spend less time with family members, and/or associate more frequently with persons who have offender characteristics. Under this theoretical model, individuals' risks of property theft from their dwelling should also he higher among those social groups (e.g., young, malt, single persons) who spend more time engaged in public activity because such persons would be less able to protect their property from crime. If a lifestyle-exposure theory is an adequate explanation for differential risks of predatory victimization, several outcomes would be expected. First, if demographic differences in victimization risks are due to differences in lifestyles and routine activities, the impact of each demographic variable (e.g., age, gender, race, social class) should decrease in importance once separate measures of lifestyles and routine activities are included as control variables. Second, persons with the configuration of status characteristics commonly recognized as having the most vulnerable lifestyles (i.e., young, single, low income, black males) should have a greater risk of victimization than any other configuration, and their exact opposites (i.e., older, married, high income, white, females) should have the lowest relative risks. Third, given increases in efforts to promote gender and racial equality in all institutional domains over the last two decades, differences in victimization risks by these factors should decrease over time. In other words, smaller differences in victimization risks by gender and race would be expected over time if there were fewer groupspecific role expectations and fewer structural obstacles that impede the daily activities of persons within each of these groups.“ Den von Hough (1987) entwickelten täterorientierten Rational-Choice Ansatz fassen sie folgendermaßen zusammen: „Conceptualizing Target-Selection Processes Both routine activity and lifestyle-exposure theories attempt to explain crime rates and clarify why particular groups of individuals have higher risks of victimization than others. Differences in victimization risks for different demographic groups (e.g., males, young persons, non-whites, low income) are attributed to differences in lifestyles and routine activities that enhance individuals' exposure to risky times, places, and potential offenders. However, neither approach develops an adequate micro-level theory to account for the selection of particular crime targets within a particular socio-spatial context. This is the case because both theories pay little attention to factors associated with criminality and offender motivation. Offender motivation, in these theories, is either assumed to be constant or there is no explicit reference to what Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 5 motivates people to commit crime (sec Cohen and Land 1987). A closer examination of these theories, however, reveals two specific images of criminality. First, an implicit assumption underlying criminal opportunity theories is that offender motivation is at least partially caused by the lack of external physical restraints. Criminal intentions are translated into actions when there is a suitable person or object for victimization, and "an absence of ordinary physical restraints such as the presence of other people or objects that inhibit, or are perceived to inhibit, the successful completion of direct contact predatory crime" (Cohen and Land 1987: 51 ). Second, offenders are assumed to make choices, no matter how rudimentary, in the selection of targets for victimization. In fact, it is this rational conception of criminal behavior underlying current victimization theories which offers the most premise in explaining target-selection processes. From the perspective of a "reasoning criminal" (Cornish and Clarke 1986), offenders seek to benefit themselves by their criminal behavior and select victims who offer a. high payoff with little effort or risk of detection. The decision to get involved in crime, and the subsequent choice of particular crime victims, are influenced by the constraints of time, ability, energy, limited information, and the availabiliy of alternatives. Nonetheless, offenders are assumed to engage in some level of planning and foresight, and adapt their behavior to account for situational contingencies (Cornish and Clarke 1986). Through selective filtering and processing of information, the rational offender is believed to select from a pool of potential victims those targets thought to offer the greatest net rewards. Interviews with convicted offenders reveal that many personal and situational factors are considered in the selection of crime targets. Burglars, for example, report that the risks of detection (i.e., the likelihood of getting caught), the potential yield or reward, and the relative ease at which the home can be entered are the critical factors in selecting targets for victimization (see Bennett and Wright 1984). Similar aspects of the physical environment and victim characteristics are considered by other offenders (e.g., robbers, muggers) when selecting crime targets (see Cornish and Clarke 1986). Hough (1987) has developed a conceptual framework to explain target selection which clarifies the importance of routine activities and lifestyles in this process. According to Hough (1987: 359), this conceptual scheme considers it axiomatic that if members of one group are selected as crime targets more frequently than another, they must meet at least one of three conditions: (a) exposed more frequently to motivated offenders (proximity), (b) more attractive as targets in that they afford a better "yield" to the offender (reward), or (c) more attractive in that they are more accessible or less defended against victimization (absence of capable guardians). This theoretical approach is graphically represented in Figure 3.2. The value of this perspective for understanding criminal victimization is that it clearly states that differences in proximity, attractiveness, or guardianship can account for differences in individuals' risks of victimization, and that persons who possess each of these characteristics are especially vulnerable to crime. Consistent with both routine activity and lifestyle-exposure theory, these differences in targetselection factors are determined by individuals' routine activities and lifestyles. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 6 Although this revised model clarifies the role of routine activities and lifestyles in targetselection processes, it is still limited in several respects. First, victimization most likely occurs under conditions of proximity, reward and no guardianship, but the model does not specify which factor is most important. Second, while interviews with convicted offenders suggest that target-selection factors may vary widely for different types of predatory crime (see Bennett and Wright 1984; Carroll and Weaver 1986; Cornish and Clarke 1986; Feeney 1986; Walsh 1986), this theoretical perspective does not capture these crime-specific differences. Third, even within particular types of crime (e.g., muggings), there appear to be major differences in factors associated with target selection between novice and seasoned offenders (Cornish and Clarke 1986). These within-crime differences are also not directly incorporated in the model. Nonetheless, the conceptual framework outlined by Haugh (1987) is a major improvement over the original formulations of routine activity and lifestyle-exposure theories.“ (A.a.O., S. 41ff.) Miethe&Meier(1994) diskutieren ausführlich die zentralen Kontrukte der von ihnen referierten Viktimisierungstheorien. Aus ihrer Sicht bilden die Begriffe „Proximity to Crime“, „Exposure to Crime“, „Target Attractiveness“ sowie „Capable Guardianship“ das gemeinsame Fundament der von ihnen dargestellten Ansätze: „MAJOR CONCEPTS IN VICTIMIZATION THEORIES Although the terminology differs across studies, the central concepts underlying criminal opportunity theories of victimization are proximity to crime, exposure, target attractiveness, and guardianship. The measurement of these concepts and their empirical validity in previous studies arc outlined below. Proximity to Crime One major factor that is presumed to increase the likelihood of victimization is physical proximity to high-crime areas.. Following Cohen et al. (1981: 507), proximity is best represented as the physical distance between areas where potential targets of crime reside and areas Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 7 where relatively large populations of potential offenders are found. Living in a high-crime area increases the likelihood of frequent contact with offenders, and thus increases one's risks of victimization. The fact that persons spend a majority of their time around the home, and that offenders tend to select targets in close proximity to their residence (see Hindelang et al. 1978) further indicates the adverse consequences of living in a high-crime area. Both theories of criminality and research in the spatial ecology of crime identify characteristics of high-crime areas.. Macro-sociological theories of criminality (e.g., social disorganization, anomie, differential social organization) suggest that high-crime geographical areas have high levels of population turnover, ethnic heterogeneity, and low socio-economic status. However, the work on deviant places and "hot spots" (Stark 1987; Sherman et al. 1989) indicates that even within a large geographical area with a high crime rate (e.g., neighborhood, subdivision, a side of town) there is enormous variation in the amount of crime. From this perspective, some places (e.g., bars, convenience stores" adult bookstores, apartment complexes) are more dangerous than others because they attract deviant and crime-prone people, provide more targets for victimization, and have a diminished capacity for social control.. Living near major transportation arteries, fast-food restaurants, bus stops, schools, and other places which attract a larger number of strangers would also increase one's vulnerability to crime for similar reasons. Common measures of physical proximity used in previous research include place of residence (e.g., rural or urban resident), socio-economic characteristics of the area (e.g., income level, unemployment rate, racial composition) and the perceived safety of the immediate neighborhood (see Cohen et al. 1981; Hough 1987; Lynch 1987; Sampson and Wooldredge 1987; Miethe and Meier 1990). The average rate of offending in an individual's immediate neighborhood is probably the best single indicator of proximity, but selt-report and official measures of offending are rarely available at the neighborhood level. Studies using the British Crime Survey (Sampson and Wooldredge 1987; Miethe and Meier 1990) are the exception to this rule. The absence of multi-level research designs has been a major impediment to the development of measures of offending rates in models of victimization risks. Previous empirical studies generally find that measures of proximity are associated with increased risks of victimization. For example, we found in our study of British residents (Miethe and Meier 1990) that persons who lived in inner city areas, perceived their neighborhood to be unsafe at night, and lived in areas with higher levels of offending had higher risks of burglary, personal theft, and assault victimization. Using a seven-category variable based on the income of neighborhoods and the size of the population, Cohen et al. (1981) found that persons who lived in central cities and low-income areas had higher risks of assault, burglary, and personal larceny than persons who lived in other types of areas. Given the high levels of residential segregation in the United States based on status characteristics, the observed association between particular demographic factors (e.g., low income, being single, non-white, high residential mobility) and individuals' risks of victimization may also be attributed to the proximity of these social groups to pools of motivated offenders (see Hindelang et al. 1978; Miethe et al. 1987; Smith and Jarjoura 1989). However, as will be discussed shortly, it is important to note that such findings are also consistent with other major components of victimization theories (i.e., exposure, target attractiveness, and low guardianship). Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 8 Exposure to Crime Contrary to proximity, which reflects the physical distance between large numbers of offenders and victims, "exposure to crime" is indicative of one's visibility and accessibility to crime (Cohen et al. 1981; Miethe and Meier 1990). Accordingly, a building or dwelling has higher exposure to burglary if it is detached from other units, has multiple points of entry, and is located on a corner lot. Persons are exposed to higher risks of personal theft and assault when their routine activities and lifestyles place them in risky or vulnerable situations at particular times, under particular circumstances, and with particular kinds of persons. For example, risks of personal victimization are assumed to be directly related to the amount of time spent in public places (e.g., streets, parks) and, especially, public places at night (Hindelang et al. 1978: 251). Furthermore, the research on "hot spots" suggests that frequent contact with drinking establishments, bus depots, public transit, convenience stores, shopping malls, and other dangerous public places would also increase one's exposure to crime (Sherman et al. 1989). The primary means by which exposure has been measured in past studies involves the level and nature of non-household activity. Several authors have used the individual's primary daily activity as a measure of exposure (e.g., Cohen and Cantor 1980, 1981; Cohen et al. 1981; Miethe et al. 1987), arguing that persons who are employed or in school have greater exposure to crime because such persons spend more time away from home. More detailed indicators of this concept include the average number of evenings per week spent outside the home for leisure activities, and the average number of hours per week the dwelling is unoccupied during the day or night (see Sampson and Wooldredge 1987; Masscy et al. 1989; Miethe and Meier 1990). When applied to the study of crime rates, measures of exposure have included the household activity ratio (see Cohen and Felson 1979), aggregate rates of television viewing, the supply of entertainment establishments (e.g., commercial cinemas, profit-making sport activities, opera and symphony orchestra companies), public transportation, female labor force participation, and retail sales from eating and drinking establishments (see Messner and Blau 1987; Miethe, Hughes and McDowall 1991). Previous studies yield mixed results about the impact of exposure on individuals' risks and aggregate rates of victimization. Increases in non-household activity are associated with higher crime rates in some studies (e.g., Cohen and Felson 1979; Cohen et al. 1980; Felson and Cohen 1980) but not in others (Miethe et al. 1991). Increases over time in individuals' levels of daytime and nighttime activity outside the home do not necessarily lead to increased risks of violent or property victimization (Miethe, Stafford, and Sloane 1990), whereas cross-sectional analyses generally reveal that victimization risks are higher for persons who have higher levels of activity outside the home (Hough 1987; Sampson and Wooldredge 1987; Massey ct al. 1989; Kennedy and Forde 1990; Miethe and Meier 1990). Studies of the physical characteristics of burgled households and interviews with known offenders also suggest that the visibility and accessibility of targets influence risks of victimization (see Reppetto 1974; Waller and Okihiro 1978; Walsh 1980; Bennett and Wright 1984; Hough 1987). Unfortunately, little research has examined how active participation in particular types of routine activities (e.g., bar visits, visiting places where teenagers "hang out") influences risks of violent victimization. Target Attractiveness A central assumption underlying current victimization theories is that particular targets arc selected because they have symbolic or economic value to the offender. However, crime targets Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 9 are also attractive to offenders when they are smaller in size (i.e., more portable) and offer less physical resistance against attack or illegal removal (see Cohen et al. 1981). Under a structural-choice model of victimization (Miethe and Meier 1990), it is the differential value or subjective utility associated with crime targets that determines the source of victimization within a social context. A variety of indicators of target attractiveness have been used in past research. In the original work on routine activity theory, Cohen and Felson (1979) compared the theft rate for portable and movable durables (e.g., electronic components, television sets, radios, automobiles and their accessories) with their overall circulation rate. The decreased size of these durable goods from the early 1960s through the mid 1970s also corresponds with increases in official crime rates in the United States. However, the supply of many of these portable durable goods (e.g., televisions, radios, car tape players, phonograph cartridges) may not be a good indicator of target attractiveness for studies of crime rates over time when one considers that the reduced costs and increased availability of many of these items may lead to their devaluation as "attractive" crime targets. As a general proxy for purchasing power and the supply of expensive goods, median family income and the gross national product are aggregate measures of target attractiveness that are not susceptible to such a devaluation over time. The major measures of target attractiveness at the individual-level of analysis have been the ownership of expensive and portable consumer goods (e.g., video-cassette recorders, color television sets, bicycles, motorcycles), the possession of cash and jewelry in public, family income and social class (see Sampson and Wooldredge 1987; Miethe and Meier 1990). As a measure of economic attractiveness, family income should be a good indicator of this concept because it can be recognized immediately by offenders in most cases (e.g., through the geographical location of a dwelling within a city, its exterior condition, or the general appearance of the individual). However, in the case of expressive acts of interpersonal violence, it is difficult to think of an unambiguous measure of target attractiveness. The results of previous research provide mixed support for the importance of target attractiveness in explaining individuals' risks and aggregate rates of victimization. Greater risks of victimization for persons with higher income are observed in some studies but not in others (see Cohen and Cantor 1980, 1981; Cohen et al. 1981; Hough 1987; Miethe and Meier 1990; Miethe, Stafford, and Sloane 1990). Persons who carry larger sums of money while in public places have a greater net risk of assault victimization, but ownership of a video-cassette recorder was found to either decrease or have no significant impact on individuals' risks of burglary (Sampson and Wooldredge 1987; Miethe and Meier 1990). Studies of crime rates for geographical areas also yield inconsistent results about the relationship between economic conditions and crime rates (see Cohen et al. 1980; Cohen 1981; Stahura and Sloan 1988; Miethe, Hughes, and McDowall 1991). Capable Guardianship The final major component of current victimization theories involves the ability of persons or objects to prevent the occurrence of crime. Guardianship is usually conceptualized as having both social (interpersonal) and physical dimensions. Social guardianship includes the number of household members, the density of friendship networks in the neighborhood, and having neighbors watch property or a dwelling when the home is unoccupied. The availability of others (e.g., friends, neighbors, pedestrians, law enforcement officers) may prevent crime by their presence alone or through the offering of assistance to ward off an attack. Physical guardians- Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 10 hip involves target-hardening activities (e.g., door/window locks, window bars, burglar alarms, guard dogs, ownership of firearms), other physical impediments to household theft (e.g., street lighting, guarded public entrances), and participation in collective activities (e.g., Neighborhood Watch programs, home security surveys). Regardless of its particular form, the availability of capable guardianship is important because it indicates increased "costs" to would-be offenders (e.g., greater effort, greater risk of detection and apprehension), and thus decreases the opportunity for victimization. A review of previous research on guardianship activities reveals several general trends. First, target-hardening efforts are widespread in the United States. The majority of urban residents take routine precautions against crime, including locking doors and windows, using exterior lighting and having neighbors watch their property (Dubow 1979; Skogan and Maxfield 1981; Miethe 1991). Collective crime prevention activities (e.g., property marking projects, Neighborhood Watch) have also been organized throughout the country (see Rosenbaum 1987, 1990). Second, the success of guardianship activities has been mixed. Physical and social guardianship is associated with lower rates of victimization in several studies but not in others (see Scarr 1973; Reppetto 1974; Skogan and Maxfield 1981; Lavrakas et al. 1981; Winchester and Jackson 1982; Yin 1986; Rosenbaum 1987, 1990; Miethe and Meier 1990). However, several authors (Mayhew 1984; Miethe 1991 ) argue that the use of crosssectional designs and the lack of a clear temporal ordering among variables have contributed to these inconsistent results due to the "victimization effect" (i.e., the tendency for persons to take precautions as a consequence of being victimized). Third, few studies of guardianship have exercised sufficient controls for other factors influencing victimization risks. Under such conditions, it is impossible to ascertain whether differences between protected and unprotected residents are due to the deterrent effect of protective actions or to other factors (e.g., lifestyles, target attractiveness, proximity to highcrime areas) which also alter the likelihood of victimization (see Miethe 1991).“ Für ihre Level 1-Ebene der Befragten in ihrer Nachbarschaft haben Miethe und Meier auf der Grundlage der von ihnen referierten Theorien mittlerer Reichweite die folgenden Hypothesen aufgestellt: „Our review of the literature on theories of victimization reveals seven major research hypotheses. Finding empirical support for each of them across different levels of analysis and research designs would clearly document the importance of an opportunity perspective in understanding predatory crime. Using various sources of data, the following research hypotheses will be addressed in the current study: Hl. Demographic differences (eg., age, gender, race, income, marital status, education) in victimization risks should decrease in magnitude once controls are introduced for routine activities and lifestyles. This hypothesis is based on the assumption that demographic differences in victimization risks are due to differences in routine activities and lifestyles (Hindelang et al. 1978; Miethe et al. 1987). H2. Persons with the configuration of status characteristics commonly recognized as having the most vulnerable lifestyles (i.e., young males, lowincome young males) should have a greater risk of victimization than any other status configuration. These differences in victimization risks should also be explained by differences in the level of non-household activity for each group. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 11 H3. Differences in victimization risks by status characteristics should dissipate over time. Such an outcome would be expected if role expectations and structural constraints based on status attributes have weakened in the United States over the last three decades. Given the specific efforts to promote gender and racial equality in all institutional domains, differences in victimization risks by either gender or race should exhibit the greatest decrease in magnitude over time. H4. The greater the proximity to motivated offenders, the higher the risks of victimization. This expected positive relationship should hold true with and without controls for other variables that influence criminality and victimization risks. H5. The greater the exposure to risky and vulnerable situations, the higher the risks of victimization. This expected positive relationship should hold true with and without controls for other variables that influence criminality and victimization risks. H6. The greater the attractiveness of the crime target, the higher the risks of victimization. This relationship should hold true with and without controls for other variables that influence criminality and victimization risks. H7. The greater the level of guardianship, the lower the risks of victimization. This relationship should hold true with and without controls for other variables that influence criminality and victimization risks. In addition to these basic relationships, we will also examine whether criminal opportunity theories are better able to predict victimization risks for some types of crimes than others, and whether the impact of each theoretical component varies across different social contexts.“ (A.a.O., S. 57f.) Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - 2. WiSe 2001/2002 12 Das Erhebungsdesign der Seattle Telephone Survey und die Operationalisierung der theoretischen Begriffe Miethe und seine Mitarbeiter entwickelten einen speziellen Stichprobenplan, der drei Ebenen umfaßt. Innerhalb der 100 Census Tracts (Volkszählungsbezirke mit im Durchschnitt 5.000 Bewohnern), deren Grenzen sich seit 1960 nicht geändert hatten, wählten sie drei Straßenblöcke als zweite Ebene aus. Jedes dieser Triple setzt sich zusammen zunächst aus einem Block, in dessen zugehörigen Straßen die Polizei Seattles 1989 einen Einbruch registriert hat. Beim zweiten Block handelt es sich jeweils um den unmittelbar an den Viktimisierungsstraße angrenzenden Block. Der dritte Block dient als Kontrolleinheit und wurde unter den vier angrenzenden Straßenblocks nach dem Zufallsprinzip ausgewählt. Aus unmittelbar benachbarten Wohngebäuden wurden innerhalb jedes Blocks 18 Haushalte gezogen, die im Bedarfsfall bei häufigen Interviewverweigerungen um weitere Haushalte ergänzt wurden. Ingesamt realisierte das Projektteam 5.302 Interviews mit den erwachsenen Anschlußinhabern in 300 Nachbarschaften, die sich gleichmäßig auf die 100 Volkszählungsbezirke verteilen. Zusätzlich haben die Autoren für die dritte Ebene der 100 Volkszählungsbezirke weitere Indikatoren zur Einkommensarmut, Bevölkerungsmobilität, ethnischen Heterogenität, zur familialen Desorganisation und zur Kriminalitätsbelastung aus den amerikanischen Volkszählungen von 1960, 1970 und 1980 sowie dem Uniform Crime Report entnommen. Miethe und Meier (1994, S. 79ff.) beschreiben ihr spezielles Untersuchungsdesign folgendermaßen: „The primary data source used in this study to evaluate the theories of victimization involves a telephone survey of 5,302 residents of Seattle, Washington The interviews were conducted from February to May of 1990. The telephone survey was part of a large study of crime in Seattle over the last three decades, and was funded by a grant from the National Science Foundation. Three research questions underlie this larger project: ( 1) Do the major components of criminal opportunity theories of victimization (i.e., proximity, exposure, target attractiveness, guardianship) adequately account for individuals' risks and neighborhood rates of violent crime and property victimization?, (2) Do socio-economic changes in geographical areas explain the changes in their crime rates over time?, and (3) How does the target-hardening efforts of residents and their immediate neighbors influence individuals' risks of victimization? To evaluate how the wider social context of crime control activities influences individuals' risks of victimization, a complex sampling design was used to select immediate neighbors and bordering city blocks. 'The final sample involves 5,302 residents who live on 600 city blocks in 100 of the 121 census tracts in Seattle. Stratifying the sample by both census tract and city blocks within tracts insured a sufficient number of respondents for each of these aggregate units. The 100 census tracts used here represent a random subsample of the 114 census tracts which had not changed their geographical boundaries since 1960. After selecting census tracts, the next stage of sampling involved identifying three pairs of city blocks per census tract.' One block per pair contained a street address in which a burglary was reported to the police during 1989, whereas the other block per pair involved a street segment which was bordering the street on which the burglary occurred. The selection of a city block with a known burglary was made to increase the number of victimized households in the Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 13 sample. Once these 300 blocks with known burglaries were identified, a detailed city map was used to select, at random, one of the four adjoining city blocks for each pair. This aspect of the sampling design was important in the original study because it allowed for an assessment of how the wider social context of safety precautions influences victimization risks across adjoining city blocks. A reverse telephone directory (organized sequentially by street address) was used to select adjacent housing units on each city block. A maximum of eighteen households were initially selected per block, however additional households were also chosen when large rates of "disconnects," "no answers," or "wrong addresses" were observed on a block. Replacement sampling was done to insure a sufficient number of respondents for deriving aggregate rates for each block. For each household in the sampling frame, a maximum of five call-backs were made to contact respondents. Special efforts were made to interview a particular person (the one listed in the directory), but another adult in the same household was interviewed when the primary person was not available. No interviews were completed when an adult was not present or when an adult did not feel qualified to answer questions about the household. Identical procedures were used to select respondents on blocks with and without known burglaries. Overall, there were 12,303 phone numbers dialed by the interviewers which resulted in contact with 9,250 residential households. Noncontact phone numbers included "no answer" (n = 1,548), "disconnects" (n = 1,355), and business (n = 150). 'The sample size was reduced further because the primary respondent or another knowledgeable adult in the household was not available (n = 742), changed addresses (n = 940), or the respondent was hearing impaired or did not speak English (n = 409). Of the remaining 7,159 eligible households, 5,302 interviews were completed, resulting in a response rate of 74.1 percent. The number of complete interviews per city block ranged from four to twelve, with 99.2 percent (595/600) having six or more respondents per block. The number of completed interviews per pair of city blocks ranged from thirteen to twenty-one, and from forty-five to fifty-seven respondents per census tract. Detailed field observations were also made on each housing unit in order to evaluate the proximity of the sample units on a city block and the validity of collapsing observations to form neighborhood rates. Information was recorded on the characteristics of each city block (e.g., its length, number of cross-streets, traffic flow) and each housing unit (e.g., security equipment on premises, the dwelling's physical condition, visibility of front yard, its location on the block). Although a vacant lot or another dwelling not included in the sample separated housing units in many cases, the field observations clearly confirmed the physical proximity of neighbors, and supported the aggregation of individual responses to derive rates per block and rates per census tract. Several additional comments about the sampling design are worth noting. First, telephone directories arc limited because they do not include persons with unlisted phone numbers (about 28 percent in Seattle households) and are particularly unrepresentative of recent movers. Only 7.3 percent of our sample respondents had moved in the last year, compared to a national rate of about 18 percent. Nonetheless, telephone directories were used because they are the best available source for drawing a comprehensive sample of immediate neighbors and adjoining blocks across an entire city. Second, the sampling design and the survey results limit generalizations that can be made about the entire city of Seattle. This is the case due to the use of the telephone directories, the sampling of only "stable" census tracts (i.e., those that had not changed their boundaries since 1960), the deliberate oversampling of 300 city blocks with known burglaries, a 9 percent higher response rate for street addresses with known burglaries over housing units in which it was unknown, in advance, whether a burglary had occurred, and Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 14 the relatively high rates of home ownership (65 percent) and college education (71 percent had at least "some college") in the survey sample. When the Seattle respondents are compared with the household respondents in the 1989 NCS data (see Table 5.1 ), it is easy to see that the Seattle sample is older, more educated, less transient (i.e., Iess frequent movers, higher rates of home ownership), and more evenly distributed with regard to gender than the NCS sample. If our interest was in generating city-wide estimates of demographic characteristics and victimization rates, the sampling limitations of the Seattle survey would severely question the validity of these inferences. The differential composition of the Seattle and NCS samples also hampers comparisons of bivariate relationships across samples. When samples have different characteristics, it cannot be easily determined whether differences in substantive findings arc due to unreliable results or differences in sample composition. On the other hand, comparisons of the relative risks of victimization within categories of demographic attributes (e.g., gender, race, or age differences) arc Icss affected than city-wide estimates by the problems with the sampling design. Given that our primary interest is to examine how relative differences in routine activity patterns and lifestyles alter individuals' risks of victimization, the sampling bias against lower income, transient, and young persons in the Seattle data is less bothersome than would be true in other studies. The multi-level sampling design, and the type of information coIlected in the Seattle survey, contribute to its uniqueness as a data source for testing theories of victimization. Specifically, each of the potential aggregate units (e.g., city block, pairs of city blocks, census tracts) is physically well defined and contains a sufficient number of respondents to provide stable estimates of aggregate parameters. In contrast to other data sources for multi-level and contextual analyses (e.g., the NCS files, the British Crime Surveys), the independent confirmation, through field observations of the physical proximity of residents on city blocks and within census tracts, provides unique validation for the merits of these aggregate units. Given that the primary goal of the Seattle study was to evaluate theories of victimization, the survey was also designed to collect a rich array of measures on the routine activities and lifestyles of the respondents. As described in the next section, these measures provide multiple indicators of each of the major concepts underlying theories of victimization.“ Miethe und Meier (1994, S. 95ff.) operationalisieren ihre zentralen theoretischen Konzepte folgendermaßen. Zusätzlich geben sie für die einzelnen Ebenen die zugehörigen Mittelwerte und Standardabweichungen an: „MEASURES OF CONCEPTS AND DESCRIPTIVE STATISTICS Low Socio-Economic Conditon 1. Median Family Income: Census Tracts [ mean = $22,536.1; sd = 6,145.4] Cities [ mean = $21,041.6; sd = 5,221.6] SMSA [mean = $10,021.7; sd = 1,322.4] Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse 2. WiSe 2001/2002 15 Unemployment Rate: Census Tracts [ mean = 7.4 percent; sd = 4.6 ] Cities [mean = 5.5 percent; sd = 2.4] SMSA [ mean = 4.3 percent; sd = 1.4 percent] Population Mobility Measured as the percent of the population that has moved in the previous five years. This variable is not available for SMSAs. Census tract [mean = 51.8 percent; sd = 10.9 ]. City [ mean = 49.4 percent; sd = 9.8 ]. Ethnic Hetereogeneity Computed as the product of the percent black and non-black in the particular census tract, city, or SMSA. For each aggregate unit, the descriptive statistics on this variable are: (a) census tract [ mean = 0.048; sd = 0.072 ], (b) city [ mean = 0.083; sd = 0.080 ], and (c) SMSA [ mean = 0.083; sd = 0.061 ]. Single-Parent Families Measured as the percent of the children under 18 years oId that live with both parents. Census tract [ mean = 78.5 percent; sd = 14.6 ]. City [ mean = 79.4 percent; sd = l0.3 ]. SMSA [ mean = 82.9 percent; sd = 4.1 ].“ (A.a.O., S. 95) „Proximity to High Crime Areas 1. Property Victimization Rate: The average victimization rate for property offenses (i.e., burglary, household theft, and motor vehicle theft within four blocks of home) from 1988 to 1990. Pairs of city blocks [mean = 33.1 percent; sd = 14.5]. Census Tracts [mean = 33.1 percent; sd = 10.6]. 2. Violent Victimization Rate: The average victimization rate for violent offenses (i.e., stranger assault, robbery) within four blocks of the resident's home from 1988 to 1990. Pairs of city blocks [mean = 2.8 percent; sd = 5.3]. Census Tracts [mean = 2.8 percent; sd = 4.2]. 3. Perceived Safety of Neighborhood: Average rating of individual scores ( 1 = very safe; 2 = somewhat safe; 3 = somewhat unsafe; 4 = very unsafe). Pairs of city blocks [mean = 2.11; sd = 0.38]. Census Tracts [mean = 2.11; sd = 0.33]. 4. Neighborhood Decay/Deterioration: Five-item scale representing the average number of different signs of incivility within three blocks of each resident's home. Calculated by averaging individual scores. Items include: (a) groups of teenagers "hanging around" the street, (b) litter/garbage/trash on the street, (c) abandoned houses and run-down buildings, (d) poor street lighting, and (e) vandalism-like broken windows or writing on walls. Scale values range from 0 to 5. Pairs of city blocks [ mean = 1.34; sd = 0.71 ]. Census Tracts [mean = 1.34; sd = 0.60].“ (A.a.O., S. 95f.) Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 16 „Exposure to Risky and Dangerous Situations 1. Female Labor Force Rate: The percent of the civilian labor force that is female. Available for U.S. cities and Seattle census tracts from 1960 to 1980. Census Tracts [ mean = 38.0 percent; sd = 7.1 ]. U.S. Cities [mean = 40.1 percent; sd = 5.0]. 2. Public Transportation Rate: The percent of workers who use public transportation. Available for U.S. cities and Seattle census tracts from 1960 to 1980, and SMSAs for 1970. Seattle Census Tracts [ mean = 18.8 percent; sd = 8.0 ]. Cities [ mean = 8.1 percent; sd = 8.3]. SMSAs [mean = 6.1 percent; sd = 6.1 ]. 3. Sales from Eating/Drinking Establishments: The average retail sales from caring and drinking establishments per population member. U.S. cities from 1960 to 1980 [ mean = $433.04; sd = 204.4]. For SMSA.s, the item represents the percent of total retail sales from eating and drinking establishments. SMSAs [mean = 7.5 percent; sd = 1.4]. 4. Nights Out: The number of nights, in the previous week, that the respondent was outside the home for work, leisure, and social activities. Values range from "0" to "7" nights. Available for individuals in the Seattle survey and can also be aggregated by pairs of city blocks and census tracts. Individuals [mean = 2.43; sd = 2.0 ]. 5. Home Unoccupied at Night: The number of evenings, in the previous week, that the home was unoccupied for some time at night. Values range tom "0" to "7" nights. Available for individuals in the Seattle survey and can also be aggregated by pairs of city blocks and census tracts. Individuals [ mean = 1.78; sd = 1.97]. 6. Dangerous Activities: Three-item scale of the number of different types of dangerous public activities undertaken by the respondents. Items include: (a) going to bars or nightclubs that serve alcohol, during the previous week, (b) being in a public place, in the previous week, where groups of teenagers or young adults were "hanging out" on the street, and (c) taking a city bus or other types of public transportation. Scale ranges from "0" to "3" activities. Available for individuals in the Seattle survey and can also be aggregated by pairs of city blocks and census tracts. Individuals [ mean = 0.88; sd = 0.81 ]. 7. Busy Public Places: Eight-item scale of the number of different types of public places, within three blocks of the resident's home, that attract strangers. Items include: (a) high schools or junior high schools, (b) convenience stores or gas stations, (c) bar or nightclub that serves alcohol, (d) fast food restaurant, (e) bank or office building, (t) park or playground, (g) shopping center or mall, and (h) hotel or motel. Scale ranges from "0" to "8" places. Available for individuals in the Seattle survey and can also be aggregated by hairs of city blocks and census tracts. Individuals [ mean = 2.51; sd = 1.8 ]. 8. Times Felt in Danger: The number of times, in the previous month, that the respondent felt at danger of a physical attack by a stranger. Values range from "0" to "5" (5 or more times). Available for individuals in the Seattle survey and can also be aggregated by pairs of city blocks and census tracts. Individuals [mean = 0.20; sd = 0.76 ]. 89.8 percent of the Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 17 respondents said "0 times".“ (A.a.O., S. 96f.) „Target Attractivenes 1. Median Family Income: Census Tracts [mean = $22,536.1; sd = 6145.4]. Cities [mean = $21,041.6; sd = 5,221.6]. SMSA [mean _ $10,021.7; sd = 1,322.4]. 2. Family Income: Categories of total family income before taxes in 1989. Values included "1" (less than $10,000), "2" ($10,000 to $20,000), "3" ($20,000 to $30,000), "4" ($30,000 to $50,000), "5" ($50,000 to $75,000), "6" ($75,000 to $100,000), and "7"(over $100,000). Available for individuals in the Seattle survey and can also be aggregated by pairs of city blocks and census tracts. Individuals [mean = 3.37; sd = 1.36]. 3. Expensive Consumer Goods: Five-item scale of the number of different types of expensive consumer goods owned by the resident. Items include: (a) portable color T.V., (b) videocassette recorder, (c) 35mm camera, (d) home computer, and (e) bicycle or motorcycle. Values range from "0" to "5" items. Available for individuals in the Seattle survey and can also be aggregated by pairs of city blocks and census tract. Individuals [mean = 2.53; sd = 1.41 ]. 4. Carry Valuables in Public: The number of times, in the previous month, the respondent either carried at least $50 in cash or wore jewelry worth over $100 when in a public place. Values range from "0" to "8" (8 or more) times. Available for individuals in the Seattle survey and can also be aggregated by pairs of city blocks and census tract. Individuals [mean = 3.24; sd = 2.63].“ (A.a.O., S. 98) „Guardianship 1. Average Household Size: The number of persons per occupied housing unit. Available for U.S. cities and census tracts in Seattle from 1960 to 1980, and SMSAs for 1970. Census Tracts [ mean=2.56; sd = 0.57]. Cities [mean = 3.03; sd = 0.37]. SMSA [ mean - 3.26; sd = 0.19 ]. 1 a. Household Crowding: The percent of occupied units with more than 1.01 persons per room. Available for U.S. cities and census tracts from 1960 to 1980, and SMSAs for 1970. Used as a control variable to isolate the net effects of household size due to guardianship from the adverse impact of crowding on criminality. Census Tracts [mean = 3.6 percent; sd = 2.8]. Cities [mean = 7.0 percent; sd = 4.4]. SMSAs [ mean = 7.6 percent; sd = 2.7 J. 2. Persons over 16 years old: The number of persons in the household over 16 years old. Values range tom "0" (live alone) to "3" (3 or more persons). Available for individuals in the Seattle survey and can also be aggregated by pairs of city blocks and census tract. Individuals [mean = 2.00; sd = 0.89]. 3. Friends/Relatives Live Nearby: Whether or not the resident has any good friends or relatives who live on their city block. Values range from "0" (no) to "1" (yes). Available Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 18 for individuals in the Seattle survey and can also be aggregated by pairs of city blocks and census tract. Individuals [mean = 0.61; sd = 0.49]. 4. Social Integration: Five-item composite index of the number of different activities performed with neighbors which indicate neighborhood integration and internal social control. Items include: (a) watching the neighbor's property when they are out of town, (b) borrowing tools or small food items, (c) had dinner or lunch with a neighbor, (d) helped a neighbor with a problem, and (e) participated in an organized block activity or neighborhood association. Scale values range from "0" to "5." Available for individuals in the Seattle survey and can also be aggregated by pairs of city blocks and census tract. Individuals [mean = 2.79; sd = 1.57]. 5. Safety Precautions: Eight-item composite index of the number of different types of safety precautions taken by the respondent "two years ago." Items include: (a) locking doors, (b) leaving lights on, (c) belonging to a community crime prevention program [e.g., Neighborhood / Block Watch], (d) installing extra locks, (e) having a burglar alarm or other electronic security devise, (f) owning a dog, (g) having neighbors watch the home when the owner is out of town, and (h) having a weapon in the home for protection. Scale values range from "0" to "8" precautions. Available for individuals in the Seattle survey and can also be aggregated by pairs city blocks and census tract. Individuals [mean = 3.91; set = 1.47]. 6. Defending Self from Others : Self-rating of the perceived ability to physically defend self or ward off an attack from another person. Values ranged from "0" (no, don't know) to "1" (yes). Available for individuals in the Seattle survey and can also be aggregated by pairs of city blocks and census trait. Individuals [mean = 0.47; sd = 0.50 ].“ (A.a.O., S.98f.) „Types of Predatory Crime and Victimization 1. Violent Crimes: UCR data provides rates of homicide, rape, aggravated assault, and robbery for U.S. cities and Seattle census tracts from 1960 to 1980 and for SMSAs in 1970. Individuals' risks and aggregate rates of violent victimization for pairs of city blocks are derived from the Seattle telephone survey. Violent crimes in the Seattle victimization survey include stranger assault and personal robbery (i.e., street mugging, purse snatching, pocket picking). 2. Property Crimes: UCR data provides rates of burglary and motor vehicle theft for U.S. cities and Seattle census tracts from 1960 to 1980 and for SMSAs in 1970. Individuals' risks and aggregate rates of property victimization for pairs of city blocks are derived from the Seattle telephone survey. Property crimes in the victimization survey include residential burglary, household theft (i.e., theft of property from outside the dwelling, in the yard, or on a porch), and motor vehicle theft (i.e., theft of vehicle, illegal entry).“ (A.a.O, S.100) Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 19 3. Die Dokumentation des für WHLM 5 aufbereiteten MIETHEWHLM-Datensatzes Die SPSS-Datendatei „MIETHEWHLM.SAV“ enthält aus Platzgründen nicht alle Variablen des CATI-Suverys sondern nur die bereits aufbereiteten Indizes, deren Wertebereiche und Originalfragen jeweils dokumentiert werden.1 3.1 Die erhobenen Individual- und Nachbarschaftsmerkmale Tab. 1: Übersicht der Identifikationsvariablen für die untersuchten Ebenen: Variable: Bedeutung: PROBNR Level 1- Kennung: Probandennummer (ni =5.302) BLOCKICT Level 2-Kennung: Straßenblock/Nachbarschaft im CensusTract (Volkszählungsbezirk) (n j =300) TRACTID Level 3-Kennung: Census-Tract-Identifikationsnummer (n k =100) DISTRICT Stadtbezirk N l = 12 ONE Vektor mit Einsen (für die Regressionskonstante in MIXOR und als Pseudo-Level-3 Variable in HLM) Tab. 2: Übersicht der zentralen abhängigen Variablen und der zugehörigen Fragen Variable: Bedeutung / Indexbildung /Fragetext PERCRISK Perceived Crime Risk: Allgemeines Sicherheitsgefühl in der eigenen Nachbarschaft „Q77: Do you think your neighborhood is very safe, somewhat safe, somewhat unsafe or very unsafe form crime and criminals ?“ 1) very safe (sehr sicher) 2) somewhat safe (ziemlich sicher) 3) somewhat unsafe (ziemlich unsicher) 4) very unsafe (sehr unsicher) 9) Keine Angabe 1 Den Originaldatensatz von Miethe kann der Leser über das Inter-University-Consortium of Political and Social Science Research, Ann Arbor, unter der folgenden Internetadresse direkt online beziehen: url: http://www.icpsr.umich.edu (ICPSR Study No. 9741) Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 20 Tab. 2: Übersicht der zentralen abhängigen Variablen und der zugehörigen Fragen Variable: Bedeutung / Indexbildung /Fragetext FEARPATT Furcht vor Gewaltgewaltkriminalität: „Q166: How often do you worry or think about physically attacked by a stranger? Would you say you worry or think about this ....“ 1) Weniger als einmal im Monat 2) Einmal im Monat 3) Jede Woche 4) Täglich 9) Keine Angabe FEARBURG Furcht vor Einbruchskriminalität: „Q167: How about someone breaking into your home and stealing your property? Would you say worry or think about this ...“ 1) Weniger als einmal im Monat 2) Einmal im Monat 3) Jede Woche 4) Täglich 9) Keine Angabe FEARWALK Furcht vor „einsamen nächtlichem Spaziergang“: „Q77: Is there any place - within 3 blocks of your current home where you are afraid to walk alone a night ?“ 0) Nein 1) Ja 9) Keine Angabe Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 21 Tab. 2: Übersicht der zentralen abhängigen Variablen und der zugehörigen Fragen Variable: Bedeutung / Indexbildung /Fragetext DVICBURG Viktimisierung durch (versuchten) Einbruch innerhalb der letzten 2 Jahre: „The first set of questions involve your personal experience with different kinds of crime: Q13: Q16: Q23: Q26: First of all, has anyone ever broken into or illegally entered your home, garage, or other building on your property ? ... Has this happened within the last two years ? ... (Other than the incident justed mentioned), have you ever found a door jimmied, a lock forced, or any other signs of an attempted break-in into your home ? ... Has this happened within the last two years ?“ 0) Kein Einbruchsopfer 1) Ja, Einbruchsopfer 9) Keine Angabe DVICVIOL Viktimisierung durch Gewaltkriminalität (Raub, Körperverletzung, Taschendiebstahl) maximal 4 Blocks von der eigenen Wohnung entfernt innerhalb der letzten 2 Jahre „Q34: Q36: Q45: Q48: Q50: Q56: Have you ever been physically attacked, beaten up, or threatend by a stranger ?... Has this happened within the last two years ?... Did (this attack) / (the last attack) occur within 4 blocks of your current home ? ... Have you ever had your (pocked picket) / (purse snatched) or something stolen from you by force (stick-up mugging) when in a public place ? ... Has this happened within the last two years ? ... Did (this act) / (the last theft) occure within 4 blocks of your current home ?“ 0) Kein Gewaltopfer 1) Ja, Gewaltopfer 9) Keine Angabe Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 22 Tab. 3: Übersicht der unabhängigen Variablen und der zugehörigen Fragen Variable: Bedeutung / Indexbildung /Fragetext Sozio-demographische Variablen: ALTER Alter in Dezimaljahren: „Q171: What year were you born?“ AGEGR Altersgruppenbildung von Miethe: 1) 2) 3) 4) 5) 6) 7) 9) 17-19 20-29 30-39 40-49 50-59 60-69 70 und älter Fehlende Angabe Geschlecht des Befragte: FRAU MANN Frau (1) vs. Mann (0) Mann (1) vs. Frau (0) MINORITY Minoritätenstatus: „Do you consider yourself to be White, Black, Asian, American Indian / Eskimo, Hispanic or Some other ethnic / racial group ?“ 0) Weiße(r) 1) Minoritätenangehöriger (Farbige, Mexikaner, sonstige) 9) keine Angabe Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 23 Variable: Bedeutung / Indexbildung /Fragetext INCOME Haushaltsnettoeinkommensklasse: „Q215: Which of the following broad categories best represents your total family income before taxes 1989 ? Please stop me when I mention the category that applies to you. Would your total income from all sources be ...“ 1) less than $ 10.000 2) $ 10.000 to $ 20.000 3) $ 20.000 to $ 30.000 4) $ 30.000 to $ 50.000 5) $ 50.000 to $ 75.000 6) $ 75.000 to $ 100.000 7) Over $ 100.000 9) Keine Angabe LIVEALONE Alleinstehend lebend: „Q175: Counting yourself, how many people are currently living in your (house) / (appartment) / (home) ?“ 0) Mehr als 1 Person 1) Alleinstehend 9) Keine Angabe DANGACT Dangerous Public Activities: Summenindex [0;3] für Bejahung „Q103: During the LAST WEEK, did you visit a bar or night-club that serves alcohol ?... Q104: During the LAST WEEK, were you in a public place where groups of teenagers or young adults hanging out in the street ? ... Q107: Do you ever take a city bus or other forms of public transportation ? ...“ 1) YES CARRYVAL 2) No 3) Don‘t know/Refused Carry Valuables in Public: Summenindex [0;16] „Q164: During the last month, about how many times did you carry at least $50 cash in your (wallet) / (purse) while in a public place ? Q165: During the last month, about how many times dit you wear jewelry (like a watch, ring or necklace) worth more than $100 when in a public place ?“ Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 24 Variable: Bedeutung / Indexbildung /Fragetext SAFEPREC Safety Precautions: Summenindex der vor 2 Jahren bereits ergriffen Sicherheitsmaßnahmen [0;9] „Q109: People protect themselves from crime in many different ways. I am going to name some types of self-protection. Please tell me if you take this precaution now or did this -TWO YEARS AGO -- by saying YES or NO . Q110: Do you currently lock doors whenever you leave home ? Q111: Did you lock your doors TWO YEARS AGO ? Q112: Do you currently leave lights on when you‘re not at home? Q113: Did you leave lights on TWO YEARS AGO ? Q114: Do you currently belong to a community crime prevention program (like neighborhood/block watch program)? Q115: Did you belong to this program TWO YEARS AGO ? Q116: Do you currently have extra locks installed on doors or windows? Q117: Did you have extra locks TWO YEARS AGO ? Q118: Do you currently carry a weapon for protection when in public? (IF ASKED: A weapon such as a gun, knife, mace, etc.) Q119: Did you carry a weapon for protection TWO YEARS AGO? Q120: Do you currently have a burglar alarm or some other electronic device to protect your home from criminals? Q121: Did you have an alarm like this TWO YEARS AGO ? Q122: Do you currently have a dog at your home ? Q123: Did you have a dog TWO YEARS AGO ? Q124: Do you currently have neighbors watch your home when you‘re out of town ? Q125: Did you have neighbors watch your home TWO YEARS AGO ? Q126: Do you currently have a weapon in your home for protection? Q127: Did you have a weapon TWO YEARS AGO ?“ 1) YES 2) NO 3) Don‘t know/refused Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 Variable: Bedeutung / Indexbildung /Fragetext EXPGOODS Expensive Consumer Goods: Summenindex [0;5] 25 „Q156-160: Do you own any of the following expensive consumer items that are commonly stolen by burglars ? Do you own .... ASSESS 156: 157: 158: 159: 160: A portable color TV ? A video cassette recorder (VCR) ? A 35mm camera ? A home computer ? A bicycle or motorbicycle ?“ 1) YES 2) NO 3) Don‘t know/Refused Assess Routes: Summenindex der bejahten Einbruchsmöglichkeiten [0;2] „Q130: Some people are more likely to be crime victims because criminals view them as „easy targets.“ Here are several questions about your personal habits and property which might influence your chances of being a crime victim. Q134: Q141: 1) GBARRIER First, does your (house) / (apartment) / (home) have ground floor windows? Is there an alley behind your home ?“ YES 2) NO 3) Don‘t know/ Refused Guardianship Barriers: Anzahl der Sicherheitsdefizite des Hauses / Wohnung: Summenindex der Bejahungen [0;2] „Q135: Is there a tall fence or hedge (over 5 feet) around your dwelling ?“ Q136: Is there a vacant lot or empty house next to your home?“ 1) CORNER YES 2) NO 3) Don‘t know/ Refused Eckgrundstück vs. Blockseitenmitte „Q140: Is your (house) / (apartment) / (home) on a street corner?“ 1) YES 2) NO 3) Don‘t know/ Refused Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 Variable: Bedeutung / Indexbildung /Fragetext BUSYPLAC Busy Plubic Places within three blocks of the resident‘s home.attracting strangers. Summenindex der Bejahungen [0;9] 26 „Are any of the following places within 3 blocks of your home ? INCIVILI 67. 68. 69. 70. 71. 72. 73. 74. 75. High school or Junior high Convenience store / gas station Bar or nightclub that serves alcohol Fast food restaurant Bank or office building Park or play ground Shopping center / mall Hotel / motel Bus stop“ 1) YES 2) NO 3) Don‘t know/ Refused Perceived Neighborhood Decay / Deterioratuib (Signs of Incivility in the neighborhood) Summenindex der Bejahungen [0;5] „Do you have any of these problems within 3 blocks of your home? 92. 93. 94. 95. 96. Groups of teenagers hanging around the street Litter / garbage / trash on the street Abandoned houses and run-down building Poor street lighting at night Vandalism like broken windows, writing on the walls“ 1) YES 2) NO 3) Don‘t know/ Refused Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 27 Variable: Bedeutung / Indexbildung /Fragetext INTEGRAT Perceived Neighborhood Social Integration. Summenindex der Bejahungen [0;6} „Q79: Q80: Can you easily tell if a person is a stranger or resident on your city block ? NOTE: WANT TO KNOW IF RESPONDENT CAN RECOGNIZE STRANGERS AROUND THEIR HOME. Do you have any good friends or relatives who are neighbors on your block ? ... Have you done any of the following activities with your current neighbors, have you .... Q82: Q83: Q84: Q85: 1) Q100 Watched your neighbor‘s property when they are out of town? Borrowed tools or small food items (e.g. milk, sugar) from your neighbors ? Had dinner or lunch with a neighbor ? Helped a neighbor with a problem ?“ YES 2) NO 3) Don‘t know/ Refused Gelegenheitshäufigkeit für Einbruch „Q100: How many EVENINGS LAST WEEK was your home unoccupied for some time at night? (IF ASKED, HOW LONG, SAY:) unoccupied for 2 hours or more ?“ 0) keine Nacht ...... 7) jede Nacht Q155 9) Keine Angabe Subjektive Einschätzung der eigenen Verteidigungsfähigkeit bei einem tätlichen Angriff „Q155: Do you think you could physically defend yourself or ward off an attack from another person ?“ 1) YES 2) NO 9) Keine Angabe Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 28 Tab. 4: Übersicht der durch Aggregation gewonnenen Kontextmerkmale der Nachbarschaft: Variable: Bedeutung / Indexbildung /Fragetext NETHHET Ethnische Heterogenität der Nachbarschaft: [0; 0,25] Anteilswert Minority * (1 - Anteilswert Minority) Minimum: 0,0 PNETHHET Maximum: 0,25 Ethnische Heterogenität der Nachbarschaft transformiert:[0;25] PNETHHET = NETHHET*100 Minimum: 0,0 PMINORI Prozentsatz ethnischer Minoritäten in der Nachbarschaft: Minimum: 0,00 % MINCIVIL Maximum: 7,24 Nachbarschaft: Mittlere Einkommensklasse. Indikator für Soziale Segregation der Nachbarschaft: Minimum: 1,33 MSAFEPRE Maximum: 5,30 Nachbarschaftsmittelwert Busy Public Places. Indikator für „Soziale Dichte“ Minimum: 0,82 MINCOME Maximum: 3,33 Nachbarschaftsmittelwert der „Sozialen Integration / Informelle Soziale Kontrolle“: Minimum: 1,44 MBUSYPLA Maximum: 93,33 % Nachbarschaftsmittelwert der „Zeichen des Verfalls“ Minimum: 0,00 MNINTEGR Maximum: 25,0 Maximum: 5,31 Nachbarschaft: Mittelwert der vor 2 Jahren bereits ergriffenen Sicherheitsmaßnahmen Minimum: 2,17 Maximum: 5,50 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 29 Variable: Bedeutung / Indexbildung /Fragetext PVICBURG Prozentsatz Befragter in der Nachbarschaft, die in den letzten 2 Jahren Opfer eines Einbruchs (-versuchs) geworden sind. (Property Crime Proximity) Minimum: 0,00 % PVICVIOL Prozentsatz Befragter in der Nachbarschaft, die in den letzten 2 Jahren Opfer eines Raubs, Körperverletzung geworden sind. (Violent Crime Proximity) Minimum: 0,00 % PVICION Maximum: 55,56 % Maximum: 35,71 % Prozentsatz Befragter, die Opfer einer Straftat in der eigenen Nachbarschaft in den letzten 2 Jahren geworden sind (General Crime Proximity) Minimum: 11,11% Maximum: 100,00% 3.2 Makrosoziale Erklärungsfaktoren der Viktimisierung auf der Census-TractEbene Für die 3. Ebene der Census Tracts enthält die SPSS-Datendatei „S9741CEN.SAV“ die folgenden makrosozialen Indikatoren zur Kriminalitätsbelastung, Desorganisation und Haushaltsgröße, die Miethe und seine Projektgruppe dem „Uniform Crime Report“ sowie den Volkszählungen von 1960, 1970 und 1980 entnommen haben. Über die Kennung der Volkszählungsbezirke „TRACTID“ lassen sich diese sozialökologischen Daten an die eigentliche Viktimisierungsstudie für die 100 seit 1960 unveränderten Zählbezirke ankoppeln. Name Position YEAR Zenusjahr Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F2 Write Format: F2 1 TRACTID Zenus-Tract-Nr. Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F3 Write Format: F3 2 HOMRAT60 Mordrate pro 100.000 1960 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F10.3 Write Format: F10.3 3 RAPRAT60 Vergewaltigungsrate pro 100.000 1960 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F10.3 Write Format: F10.3 4 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 30 ROBRAT60 Raubrate pro 100.000 1960 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F10.3 Write Format: F10.3 5 ASSRAT60 Körperverletzungsrate pro 100.000 1960 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F10.3 Write Format: F10.3 6 BURRAT60 Einbruchsrate pro 100.000 1960 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F10.3 Write Format: F10.3 7 CARRAT60 Autodiebstahlsrate pro 100.000 1960 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F10.3 Write Format: F10.3 8 RHETER60 Rassische/ethnische Hetereogentität 1960 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F7.4 Write Format: F7.4 9 PUNEMP60 Arbeitslosenanteil in % 1960 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F7.3 Write Format: F7.3 10 POCROW60 Anteil überbelegter Wohnungen 1960 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F6.2 Write Format: F6.2 11 PPUBTR60 Anteil der Berufspendler mit ÖPNV 1960 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F6.2 Write Format: F6.2 12 PFEMAL60 Frauenanteil der Beschäftigten 1960 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F9.3 Write Format: F9.3 13 MEDFIN60 Mittlere Familieneinkommen 1960 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F9.2 Write Format: F9.2 14 POPPH60 Durchschnittliche Haushaltsgrösse 1960 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F9.3 Write Format: F9.3 15 PMOVE60 Anteil der zugezogenen Personen älter als 5 Jahre 1960 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F9.3 Write Format: F9.3 16 PKIDPA60 Anteil der Kinder unter 18 Jahren mit beiden Elternteilen 19 Measurement Level: Scale 17 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 31 Column Width: 8 Alignment: Right Print Format: F9.3 Write Format: F9.3 HOMRAT70 Mordrate pro 100.000 1970 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F10.3 Write Format: F10.3 18 RAPRAT70 Vergewaltigungsrate pro 100.000 1970 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F10.3 Write Format: F10.3 19 ROBRAT70 Raubrate pro 100.000 1970 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F10.3 Write Format: F10.3 20 ASSRAT70 Körperverletzungsrate pro 100.000 1970 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F10.3 Write Format: F10.3 21 BURRAT70 Einbruchsrate pro 100.000 1970 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F10.3 Write Format: F10.3 22 CARRAT70 Autodiebstahlsrate pro 100.000 1970 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F10.3 Write Format: F10.3 23 RHETER70 Rassische/ethnische Hetereogentität 1970 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F7.4 Write Format: F7.4 24 PUNEMP70 Arbeitslosenanteil in % 1970 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F7.3 Write Format: F7.3 25 POCROW70 Anteil überbelegter Wohnungen 1970 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F6.2 Write Format: F6.2 26 PPUBTR70 Anteil der Berufspendler mit ÖPNV 1970 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F6.2 Write Format: F6.2 27 PFEMAL70 Frauenanteil der Beschäftigten 1970 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F9.3 Write Format: F9.3 28 MEDFIN70 Mittlere Familieneinkommen 1970 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F9.2 29 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 32 Write Format: F9.2 POPPH70 Durchschnittliche Haushaltsgrösse 1970 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F9.3 Write Format: F9.3 30 PMOVE70 Anteil der zugezogenen Personen älter als 5 Jahre 1970 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F9.3 Write Format: F9.3 31 PKIDPA70 Anteil der Kinder unter 18 Jahren mit beiden Elternteilen 1970 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F9.3 Write Format: F9.3 32 HOMRAT80 Mordrate pro 100.000 1980 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F10.3 Write Format: F10.3 33 RAPRAT80 Vergewaltigungsrate pro 100.000 1980 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F10.3 Write Format: F10.3 34 ROBRAT80 Raubrate pro 100.000 1980 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F10.3 Write Format: F10.3 35 ASSRAT80 Körperverletzungsrate pro 100.000 1980 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F10.3 Write Format: F10.3 36 BURRAT80 Einbruchsrate pro 100.000 1980 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F10.3 Write Format: F10.3 37 CARRAT80 Autodiebstahlsrate pro 100.000 1980 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F10.3 Write Format: F10.3 38 RHETER80 Rassische/ethnische Hetereogentität 1980 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F7.4 Write Format: F7.4 39 PUNEMP80 Arbeitslosenanteil in % 1980 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F7.3 Write Format: F7.3 40 POCROW80 Anteil überbelegter Wohnungen 1980 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F6.2 Write Format: F6.2 41 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 33 PPUBTR80 Anteil der Berufspendler mit ÖPNV 1980 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F6.2 Write Format: F6.2 42 PFEMAL80 Frauenanteil der Beschäftigten 1980 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F9.3 Write Format: F9.3 43 MEDFIN80 Mittlere Familieneinkommen 1980 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F9.2 Write Format: F9.2 44 POPPH80 Durchschnittliche Haushaltsgrösse 1980 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F9.3 Write Format: F9.3 45 PMOVE80 Anteil der zugezogenen Personen älter als 5 Jahre 1980 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F9.3 Write Format: F9.3 46 PKIDPA80 Anteil der Kinder unter 18 Jahren mit beiden Elternteilen 1980 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F9.3 Write Format: F9.3 47 HOMR8070 Diff.Mordrate 80 vs. 70 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F8.2 Write Format: F8.2 48 RAPR8070 Diff. Vergewaltigungsrate 80 vs. 70 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F8.2 Write Format: F8.2 49 ROBR8070 Diff. Raubrate 80 vs. 70 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F8.2 Write Format: F8.2 50 ASSR8070 Diff. Körperverletzungssrate 80 vs. 70 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F8.2 Write Format: F8.2 51 BURR8070 Diff. Einbruchsrate 80 vs. 70 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F8.2 Write Format: F8.2 52 CARR8070 Diff. Autodiebstahlsrate 80 vs. 70 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F8.2 Write Format: F8.2 53 RACE8070 Diff. ethnische Hetereogenität 80 vs. 70 Measurement Level: Scale 54 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 34 Column Width: 8 Alignment: Right Print Format: F8.2 Write Format: F8.2 ALO8070 Diff. Arbeitslosenanteil 80 vs. 70 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F8.2 Write Format: F8.2 55 POVC8070 Diff. Anteil überbelegter Wohnungen 80 vs. 70 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F8.2 Write Format: F8.2 56 PPUB8070 Diff. Anteil der Berufspendler mit ÖPNV 80 vs.70 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F8.2 Write Format: F8.2 57 PFEM8070 Diff. Frauenanteil der Beschäftigten 80 vs. 70 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F8.2 Write Format: F8.2 58 MFIN8070 Diff. Mittlere Familien-/Haushaltseinkommen 80 vs. 70 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F8.2 Write Format: F8.2 59 PPHH8070 Diff. durchschnittliche Haushaltsgrösse 80 vs. 70 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F8.2 Write Format: F8.2 60 MOVE8070 Diff. Anteil der zugezogenen Personen 80 vs. 70 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F8.2 Write Format: F8.2 61 PKID8070 Diff. Anteil der Kinder aus vollständigen Familien 80 vs. 70 Measurement Level: Scale Column Width: 8 Alignment: Right Print Format: F8.2 Write Format: F8.2 62 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 35 4. Die statistischen Grundlagen „Hierarchischer Verallgemeinerter Linearer Modelle“ am Beispiel der binären logistischen Regression für Individualdaten Beim Programm HLM for Windows 5,04 handelt es sich um eine Weiterentwicklung der DOSExtender-Versionen HLM 2 und 3, welche nun über eine graphische Bedienungsoberfläche verfügt. Mit diesem Programm lassen sich Mehrebenenmodelle für Kriteriumsvariablen mit metrischen, ordinalen und nominalen Meßniveau sowie für Zählvariablen schätzen, die bis zu drei Analyseebenen berücksichtigen.2 Bryk & Raudenbush (2000) integrieren nichtlineare Regressionsmodelle der ersten Ebene als „verallgemeinerte lineare Modelle“ im Sinne McCullagh&Nelder (1989), die über eine spezifische Fehlerstruktur und eine eigene „Link“- oder Verknüpfungsfunktion verfügen. „Within HLM, the user can specify a nonlinear analysis appropriate for counts and binary, multinomial, or ordinal data. The approach is a direct extension of the generalized linear model of McCullagh & Nelder (1998) to the case of hierarchical data. We, therefore, refer to this approach as a „hierarchical generalized linear model“ (HGLM).“ (Raudenbush, Bryk, Cheong&Congdon 2000, S. 113) Byrk &Raudenbush realisieren die binäre logistische Regression für Individualdaten im Rahmen des Bernoulli-Modell. Bei ihm handelt es sich um ein nichtlineares Wahrscheinlichkeitsmodell, das den linearen Prädiktor mit Hilfe der logistischen Verteilungsfunktion als „link-function“ mit der diskreten Kriteriumsvariable verbindet. Es stellt einen Sonderfall des allgemeinen Binomialmodells dar, wobei die Größe betrachteten Subpopulation bzw. die Anzahl der Versuche jeweils Eins ist. Als abhängige Variable verwendet das Bernoullimodell das Logit als logarithmisches Verhältnis der Wahl- und Komplementärwahrscheinlichkeiten, wobei es sich in unserem Fall um das Logit der Wahrscheinlichkeit handelt, Opfer eines Gewaltdelikts zu werden. Seine Vorhersagefehler innerhalb der Kontexte folgen der Binomialverteilung, wobei sie der geschätzten Varianz der Anteilswerte oder Wahlwahrscheinlichkeiten im Kontext j entsprechen. Deshalb sind die Vorhersagefehler innerhalb der Kontexteinheiten nicht mehr homoskedastisch, sondern ihre Varianz hängt unmittelbar von der für den Kontext j geschätzten Wahlwahrscheinlichkeit ab. Das heißt, dass wir für jede Level-2-Einheit eine eigene Fehlervarianz erhalten, die umso stärker über die Kontexte hinweg variiert, je mehr die geschätzte Wahrscheinlichkeit selbst über die Kontexte schwankt. Daher läßt sich die Residualvarianz der ersten 2 Als Programmalternativen zur Schätzung „Verallgemeinerter Hierarchisch Linearer Modelle“ stehen uns das von Rasbash, Browne, Goldstein, Yang, Plewis, Healy, Woodhouse, Draper, Langford&Lewis (2000) entwickelte kommerzielle Programm MLWin 1.1 sowie das Freeware-Statistikpaket Random-Regression-Models (RRM) von Hedecker&Gibbons (1996, 1999) zur Verfügung. Während ersteres bis zu fünf Analyseebenen theoretisch berücksichtigen kann, beschränkt sich letzteres auf ein 2-Ebenenmodell. Der Vorteil der von Hedecker&Gibbons (1996) entwickelten und im Programm MIXOR implementierten Maximum-MarginalLikelihood-Methode besteht darin, dass sie eine effiziente Schätzung der Log-Likelihood bzw. Deviance sowohl des Null- also auch des Alternativmodells erlaubt. Hierdurch können wir den Likelihood-Ratio-χ2-Test simultan für die geschätzten Fixed- und Random-Effects durchführen und diverse Pseude-R2e für die Bestimmung der „praktischen Signifikanz“ berechnen. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 36 Ebene im Gegensatz zum klassischen Mehrebenenmodell für metrische Kriteriumsvariablen nicht mehr als einen einzigen Skalar schätzen. Für die zugehörigen Zwischen-Kontext- und Binnen-Kontext-Regressionen benötigen wir das folgende Gleichungssystem, wobei wir die logistischen Regressionsparameter mit einem „β“ bezeichnen. Die Gleichungen des Logistischen&Mehrebenenmodells der späten 90 er Jahre : Level / Ebene 2: Between&Context&Regression 2a) Intercept&as&Outcome&Model: β0j ' γ00 % γ01 ( Z.j % u0j 2b) Slope&as&Outcome&Model: β1j ' γ10 % γ11 ( Z.j % u1j Level / Ebene 1: Within&Context Regression 1) ln P ( Yij ' 1 ) 1& P ( Yij ' 1 ) ' β0j % β1j ( Xij % eij Legende: Yij: Diskrete Kriteriumsvariable Y [ 1 oder 0 ] γ00 : Regressionskonstante der linearen Modells zur Vorhersage der kontextspezifischen logistischen Regressionskonstanten β0j γ01 : Linearer Steigungskoeffizient des Kontextmerkmals Z bei der Vorhersage der kontextspezifischen logistischen Regressionskonstanten β0j Z.j : Kontextmerkmal Z der Gruppe j u0j : Residuum des Kontextes j bei der Vorhersage seiner logistischen Regressionskonstanten β0j γ10 : Regressionskonstante der linearen Modells zur Vorhersage der kontextspezifischen logistischen Steigung β1j γ11 : Linearer Steigungskoeffizient des Kontextmerkmals Z bei der Vorhersage der kontextspezifischen logistischen Steigung β1j u1j : Residuum des Kontextes j bei der Vorhersage seiner logistischen Steigung β1j β0j : Logistische Regressionskonstante des Kontextes j β1j : Logistischer Regressionskoeffizient des Kontextes j für das Merkmal Xij Xij: Exogenes Individualmerkmal X der Person i im Kontext j eij: Binomial&verteiltes Residuum der Vorhersage von Yij im Kontext j Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 37 Die „Empirical-Bayes“-Residuen der Kontexteinheiten j ermitteln wir, indem wir die Gleichungen 2a) und 2b) nach u0j bzw. u1j auflösen. Bei ihnen handelt es sich jeweils um das Residuum der Vorhersage der kontextspezifischen logistischen Regressionskonstanten oder Steigung auf der Basis der betrachteten Kontextmerkmale Z.j. Interpretation der Residuen des logistischen Between&Context& Regressionsmodells ( Level 2 ): 3a) u0j ' β0j & [ γ00% γ01 ( Z . j ] ' β0j & β̂0j 3b) u1j ' β1j & [ γ10% γ11 ( Z . j ] ' β1j & β̂1j Wenn wir die beiden Schätzgleichungen der zweiten Ebene in diejenige der ersten Ebene einsetzen, erhalten wir das folgende Eingleichungsmodell der logistischen Regressionsanalyse: Die Eingleichungsvariante des Logistischen Mehrebenenmodells Einsetzen von Gleichung 3 a und 3 b in Gleichung 1: 4) ln P ( Yij ' 1 ) 1& P ( Yij ' 1 ) ' [ γ00 % γ01 ( Z.j % u0j ] % [ γ10 % γ11 ( Z.j % u1j ] ( Xij % eij ' γ00 % γ01 ( Z.j % γ10 ( Xij % γ11 ( Z.j ( Xij % u1j ( Xij % u0j % eij || || || || | || | || | || || || || || || | || | || | || | || | || | Fixed Effects: Logistische Regressionskonstante Logistischer Effekt des Kontextmerkmals Z Logistischer Effekt des Individualmerkmals X Logistischer Effekt der Cross&Level& Interaction von Z und X Random&Effects: Heteroskedastizität des Residuums der logistischen Steigung β1 im Kontext j ( Level 2 ) Residuum der logistischen Regressions& konstante β0 im Kontext j ( Level 2 ) Residuum von Y ij der Personi im Kontext j ( Level 1 ) Für die Residuen der Binnen- und Zwischen-Kontext-Regressionen des Logistischen Mehrebenenmodells gelten die folgenden Annahmen. Bryk&Raudenbush (1992, S. 20) bezeichnen die Kovarianzmatrix der Level-2-Residuen mit dem griechischen Großbuchstaben TAU („Τ“) und ihre Elemente mit dem zugehörigen Kleinbuchstaben tau („τ“). Hingegen verwendet Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 38 Goldstein (1999) hierfür den griechischen Großbuchstaben OMEGA („Ω“). Da sich die hier verwendete Notation an derjenigen von Busing, Meijer & van der Leeden (1994) orientiert, behalten wir die Bezeichnungen u0j und u1j für die Residuen der zweiten Ebene sowie deren für den deren Kovarianzmatrix THETA („Θ“) bei. Annahmen für die Fehlerterme des Logistischen Mehrebenenmodells auf der Basis von Individualdaten: Level / Ebene 1: 1.1) eij ist binomialverteilt mit einem Erwartungswert von Null und 1 einer Varianz σ2e ' ij P j ( Y ' 1 ) ( ( 1 & Pj ( Y ' 1 ) ) 1.2) Vorliegen der Heteroskedastizität von eij in allen Kontexten j Level / Ebene 2: 2.1) ukj ist normalverteilt mit einem Erwartungswert von Null und der Kovarianzmatriz ( Θ ) der Residuen: E u0j u1j ' 0 0 Var u0j u1j ' τ00 τ01 τ10 τ11 (u (u ) (u (u ) ' ( u0j ( u0j ) ( u0j ( u1j ) ' Τ ' Ω ' Θ 1j 0j 1j 1j Var ( u0j ) ' τ00 ' u0j ( u0j Var ( u1j ) ' τ11 ' u1j ( u1j Cov ( u0j , u1j ) ' τ10 ' τ01 ' u0j ( u1j ' u1j ( u0j 2.2) Die Residuen der 2. Ebene korrelieren nicht mit denjenigen der 1.Ebene: Cov ( u0j , eij ) ' Cov ( u1j , eij ) ' 0 Raudenbush, Bryk, Cheong&Congdon (2000, S. 122f.) weisen ausdrücklich daraufhin, dass sie als Schätzverfahren die „Penalized-Quasi-likelihood“ (PQL)-Methode verwenden, bei der es sich um eine numerische Approximation der Maximum-Likelihood-Schätzung handelt.3 Hierbei schätzen sie die „fixed effects“ mit Hilfe des „Iterative Generalized-Least-Squares“ Verfahrens (IGLS), während sie die Varianzkomponenten mit Hilfe der Maximum-Likelihood-Schätzung ermitteln. Bei diesem Verfahren handelt es sich daher um eine Variante der „Restricted Maximum-Likelihood-Methode (REML), die HLM 5 standardmäßig für HierarchischVerallgemeinerte-Lineare-Regressionsmodelle verwendet. Der in der Mehrebenenanalyse gebräuchliche Maximum-Likelihood-χ2-Test beschränkt sich deshalb allein auf die Veränderung der Varianzkomponenten zweier hierarchisch ineinander geschachtelter Modelle. 3 Zur genauen Vorgehensweise der PQL-Methode: S. Raudenbush&Bryk (2002, S.457f.) Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 39 „Using PQL, HGLM produces approxiamte empirical Bayes estimates of the randomly-varying level-1 coefficients, generalized least quares estimators of the level-2 (and level-3) coefficients, and approximate restricted maximum-likelihood estimators of the variance and covariance parameters. ... For two-level Bernoulli models, HGLM provides an alternative to estimation via PQL. The alternative uses a sixth order approximation to the likelihood based on a Laplace transform and is therefore called „Laplace6.“ Simulations by Yang (1998) and Raudenbush, Yang, & Yosef (in press) show that this approach produced remarkably accurate approximation to maximum likelihood (ML), and therefore provides efficient (or nearly efficient) estimates of all parameters.“ (Raudenbush, Bryk, Cheong & Congdon 2000, S. 127f.) Das Laplace6-Schätzverfahren liefert nach Angaben der Autoren eine bemerkenswerte gute Approximation an die Maximum-Likelihood-Schätzung der Populationsschätzer und Varianzkomponenten im 2-Ebenen-Modell. Im Vergleich zum „Penzalized-Quasi-Likelihood“-Verfahren verfügen sie über deutlich niedrigere Standardfehler. Diese Verfahren steht aber nur für binäre logistische Regressionsmodelle im 2-Ebenen-Ansatz zur Verfügung. Im Rahmen ihrer Restricted-Maximum-Likelihood-Schätzung verwenden Raudenbush et.al. (2000) den Kehrwert der Residualvarianz der ersten Analyseebene als Gewichtungsfaktor für die Generalized-Least-Squares-Schätzung der logistischen Regressionsmodelle innerhalb der einzelnen Kontexte. Sie normieren die Residualvarianz der kontextspezifischen Logits auf den Wert 1/ (Pj*(1- Pj)). Darüber hinaus bietet HLM 5 die Möglichkeit, die Ober- und Unterdispersion der Residualvarianz innerhalb der Kontexteinheiten zu schätzen. Dies empfiehlt sich aber nur dann, wenn wir berechtigte Annahmen haben, dass die hierarchische Datenstruktur bei der Modellspezifikation nicht adäquat berücksichtigt wird. Dies ist beispielsweise der Fall, wenn wir zwar Personen in ihrer Nachbarschaft ihres Stadtteils befragt haben, wir aber bei der eigentlichen Mehrebenenanalyse die mittlere Ebene der Nachbarschaften ignorieren.4 Den hieraus resultierenden durchschnittlichen „Fehlerzuschlag“ für die Residuen der ersten Ebene können wir im Rahmen des extra-binomialen Modells schätzen. Im folgenden stellen wir sie formelmäßig der Residualvarianz der logistischen Regression ohne Überdispersion gegenüber: 4 S. Goldstein (1999, chapter 7, p.2) Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 40 Fehlervarianzen der kontextspezifischen logistischen Regressionsmodelle ohne und mit Überdispersion für Individualdaten: Fehlervarianz des einfachen Binomialmodells: σ2e ' ij 1 P̂ j ( (1 & P̂ j ) Fehlervarianz des extra&binomialen Modells: σ2e ' ij σ2 r P̂ j ( (1 & P̂ j ) Legende: σ2e : Residualvarianz der logistischen Regression im Kontext j ij P̂ j : Geschätzte Wahrscheinlichkeit von Y ' 1 im Kontext j σ2 r: Geschätzte Varianz des Überdispersionfaktors „However, if the level-1 data do not follow this model, the actual level-1 variance may be larger than that assumed (over-dispersion) or smaller than that assumed (under-dispersion). For example, if undetected clustering exists within level-1 units or if the level-1 model is underspecified, extra-binomial or extra Poisson dispersion may arise. This problem can be handled in a variety of ways; HGLM allows estimation of a scalar variance so that the level-1 variance will be σ2.“ (Raudenbush et.al. 2001, S. 131) Raudenbush et. al. (2000) unterscheiden bei der Schätzung Hierarchischer Verallgemeinerter Linearer Modelle zwischen der kontextspezifischen („Unit-specific model“) und der eigentlichen Populationsschätzung („Population-average model“). Ersteres dient zur Vorhersage der Wahrscheinlichkeit, dass die betrachtete diskrete Kriteriumsvariable in einem spezifischen Kontext den Wert Eins annimmt, während letzteres zur kontextübergreifenden Populationsschätzung dient. Die Unterschiede beider Modelle zeichnen sich deutlich ab, wenn wir die zugehörigen Prognosegleichungen betrachten. Hierzu setzen wir den jeweiligen „linearen Prädiktor“ in die Gleichung der logistischen Verteilungsfunktion ein. Im Falle des „Unit-specific model“ ermitteln wir die für eine spezifische Befragtengruppe im Kontext j geschätzte Wahlwahrscheinlichkeit, indem wir neben den exogenen Invidiudal- und Kontextmerkmalen, deren Wechselwirkung und die „Empirical Bayes-Residuen“ der kontextspezifischen Effekte in die Prognosegleichung einsetzen: Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 41 Prognosegleichung des unit&specific&Logit&Mehrebenenmodells: e P( Y ' 1 | Xij , Z.j , Xij ( Z.j , u1j , u0j ) ' ' (γ00 % γ01 ( Z.j % γ10 ( Xij % γ11 ( Z.j ( Xij % u1j ( Xij % u0j ) 1%e (γ00 % γ01 ( Z.j % γ10 ( Xij % γ11 ( Z.j ( Xij % u1j ( Xij % u1j ) 1 1%e & (γ00 % γ01 ( Z.j % γ10 ( Xij % γ11 ( Z.j ( Xij % u1j ( Xij % u0j ) Raudenbush et.al. (2000) veranschaulichen die Interpretation der Logitschätzer im „unitspecific-model“ für den einfacheren Fall eines Modell ohne eine Wechselwirkung zwischen den Ebenen („cross-level-interaction“): „In this model, γ10 is the expected difference in the log-odds of „success“ between two students who differ by one unit on X (holding Wj and u0 j constant); γ 01 is the expected difference in the log-odds of success between two students who have the same value on X but attend schools differing by one unit on W (holding u0 j) constant).“ (A.a.O., S. 129) Interessieren wir uns weniger für die Prognosen auf der Ebene spezifischer Level-2 Einheiten sondern vor allem für die Schätzung der Grundgesamtparameter, so benötigen wir das „Population-average-model“. Letzteres beruht zwar auf den geschätzten „fixed“- und „randomeffects“ des kontextspezifischen Logitmodells, es betrachtet aber die Effekte der Kontextmerkmale unter der Annahme der durchschnittlichen kontextspezifischen Abweichung der geschätzten „random-effects“ u0 j und u1 j. Unter der Annahme, dass die kontextspezifischen Logitschätzer normalverteilt sind, ist zwar der theoretische Erwartungswert der Varianzkomponenten von u0 j und u1j jeweils Null. Da aber die empirischen Mittelwerte der geschätzten „random-effects“ u0 j und u1j oftmals von Null verschieden sind, berücksichtigt die Prognosegleichung des „Population-average Model“ ihre kontextspezifischen Residuen als Mittelwerte der u-Terme.5 rognosegleichung des Population&average&Logit&Mehrebenenmodells : ( ( Y ' 1 | Xij , Z.j , Xij ( Z.j , [ u0j , u1j ]) ' ( ( ( (γ00 % γ01 ( Z.j % γ10 ( Xij % γ11 ( Z.j ( Xij [ % u1j ( Xij % u0j ] ) 1%e ( ( ( 1%e & (γ(00 % γ(01 ( Z.j % γ(10 ( Xij % γ(11 ( Z.j ( Xij [ % u1j ( Xij % u0j ] ) S. Raudenbush&Bryk (2002, S. 303) ( (γ00 % γ01 ( Z.j % γ10 ( Xij % γ11 ( Z.j ( Xij [ % u1j ( Xij % u0j ] ) 1 ' 5 e Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 42 Raudenbush et.al. (2000) erläutern die Interpretation geschätzten γ-Parameter am Beispiels eines Population-average-Model ohne Wechselwirkungseffekt zwischen den exogenen Individualund Kontextmerkmalen. „However, one might also want to know the average difference between log-odds of success of students having the same X but attending schools differing by one unit on W, that is, the difference of interest averaging over all possible values of u0 j. ... Note that [the formula, W.L.] does not condition on (or „hold constant“) the random effect u0 j. Thus γ *01 gives the expected difference in log-odds of success between two students with the same X who attend schools differing by one unit on W - without respect to the random effect u0 j. If one had a nationally representative sample and could validly assign a causal inference to W, γ *01 would be the average chance in the log-odds of success in the whole society associated with boosting W by one unit while γ 01 would be the average change in log-odds associated with boosting W one unit for those schools sharing the same value of u0 j.“ (A.a.O., S. 129f.) HGLM schätzt sowohl das kontextspezifische also auch das Populationsmodell für diskrete Kriteriumsvariablen. Die Parameter des Populationsmodells werden mit Hilfe der Verallgemeinerten Kleinste-Quadrate-Methode geschätzt, wobei ihnen die Kovarianzstruktur der Varianzkomponenten des kontextspezifischen Modells zugrunde gelegt wird. Zusätzlich berechnet HGLM robuste Standardfehler für das „populations-average-model“ die nach Zeger et.al. (1988) folgende Vorteile aufweisen: „These standard errors are relatively insensitive to misspecification of the variances and covariances at the two levels and to the distributional assumptions at each level. The method of estimation used in HGLM for the population-average model is equivalent to the „generalized estimating equation“ (GEE) approach popularized by Zeger, et al. (1988).“ (Raudenbush et. al. 2000, S. 130) Raudenbush weist darauf hin, dass wir mit Hilfe der logistischen Regressionskonstanten γ *00 des Populationsmodells die durchschnittliche Wahlwahrscheinlichkeit der Grundgesamtheit ermitteln können, wenn wir alle exogenen Individual- und Kontextmerkmale an ihrem jeweiligen Grand-Mean-zentrieren oder alternativ ein reines Random-Intercept-Only-Modell schätzen. Da die Residualvarianzen der Binnenregressionen des logistischen Mehrebenenmdoells heteroskedastisch sind, können wir die zugehörige Varianzkomponente σ2e ij nicht mehr kontextübergreifend schätzen. Daher empfehlen Snijders&Boskers (1999, S. 224), als konservative Schätzung der Residualvarianz der ersten Ebene die Varianz der logistische Dichtefunktion mit einem Wert von π2 / 3 oder 3,29 in die Formel des Intra-Klassen-Korrelationskoeffizienten einzusetzen.6 6 Alternativ zum Vorgehen von Snijders&Boskers (1999) schlagen Goldstein, Browne&Rabash (2000) ein Simulationsmodell zur Schätzung der Residualvarianz innerhalb der Kontexteinheiten vor, welches sie mit der Markov-Chain-Monte-Carlo-Methode (MCMC) in ihrem Programm MLWin 1.10 realisiert haben. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 43 „Since the logistic distribution for the level-one residual implies a variance of π2 / 3 = 3.29, this implies that for a two-level logistic random intercept model with an intercept variance of τ20 , the intraclass correlation is .“ 2 ρI ' τ 0 τ20 % π2 / 3 5. Entwicklung eines Auswertungsdesigns Verallgemeinerte Lineare Mehrebenenmodelle erfordern eine sorgfältige Planung der einzelnen Auswertungsschritte, wobei die Auswahl der exogenen Individual- und Kontextmerkmale stets hypothesen- und somit theoriegeleitet erfolgen sollte. Nur so ist es möglich, „sparsame“ und „erklärungskräftige“ Mehrebenenmodelle zu entwickeln, die dem analysierten Gegenstandsbereich gerecht werden können. Analytisch haben wir hierbei zu unterscheiden zwischen der Erklärung der Variation unserer Kriteriumsvariablen innerhalb der Kontexteinheiten, der sogenannten „Pooled Within-Context-Regression“, und zwischen den analysierten Kontexteinheiten. Letztere bezeichnen wir als „Between-Context-Regression“. Während erstere die Viktimisierungsunterschiede einzelner Befragtengruppen innerhalb der Nachbarschaften als Kontexteinheit untersucht, versucht letztere zu klären, auf welche Kontextmerkmale die Unterschiede der Viktimisierungsraten der Nachbarschaften zurückzuführen sind. Daher entwickeln wir im ersten Arbeitsschritt auf der Basis unserer Forschungshypothesen zunächst ein logistisches Regressionsmodell zur Vorhersage des Viktimisierungsrisikos durch Gewaltdelikte innerhalb der Nachbarschaften. Anschließend verwenden wir ein lineares Regressionsmodell, um die Variation der Opferraten zwischen den Nachbarschaften durch ausgewählte Kontextmerkmale zu erklären. Im zweiten Arbeitsschritt schätzen wir mit WHLM 5 zunächst ein Random-Intercept-OnlyModel, um die Kontextabhängigkeit des Viktimisierungsrisikos durch Gewaltdelikte summarisch zu bestimmen. Im dritten Arbeitsschritt schätzen wir anschließend ein logistisches Mehrebenenmodell zur Vorhersage die Opferrisikos, das die bedeutsamen Individualmerkmale enthält und die Kontextzugehörigkeit der Befragten adäquat berücksichtigt (Random-Intercept-Model). Im vierten Arbeitsschritt schätzten wir zusätzlich zur Varianzkomponente der kontextabhängigen logistischen Regressionskonstanten diejenige des logistischen Steigungskoeffizienten für den Gruppenunterschied des Opferrisikos von Minoritätenangehörigen im Vergleich zu ihren weißen Nachbarn. Im fünften Arbeitsschritt erweitern wir hypothesengeleitet unser logistisches Mehrebenenmodell um ausgewählte Kontextmerkmale, um die Variation der Opferrisken sowohl der Referenzgruppe auch der Minoritätenangehörigen zwischen den Nachbarschaften durch sie zu erklären. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse Tab. 5: WiSe 2001/2002 44 Auswertungsdesign für die Seattle-Viktimisierungsstudie von Miethe 1. Arbeitsschritt: Explorative, hypothesengeleitete Analysen 1.1 Pooled-Within-Context-Logit-Regression (SPSS): Analyse der Variation des Viktimisierungsrisikos durch Gewaltdelikte innerhalb der Nachbarschaften auf der Basis ausgewählter Individualmerkmale 1.2 Between-Context-Regression (SPSS): Analyse der Variation der Viktimisierungsraten durch Gewaltdelikte zwischen den Nachbarschaften auf der Basis ausgewählter Kontext-/Nachbarschaftsmerkmale (Multiple Lineare Regression) 2. Arbeitsschritt: Schätzung des Random-Logit-Intercept-Only-Model (WHLM 5) Bestimmung des Ausmaßes der Kontextabhängigkeit des Opferrisikos durch Gewaltdelikte (Intra-Class-Correlation-Coefficient) 3. Arbeitsschritt: Schätzung des Random-Logit-Intercept-Model mit den Individualmerkmalen (WHLM 5) Erklärung der Binnenvariation des Opferrisikos durch die in Arbeitsschritt 1.1 ausgewählten Individualmerkmale bei gleichzeitiger Berücksichtigung der Kontextzugehörigkeit der Befragten. 4. Arbeitsschritt: Schätzung des Random-Logit-Intercept/Logit-Slope-Model (WHLM 5) Bestimmung der Kontextabhängigkeit des Gruppenunterschieds der Viktimisierung durch Gewaltdelikte von Minoritätenangehörigen im Vergleich zu ihren weißen Nachbarn (Schätzung der Varianzkomponente des Random-Logit-Slope der Dummyvariablen MINORITY) 5. Arbeitsschritt: Schätzung des Logit-Coefficient-as-Outcome-Model (WHLM 5) Erklärung der Variation des Random-Logit-Intercept und Random-Logit-Slope zwischen den Nachbarschaften durch die in Arbeitsschritte 1.2 ausgewählten Kontextmerkmale 6. Arbeitsschritt: Schätzung des Logit-Coefficient-as-Outcome-Model mit dem FreewareProgramme MIXOR von Hedecker&Gibbons Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 45 6. 1. Arbeitsschritt: Explorative, hypothesengeleitete Analysen Im Rahmen der explorativen Analysen betrachten wir zunächst das Viktimisierungsrisiko bei Gewaltdelikten innerhalb der 300 untersuchten Nachbarschaften. Anschließend richtet sich unser Augenmerk auf die Variation der Viktimisierungsrate zwischen den Nachbarschften, wobei wir uns fragen, von welchen Kontextmerkmalen sie vom Niveau her abhängt. 6.1 Explorative Analyse des Viktimisierungsrisikos innerhalb der Nachbarschaften Bevor wir uns der Vorhersage des Opferrisikos zu wenden, betrachten wir zunächst das Niveau der Viktimierung durch Körperverletzung oder Raubüberfälle in der eigenen Nachbarschaft während des vorgegebenen Erinnerungszeitraums von zwei Jahren. Wir stellen sie in der folgenden Abbildung dem Risiko gegenüber, Opfer eines Wohnungseinbruchs zu werden. Viktimisierung durch Koerperverletzung,Raub in den letzten 2 Jahren Gültig Fehlend Gesamt nein ja Gesamt 9,00 Häufigkeit 5049 252 5301 1 5302 Prozent 95,2 4,8 100,0 ,0 100,0 Gültige Prozente 95,2 4,8 100,0 Kumulierte Prozente 95,2 100,0 Viktimisierung durch (versuchten) Einbruch in den letzten 2 Jahren Gültig Fehlend Gesamt nein ja Gesamt 9,00 Häufigkeit 4297 994 5291 11 5302 Prozent 81,0 18,7 99,8 ,2 100,0 Gültige Prozente 81,2 18,8 100,0 Kumulierte Prozente 81,2 100,0 Von den 5302 Befragten per CATI-Interview befragten Bürgern Seattles sind während des 2jährigen Erinnerungszeitraums 4,8 % Opfer einer Körperverletzung oder Raubüberfalls geworden, während 18,8 % einen Einbruch in ihre eigene Wohnung erlebt haben. Zur Vorhersage des Viktimisierungsrisikos durch Gewaltdelikte innerhalb der eigenen Nachbarschaft schätzen mit Hilfe von SPSS ein binäres logistisches Regressionsmodelle, wobei wir zunächst nur die Individualmerkmale Alter, Geschlecht, Minoritätenstatus, Einkommensgruppe, Allein stehend sowie die Anzahl „gefährlicher außerhäuslicher Aktivitäten“ als Prädiktoren verwenden. Um eine realistische Referenzgruppe zu erhalten, zentrieren wir die metrischen Merkmale Alter, Einkommengruppe sowie außerhäusliche Aktivitäten an ihrem jeweiligen Gesamtmittelwert („Grand-Mean-Zentrierung“). Hierdurch erfaßt die logistische Regressionskonstante den Erwartungswert des Logits der Viktimisierung für verheiratete weiße Männer im Durchschnittsalter von 48,6 Jahren, die über ein mittleres Haushaltseinkommen und ein mittleres außerhäusliches Aktivitätsniveau verfügen. Die logistischen Steigungskoeffizienten der anderen exogenen Merkmale erfassen unmittelbar die Abweichung der geschätzten Viktimisie- Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 46 rungslogits der im jeweiligen Merkmal abweichenden Effektgruppen. Im Hinblick auf die geschätzten Logits der Viktimisierung ist das logistische Regressionsmodell zwar linear, bezüglich der geschätzten Wahrscheinlich, innerhalb der eigenen Nachbarschaft Opfer einer Gewalttat zu werden, ist es aber nichtlinear, wobei es sich der S-förmigen logistischen Verteilungsfunktion bedient. Nach der Schätzung des Pooled-Within-Context-Logit-Model mit den reinen Individualmerkmalen berücksichtigen wir zusätzlich die Nachbarschaftszugehörigkeit der Befragten, indem wir unser Logitmodell um 300 minus 1 Kontextdummyvariablen erweitern. Wir stellen anschließend die ermittelten Maße der statistischen und praktischen Signifikanz beider Logitmodelle gegenüber. Für die Schätzung der Modelle mit SPSS V11.0 benötigen wir die folgende Befehlsdatei: * Level-1-Analysen der Viktimisierung durch Gewaltdelikte. * Berechnung der Grand-Means für metrische Individualmerkmale. DESCRIPTIVES VARIABLES=alter income dangact /STATISTICS=MEAN STDDEV MIN MAX . * Berechnung der Grand-Mean-Zentrierten Individualmerkmale. compute agecgm=alter-48.58. compute incomcgm=income-3.35. compute dangacgm=dangact-0.88. compute agec17=alter-17. var labels agecgm 'Lebenalter CGM'/ incomcgm 'Familieneinkommen CGM'/ dangacgm 'Gefahrensituationen CGM'/ agec17 'Lebensalter Zentriert Mindestalter'. DESCRIPTIVES VARIABLES=agecgm incomcgm dangacgm,agec17 /STATISTICS=MEAN STDDEV MIN MAX . * Logistisches Regressionsmodell M 1 zur Analyse des Viktimisierungsrisikos. * CGM-metrischer Individualmerkmale. LOGISTIC REGRESSION VAR=dvicviol /METHOD=ENTER agecgm frau minority incomcgm livalone dangacgm /CLASSPLOT /PRINT=ITER(1) /CRITERIA PIN(.05) POUT(.10) ITERATE(20) CUT(.5) . * Logist.Regressionsmodell M 2 mit zusaetzlichen Nachbarschaftsdummyvariablen. LOGISTIC REGRESSION VAR=dvicviol /METHOD=ENTER agecgm frau minority incomcgm livalone dangacgm /CONTRAST (blockict)=Indicator /CLASSPLOT /PRINT=ITER(1) /CRITERIA PIN(.05) POUT(.10) ITERATE(20) CUT(.5) . Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 47 Für das logistische Regressionsmodell M 1 erhalten wir auszugsweise die folgenden Angaben zur Modellanpassung und die zugehörigen Logitschätzer: Omnibus-Tests der Modellkoeffizienten Schritt 1 Schritt Block Modell Chi-Quadrat 60,558 60,558 60,558 df 6 6 6 Sig. ,000 ,000 ,000 Modellzusammenfassung -2 Log-Likeli hood Schritt 1 1730,159 Cox & Snell R-Quadrat ,013 Nagelkerkes R-Quadrat ,040 Variablen in der Gleichung Schritt a 1 Regressions koeffizientB AGECGM -,006 FRAU ,012 MINORITY ,115 INCOMCGM -,187 LIVALONE ,577 DANGACGM ,319 Konstante -3,295 Standardfehler ,004 ,141 ,189 ,056 ,151 ,086 ,121 Wald 2,013 ,007 ,372 11,246 14,610 13,668 744,209 df 1 1 1 1 1 1 1 Sig. ,156 ,933 ,542 ,001 ,000 ,000 ,000 Exp(B) ,994 1,012 1,122 ,830 1,780 1,376 ,037 a. In Schritt 1 eingegebene Variablen: AGECGM, FRAU, MINORITY, INCOMCGM, LIVALONE, DANGACGM. Mit einem Likelihood-Ratio-χ2-Wert von 60,56 bei 6 Freiheitsgraden verwerfen wir die zugehörige Nullhypothese, die besagt, dass alle logistischen Steigungskoeffizienten Null sind, mit einer Irrtumswahrscheinlichkeit von weniger als einem Prozent. Die betrachteten sechs exogenen Merkmale üben zwar einen statistisch signifikanten Einfluß auf das Logit der Viktimisierung durch Gewaltdelikte aus, aber ihr Einfluß im Sinne der praktischen Signifikanz erweist sich als dürftig. Dies ist deutlich ersichtlich, wenn wir die zugehörigen Pseudo-R2 betrachten. SPSS bietet uns als „Pseudo-Bestimmtheitsmaße“ diejenigen an, die Maddala (1983) sowie Cragg&Uhler (1970) entwickelt haben. Ersteres firmiert in SPSS als Cox&Snell- und letzteres als Nagelkerke Pseudo-R2. Wie Langer (2000) ausführlich gezeigt hat, unterschätzen aber beide deutlich die „wahre Modellanpassung“. Hingegen verfügt das von Veall&Zimmermann (1992,1994) korrigierte Aldrich&Nelson Pseudo-R2 (1984) über die beste Approximation des McKelvey&Zavoina Pseudo-R2s. Letzteres beschreibt den Fit des binären oder ordinalen Logitmodell gemäß den Simualationsstudien von Hagle&Mitchell (1992), Veall&Zimmermann (1992,1994) , Windmeijer (1994) sowie Demaris (2002) am besten. Da es aber auf der direkten Varianzzerlegung der geschätzten Logits beruht und diese in den meisten Mehrebenenprogrammen nicht realisierbar ist, verwenden wir zur Beurteilung der praktischen Signifikanz das Aldrich&Nelson Pseudo-R2 mit der von Veall&Zimmermann (1992) vorgeschlagenen Korrektur anhand seiner geschätzten Obergrenze. Der Logik der proportionalen Fehlerreduktion (PRE) folgend, ist es auf den Wertebereich von Null bis Eins begrenzt. Wir können es daher analog zum klassischen Determinationskoeffizienten R2 als geschätzten Anteil der durch die exogenen Variablen aufgeklärten Varianz der Logits interpretieren. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 48 Berechnung des Proportional&Reduction&of&Error&R 2 auf der Basis der Deviancen von Null&und Alternativmodell 2: PRE&R 2 ' DevianceNullmodell & DevianceA.M.2 DevianceNullmodell DevianceA.M.2 McFadden Pseudo&R 2 ' 1 & DevianceNullmodell Da das McFadden Pseudo-R2 und das PRE-R2 von ihrem Konstruktionsprinzip her identisch sind, liefert sie beide denselben Wert für die auf die exogenen Merkmale zurückzuführende proportionale Reduktion der Deviance. Einen etwas realistischeren Aufschluss über die Modellanpassung vermittelt das Aldrich&Nelson Pseudo-R2. Da es nur bei Gleichverteilung der Kategorien der Kriteriumsvariable sein theoretisches Maximum von Eins erreicht, haben Veall&Zimmermann (1994) in Anlehnung an Hagle&Mitchell (1992) vorgeschlagen, zunächst seine empirische Obergrenze bei gegebener Verteilung der Kategorien zu schätzen und anschließend das Aldrich&Nelson Pseudo-R2 an seiner empirischen Obergrenze zu normieren. Berechnung des Aldrich&Nelson&Pseudo&R 2 für binäre/ordinale Kriteriumsvariablen: Für Probits: Aldrich&Nelson&Pseudo R ' 2 ' LR&Χ2M 2 LR&Χ MA A % n MA 2 ( (lnL A & lnL0 ) 2 ( (lnL A & lnL0 ) % nM A Für Logits: Aldrich&Nelson&Pseudo R ' LR&Χ2M 2 ' 2 LR&Χ MA A % ( nM ( 3,29 ) A 2 ( (lnL A & lnL0 ) 2 ( (lnLA & lnL0 ) % ( nM ( 3,29 ) A Veall&Zimmermann schätzen die empirische Obergrenze des Aldrich&Nelson Pseudo-R2 über die folgende Formel: Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 Theoretische Spannbreite: &2 ( lnL0 Probits: 0 # Aldrich&Nelson&Pseudo R 2 # Logits: 0 # Aldrich&Nelson&Pseudo R 2 # 49 n & 2 ( lnL0 &2 ( lnL0 3,29 ( n & 2 ( lnL0 Legende: lnL0: Log&Likelihood des Nullmodells n: Stichprobenumfang n Das eigentliche korrigierte Aldrich&Nelson-Pseudo-R2 berechnen Veall&Zimmermann über die folgende Formel: Veall&Zimmermann&Korrektur des Aldrich&Nelson&Pseudo&R 2: Es wird an seinem eigenen Maximum standardisiert, wobei es von der Anzahl der Kategorien und ihren relativen Häufigkeiten abhängt &< Range [ 0 ; 1 ] Für Probits: Aldrich&Nelson&Pseudo R 2V&Z ' 2 ( (lnL A & lnL0 ) 2 ( (lnL A & lnL0 ) % n &2 ( lnL0 n & 2 ( lnL0 Für Logits: Aldrich&Nelson&Pseudo R 2V&Z ' 2 ( (lnLA & lnL0 ) 2 ( (lnL A & lnL0 ) % 3,29(n &2 ( lnL0 3,29 ( n & 2 ( lnL0 Für die Berechnung des Aldrich&Nelson-Pseudo-R2 mit Veall&Zimmermann-Korrektur benötigen wir das Excel-Arbeitsblatt „mlafitlogit.xls“. Neben dem Gesamtstichprobenumfang von 4659 Befragten setzten wir die Devianzen (-2*LogLikelihood) des Null- und aktuellen Modells an den hierfür vorgesehenen Positionen im Arbeitsblatt ein. Die für den LikelihoodRatio-χ2-Test benötigte Anzahl der Freiheitsgrade erhalten wir, indem die Anzahl der zu schätzenden logistischen Steigungskoeffizienten ermitteln. In unserem Fall haben wir sechs logistische Steigungskoeffizienten geschätzt, die der Anzahl der Freiheitsgrade entsprechen. Excel berechnet anschließend die Likelihood-Ratio-χ2-Prüfgröße und die zugehörige Irrtumswahrscheinlichkeit (alpha). Neben den Maddala-Maximum-Likelihood-Pseudo-R2 ermittelt Excel automatisch diejenigen von McFadden (1979), Aldrich&Nelson (1984) ohne und mit der von Veall&Zimmermann (1992) vorgeschlagenen Korrektur an seiner geschätzten Obergrenze. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 50 Abb. 8:Excel-Arbeitsmappe „mlafitlogit.xls“ zur Berechnung der Pseudo-R2e für Logistische Mehrebenenmodelle mit einer diskreten/ordinalen Kriteriumsvariablen Wie wir der Abb.8 entnehmen, verfügt das Within-Context-logistische Regressionsmodell mit einer geschätzten Varianzaufklärung von 3,73 % gemäß dem A&N-Pseudo-R2 mit Veall&Zimmermann-Korrektur über eine sehr mäßige Modellanpassung im Sinne der praktischen Signifikanz. Daher sollten wir die Effekte der exogenen Individualmerkmale mit einer gewissen Vorsicht interpretieren. Die logistische Regressionskonstante von -3,295 erfasst den Erwartungswert der Viktimisierung für die Referenzgruppe der weißen verheirateten Männer, die rd. 49 Jahre alt sind und ein mittleres außerhäusliche Aktivitätsniveau aufweisen. Dem Wald-Test zur Folge ist ihr geschätztes Logit signifikant von Null verschieden. Bei der Interpretation haben wir zu beachten, dass ein Logit von Null einer Wahrscheinlichkeit von 50 % entspricht. Um die Interpretation zu erleichtern, berechnen wir die geschätzte Opferwahrscheinlichkeit, indem wir die logistische Regressionskonstante als fixed-effect in die Prognosegleichung des logistischen Regressionsmodells einsetzen. Das geschätzte Opferrisiko der Referenzgruppe beträgt rd. 3,57 %. Gemäß seinem negativen Vorzeichen (AGECGM) sinkt mit zunehmenden Alter das Logit der Viktimisierung durch Gewaltdelikte, wobei es gemäß dem Wald-Test die übliche Signifikanzgrenze von 5 % nicht erreicht. Um diesen Alterseffekt im Sinne des von Long (1997, S.75) vorgeschlagenen „discrete change“ zu bestimmen, berechnen wir zusätzlich die geschätzten Opferwahrscheinlichkeiten für die Altersgruppen der 20- und 70-jährigen. Während die 20jährigen mit sonst identischen Merkmalen der Referenzgruppe über Opferrisiko von 4,21 % aufweisen, sinkt es bei den 70-jährigen auf 3,16 % ab. Dies entspricht einer Prozentsatzdifferenz Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 51 von 1,05 %. Im Vergleich zu den Männer der Referenzgruppe liegt das Viktimisierungsrisiko der Frauen nicht signifikant höher, wie wir leicht an der geschätzten Opferwahrseinlichkeit von 3,62 % im Durchschnittsalter erkennen. Bei den 20- bzw. 70-jährigen unterscheidet sich das Risiko der Frauen nur unwesentlich von demjenigen der Männer. Im Durchschnittsalter unterscheidet sich die Opferrisiken der weißen und farbigen Befragten (MINORITY) nicht statistisch signifikant voneinander. Mit 3,99 % liegt die geschätzte Opferwahrscheinlichkeit der ethnischen Minoritäten im Durchschnitt nur knapp einen halben Prozentpunkt über derjenigen ihrer weißen Nachbarn. Hingegen sinkt in signifikanten Maße das Opferrisiko, wenn das Haushaltseinkommen der Befragten (INCOMCGM) zunimmt. Um diesen Effekt sozialer Ungleichheit genauer zu bestimmen, vergleichen wir die geschätzten Opferrisiken der untersten und obersten Einkommensgruppe. Während die Opferwahrscheinlichkeit bei den Befragten mit einem Jahreseinkommen von weniger als $ 10.000 bei 5,44 % im Durchschnittsalter liegt, sinkt es bei denjenigen, die mehr als $ 100.000 verdient haben, auf 1,84 %. Die Unterschiede der geschätzten Opferrisiken liegen in den Altersgruppen der 20-jährigen bei 6,39 vs. 2,18 % bzw. der 70-jährigen bei 4,82 vs. 1,62 %. Somit übersteigt für alle Altersgruppen die Opferwahrscheinlich der „Armen“ diejenigen der „Reichen“ nahezu um das Dreifache. Die beiden „life style“-Indikatoren Singledasein (LIVALONE) und Anzahl außerhäuslicher Aktivitäten (DANGACGM) erhöhen in signifikanten Ausmaß das Risiko der Befragten, Opfer einer Körperverletzung oder eines Raubüberfalls zu werden. Im Vergleich zu der verheirateten Männer der Referenzgruppe steigt ihre Opferwahrscheinlichkeit im Durchschnittsalter auf 6,19% an. Diesen Single-Effekt finden wir ebenfalls bei den 20- und 70-jährigen mit geschätzten Opferrisiken von 7,27 bzw. 5,49%. Über alle Altersgruppen hinweg weisen Alleinstehende ein nahezu doppelt so hohes Opferrisiko auf als Verheiratete. Um den Effekt der außerhäuslichen Aktivitäten zu bestimmen, kontrastieren wir diejenigen Gruppen von Befragten, die sich in alle drei vorgegebenen Gefahrensituationen begeben haben (DANGACT=3) und diejenigen, die dies nicht getan haben (DANGACT=0). Im Durchschnittsalter von rd. 49 Jahren erhalten wir jeweils ein geschätztes Opferrisiko für erstere von 6,8% und für letzere von 2,73%. Bei den 20jährigen erwarten wir Risiken von 7,98 bzw. 3,22%, während sie bei den 70-jährigen auf 6,03 bzw. 2,41% sinken. Über die betrachteten Altersgruppen hinweg, übersteigt das Risiko der „Kneipengeher“ dasjenige der „Stubenhocker“ um das Zweieinhalbfache. Um die Interpretation der Logitschätzer zu erleichtern, stellen wir die mit Hilfe der Prognosegleichung der logistischen Regression geschätzten Opferwahrscheinlichkeiten der einzelnen Effekt- und Altersgruppen in der folgenden Abbildung als dreidimensionales Balkendiagramm dar: Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 52 8 O p f e r r i s i k o 6 4 2 i n % 0 20-jährige R FG RE F 49-jährige U RA MI Y L1 RIT L7 EC NO E EC OM ON C =0 OM IN AL C =3 CT IN LIV CT GA N GA N Effektgruppen DA DA 70-jährige REFGR FRAU MINORITY INCOMECL1 INCOMECL7 LIVALONE DANGACT=0 DANGACT=3 70-jährige 3,16 3,19 3,53 4,82 1,62 5,49 2,41 6,03 49-jährige 3,57 3,62 3,99 5,44 1,84 6,19 2,73 6,8 20-jährige 4,21 4,26 4,7 6,39 2,18 7,27 3,22 7,98 Abb. 9:Geschätzte Wahrscheinlichkeit, Opfer eines Gewaltdelikts zu werden, auf die exogenen Individualmerkmale (Logistische Within-Context-Regression mit n= 4659) Um die Kontextabhängigkeit der Viktimisierung durch Gewaltdelikte zu ermitteln, schätzen wir ein weiteres binäres logistisches Regressionsmodell (M.2), welches zusätzlich die Nachbarschaftszugehörigkeit der Befragten enthält. Hierzu fordern wir SPSS dazu auf, vor der Schätzung der logistischen Regression die Nachbarschaftskennung BLOCKICT in 300-1 Dummyvariablen zu zerlegen und als zusätzlichen Faktor im Modell zu berücksichtigen. Da uns lediglich der summarische Erklärungsbeitrag der Kontextzugehörigkeit Nachbarschaft in Bezug auf die Viktimisierung durch Gewaltdelikte interessiert, verzichten wir auf eine Dokumentation des umfangreichen SPSS-Ausgabeprotokolls und betrachten nur die partiellen Bestimmtheitsmaße der statistischen und praktischen Signifikanz. Tabelle 6 enthält ebenfalls die zugehörigen globalen Maße. Mit einer Irrtumswahrscheinlichkeit von weniger als einem Prozent können wir die Nullhypothese des partiellen Likelihood-Ratio-χ2-Test zurückweisen, die besagt, dass die Nachbarschaftszugehörigkeit keinen statistisch bedeutsamen Einfluß auf das Viktimisierungsrisiko ausübt. Gemessen am Aldrich&Nelson Pseudo-R2 mit Veall&Zimmermann-Korrektur steigt die geschätzte Varianzaufklärung der Logits von 3,73 % (M.1) auf 28,87 % (M.2). Dies entspricht einer auf den Kontextfaktor zurückzuführenden Zunahme um +25,14%. Selbst das sehr konservative McFadden-Pseudo-R2 verzeichnet beim Vergleich beider Modelle einen Informationsgewinn von +23,29 %. Gemäß der von McFadden (1979, S.307) aufgestellten Daumenregel verfügt das Modell 2 mit einem Pseudo-R2 von 26,67% über eine hervorragende Modellanpassung. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 53 Tab. 6: Übersicht der Maße der statistischen und praktischen Signifikanz der logistischen Regressionsmodelle ohne (M.1) und mit Nachbarschaftsdummyvariablen (M.2) Modellanpassung: Modell 1: Modell 2: M.2 vs. M.1 Likelihood-Ratio-χ2-Test = 60,56 477,63 417,07 2) Freiheitsgrade (D.F.) = 6 305 299 Signifikanzniveau α = 0 0 0 Cox&Snell / Maddala -Pseudo-R2 = 1,3 % 9,7 % 8,4 % 3) Nagelkerkes / Cragg&Uhler-Pseudo-R2 = 4,0 % 30,5 % 26,5 % 3) McFadden-Pseudo-R2 = 3,38 % 26,67 % 23,29 % 3) Aldrich&Nelson -Pseudo-R2 mit Veall&Zimmermann-Korrektur = 3,73 % 1) 28,87 % 25,14 % 3) Anmerkungen: 1) Geschätztes Maximum des Aldrick&Nelson-Pseudo-R2 = 0,1046 2) Partieller Likelihood-Ratio-χ2-Test. H0: Alle Logistischen Steigungskoeffizienten der Kontextdummyvariablen sind Null. 3) Differenz der Pseudo-R2e von M.2 und M.1 Beim Vergleich beider logistischer Regressionsmodelle zeigt sich, dass zum einen die exogenen Individualmerkmale nur einen untergeordneten Einfluß auf das Vikimisierungsrisiko durch Gewaltdelikte ausüben. Bei der Bewertung dieses Befundes haben wir zu beachten, dass wir die Effekte der exogenen Individualmerkmale im Durchschnitt aller Kontexteinheiten geschätzt haben. Wir wissen aber nichts darüber, wie stark diese Effekte über die Nachbarschaften hinweg variieren können. Ein Nichteffekt wie derjenige der Minderheitenzugehörigkeit auf die Viktimisierung kann darauf beruhen, dass in der einen Hälfte unserer Nachbarschaften, Farbige ein höheres Opferrisiko als ihre weißen Nachbarn haben, während in der andern Hälfte genau das Gegenteil zutrifft. Das heißt, dort ist die Opferrate der Weißen möglicherweise deutlich höher als diejenige ihre farbigen Nachbarn. Daher sollten wir uns vor „deduktiven Fehlschlüssen“ hüten und die soziale Kontextzugehörigkeit der Befragten im Rahmen eines adäquaten logistischen Mehrebenenmodells berücksichtigen. Zum anderen zeichnet sich deutlich ein starker Einfluß der Nachbarschaftszugehörigkeit auf das Opferrisiko ab. Daher haben wir uns ausführlich mit den „sozial-ökologischen Bedingungen“ der Viktimisierung durch Gewaltdelikte zu beschäftigen, um deren Einflussgewicht zu bestimmen. 6.2 Explorativen Analysen der Viktimisierungsraten durch Gewaltdelikte auf der Nachbarschaftsebene Wir betrachten zunächst die Variation der Viktimisierungsraten speziell für Einbruchs- und Gewaltdelikte sowie durch Kriminalität insgesamt in der eigenen Nachbarschaft über die untersuchten 300 Kontexteinheiten. Als vorgegebener Referenzzeitraum dienen die beiden Jahre vor dem Erhebungszeitpunkt 1990. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 54 100 80 60 Viktimisierung in % 268 126 200 215 293 276 232 40 20 119 101 36 265 6 0 N= Abb. 10: Tab. 7: 230 178 258 179 231 197 213 204 216 199 280 218 227 180 281 257 211 200 229 226 31 201 209 202 208 285 300 300 300 Insgesamt Einbruchs- Gewaltdelikte Variation der Opfersraten in der eigenen Nachbarschaft im vorgegebenen Erinnerungszeitraum von 2 Jahren Deskriptive Statistiken zu den Opferraten auf der Nachbarschaftsebene Viktimisierung insg. in eigener Nachbarschaft in letzten 2 Jahren in Prozent Viktimisierung durch Einbruch in letzten 2 Jahren in Prozent Viktimisierung durch Gewaltdelikte in letzten 2 Jahren in Prozent 05. Perzentil 25. Perzentil 33,33 50,00 5,26 ,00 Median Mittelwert 75. Perzentil 95. Perzentil 60,00 59,75 70,59 83,33 11,11 16,67 18,97 25,00 43,71 ,00 ,00 4,85 5,88 22,22 Wie wir dem Boxplot in Abbildung 10 entnehmen, weist die Viktimisierung durch Gewaltdelikte auf der Nachbarschaftsebene eine erhebliche Variation auf. Während es in 50% der Nachbarschaften keine Gewaltopfer gibt, liegt das Maximum der Opferrate bei 35,7% in der Kontexteinheit 230, die mit einem Sternchen für extrem Ausreißer markiert ist. Die Opferraten bei Einbruchsdelikten weisen mit einer Spannbreite von Null bis 55,56% eine noch höhere Variation auf, wobei die mittlere Opferrate bei 16,7% liegt. Deliktsübergreifend variiert die Viktimisierung innerhalb der eigenen Nachbarschaft zwischen 11,1 und 100,0%, wobei die mittlere Opferrate der Nachbarschaften einen Wert von 60,0% erreicht. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 55 Die exogenen Kontextmerkmale hat die Forschergruppe um Miethe durch die Aggregation der subjektiven Einschätzungen der Befragten in ihrer jeweiligen Nachbarschaft ermittelt. Im Gegensatz zu Miethe&Meier(1994) operationalisieren wir die ethnische Heterogenität der Nachbarschaft nicht über das Produkt der Anteilswerte der ethnischen Minoritäten und ihrer weißen Nachbarn, sondern wir verwenden direkt den Prozentsatz der Angehörigen ethnischer Minderheiten als Indikator. Gegen die Verwendung von Anteilswerten als exogene Kontextmerkmale spricht, dass aufgrund ihres auf das Intervall von Null bis Eins begrenzten Wertebereichs ihre Effekte im Regressionsmodell deutlich überschätzt werden. Im verallgemeinerten linearen Regressionsmodell gibt uns der Steigungskoeffizient an, um wieviel sich der Erwartungswert der Kriteriumsvariable ändert, wenn das exogene Merkmal genau um eine natürliche Einheit zunimmt. Bei Anteilswerten entspricht diese induzierte Änderung der Kriteriumsvariablen der Zunahme der exogenen Variablen von Null auf Eins und somit der gesamten Spannbreite. Für den Prozentsatz der ethnischen Minoritäten erhalten wir die in Abbildung 11 dargestellte Verteilung: 100 903 943 873 902 893 1173 883 941 911 1002 1043 773 882 851 791 80 782 901 881 863 60 871 1013 1183 942 771 852 1101 1103 783 1102 40 20 0 N= Abb. 11: 300 Verteilung des Prozentsatzes ethnischer Minoritäten über die 300 Nachbarschaften Tab. 8: Deskriptive Statistiken für den Prozentsatz ethnischer Minoritäten auf der Nachbarschaftsebene 05. Perzentil 25. Perzentil Prozentsatz ethnische Minderheiten in ,00 ,00 Nachbarschaft Median 6,25 Mittelwert 75. Perzentil 95. Perzentil 15,51 18,75 66,39 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 56 In Abbildung 11 zeichnet sich deutlich die ethnische Segregation der Nachbarschaften in Seattle ab. Die zugehörige Spannbreite reicht zwar von Null bis 93,3% Angehörige ethnischer Minoriäten, der mittlere Prozentsatz liegt aber nur bei 6,25%. An der oberen Quartilsgrenze erkennen wir, dass 75% der untersuchten Nachbarschaften höchsten einen Minderheitenanteil von 18,75% aufweisen. Die eindeutig von Minderheiten dominierten Nachbarschaften zeichnen sich markant durch ihre Kreis- und Sternmarkierungen im Boxplot ab. Die zentralen exogenen Konstrukte der „sozialen Dichte“ (MBUSYPLA), der „sozialen Integration“ (MNINTEGR), der „Zeichen des Verfalls“ (MINCIVIL) sowie dem Einkommensniveau (MINCOME) gewinnen wir über die Mittelwertsbildung der exogenen Individualmerkmale auf der Nachbarschaftsebene. Ihre Variation auf der Kontextebene zeichnet sich deutlich in den Boxplots der Abbildung 12 ab, wobei die Nachbarschaftsmittelwerte nahezu den gesamten theoretischen Wertebereich der zugehörigen Individualmerkmale abdecken. 8 7 6 159 100 57 5 4 216 3 2 112 230 231 1 0 N= 300 300 Soziale Dichte 300 Sozale Integration Zeichen des Verfalls Abb. 12: 300 Einkommensniveau Verteilung der aggregierten Kontextmerkmale auf der Nachbarschaftsebene Tab. 9: Verteilung der Nachbarschaftsmittelwerte der aggregierten Kontextmerkmale Soziale Dichte Zeichen des Verfalls Nachbarschaftsintegration Einkommensniveau 05. Perzentil 25. Perzentil 1,44 2,40 ,39 ,78 2,11 2,94 2,29 2,93 Median 3,23 1,22 3,61 3,36 Mittelwert 75. Perzentil 95. Perzentil 3,45 4,35 5,83 1,33 1,78 2,56 3,51 4,12 4,60 3,36 3,75 4,44 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 57 Wir betrachten zunächst die Korrelationsstruktur der Nachbarschaftsindikatoren und schätzen anschließend ein multiples lineares Regressionsmodell mit SPSS V11.0, um die Variation der Viktimisierungsrate durch Gewaltdelikte auf ihrer Basis vorherzusagen. Tab. 10: Korrelationen der aggregierten Kontextmerkmale auf der Nachbarschaftsebene (n = 300) Soziale Dichte Zeichen des Verfalls Soziale Integration Mittlere Einkommensklasse % ethnische Minderheiten %-Einbruchsopfer in letzt.2 %-Gewaltopfer in letzt.2 J. %-Opfer in Nachbarschaft Soziale Dichte 1 ,474** -,425** -,420** ,073 ,180** ,345** -,109 Mittlere % GewaltZeichen Einkom- %ethnische % Einbruchs- opfer in % Opfer in Soziale des Minderpfer in letzt. den letzt. NachbarmensVerfalls Integration klasse heiten 2 J. schaft 2 J. ,474** -,425** -,420** ,073 ,180** ,345** -,109 1 -,396** -,557** ,408** ,413** ,547** ,198** -,396** 1 ,564** -,099 -,249** -,268** ,231** -,557** ,564** 1 -,380** -,192** -,449** ,114* ,408** -,099 -,380** 1 ,177** ,228** ,140* ,413** -,249** -,192** ,177** 1 ,254** ,420** ,547** -,268** -,449** ,228** ,254** 1 ,154** ,198** ,231** ,114* ,140* ,420** ,154** 1 **. Die Korrelation ist auf dem Niveau von 0,01 (2-seitig) signifikant. *. Die Korrelation ist auf dem Niveau von 0,05 (2-seitig) signifikant. Die Rate der Gewaltopfer korreliert auf der Nachbarschaftsebene positiv von ihrer Stärke her in absteigender Reihenfolge mit den Zeichen des Verfalls, der sozialen Dichte, dem Prozentanteil ethnischer Minoritäten sowie der allgemeinen Kriminalitätsbelastung („proximity to crime“). Hingegen korreliert sie negativ mit dem Einkommensniveau und der sozialen Integration der Nachbarschaft. Da das Einkommensniveau der Nachbarschaft mit den „Zeichen des Verfalls“ sowie der sozialen Integration mit -0,56 bzw. +0,56 relativ hoch korreliert, sollten wir diese Kontextvariable der „sozialen Ungleichheit“ im multiplen Regressionsmodell nicht berücksichtigen, um Multikollinearität zu vermeiden. Wie wir den Abbildungen 10 und 12 entnehmen können, verfügen die meisten unserer Kontextmerkmale weder über einen theoretischen noch über einen empirischen Nullpunkt. Die einzige Ausnahme hiervon bildet der Prozentsatz ethnischer Minoritäten in der Nachbarschaft. Daher empfiehlt es sich die Kontextmerkmale jeweils an ihrem Gesamtmittelwert zu zentrieren. Hierdurch ändert sich die Interpretation der Regressionskonstanten folgendermaßen. Sie erfasst nunmehr den Erwartungswert der Viktimisierungsrate durch Gewaltdelikte für Nachbarschaften, die exakt dem jeweiligen Durchschnitt der Kontextmerkmale Soziale Dichte, Zeichen des Verfalls, Soziale Integration, Minoritätenanteil sowie der allgemeinen Kriminalitätsbelastung entsprechen. Bei ihr handelt es sich daher um eine „Durchschnittsnachbarschaft“. Die Zentrierung selbst führt bei den einzelnen exogenen Variablen dazu, dass wir den Schwerpunkt der Verteilung in den Nullpunkt verschieben, wodurch aber ihre ursprüngliche Streuung beibehalten wird. Für die „Grand-Mean-Zentrierung“ der Kontextemerkmale und die Schätzung des multiplen Regressionsmodells benötigen wir die folgenden SPSS-Befehle: Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 58 GET FILE='D:\LEHRE\multilev\MIETHE\SPSSFWIN\neighbor2.sav'. * Grand-Mean-Zentrierung der Level-2-Indikatoren. compute mbusycgm=mbusypla-3.45. compute mincicgm=mincivil-1.33. compute mnintcgm=mnintegr-3.51. compute mincocgm=mincome-3.36. compute pminocgm=pminori-15.51. compute pvicncgm=pvicion-59.75. var labels mbusycgm 'Soziale Dichte (CGM)'/ mincicgm 'Zeichen des Verfalls (CGM)'/ mnintcgm 'Soziale Integration (CGM)'/ mincocgm 'Einkommensniveau (CGM)'/ pminocgm '%-Minoritäten (CGM)'/ pvicncgm '%-Verbrechensopfer (CGM)'. REGRESSION /DESCRIPTIVES MEAN STDDEV CORR SIG N /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT pvicviol /METHOD=ENTER mbusycgm mincicgm mnintcgm pminocgm pvicncgm. Für das multiple Regressionsmodelle erhalten wir die folgenden Angaben zur Verteilung der untersuchten Variablen, zur Modellanpassung sowie die geschätzten Regressionskoeffizienten: Deskriptive Statistiken Viktimisierung durch Gewaltdelikte in letzten 2 Jahren in Prozent Soziale Dichte (CGM) Zeichen des Verfalls (CGM) Soziale Integration (CGM) %-Minoritäten (CGM) %-Verbrechensopfer (CGM) Mittelwert Standardab weichung 4,8496 7,23854 300 -,0020 1,34472 300 ,0017 ,70183 300 ,0005 -,0025 ,78927 19,75641 300 300 ,0037 15,47415 300 N Modellzusammenfassung Modell 1 R R-Quadrat ,563a ,317 Korrigiertes R-Quadrat ,305 Standardfehler des Schätzers 6,03507 a. Einflußvariablen : (Konstante), %-Verbrechensopfer (CGM), Soziale Dichte (CGM), %-Minoritäten (CGM), Soziale Integration (CGM), Zeichen des Verfalls (CGM) Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 59 ANOVAb Modell 1 Regression Residuen Gesamt Quadrats umme 4958,462 10708,081 15666,543 df 5 294 299 Mittel der Quadrate 991,692 36,422 F 27,228 Signifikanz ,000a a. Einflußvariablen : (Konstante), %-Verbrechensopfer (CGM), Soziale Dichte (CGM), %-Minoritäten (CGM), Soziale Integration (CGM), Zeichen des Verfalls (CGM) b. Abhängige Variable: Viktimisierung durch Gewaltdelikte in letzten 2 Jahren in Prozent Koeffizientena Modell 1 (Konstante) Soziale Dichte (CGM) Zeichen des Verfalls (CGM) Soziale Integration (CGM) %-Minoritäten (CGM) %-Verbrechensopfer (CGM) Nicht standardisierte Koeffizienten Standardfehler B 4,843 ,348 ,638 ,315 Standardisierte Koeffizienten Beta ,118 T 13,901 2,027 Signifikanz ,000 ,044 4,520 ,677 ,438 6,677 ,000 -,583 ,008 ,528 ,020 -,064 ,021 -1,105 ,395 ,270 ,693 ,043 ,025 ,092 1,737 ,083 a. Abhängige Variable: Viktimisierung durch Gewaltdelikte in letzten 2 Jahren in Prozent Mit den fünf ausgewählten Kontextmerkmalen binden wir rd. 31,7 % der Varianz der Viktimisierungsrate durch Gewaltdelikte, wobei sich dieser Erklärungsbeitrag mit einem F-Wert von 27,23 bei 5 respektive 294 Freiheitsgraden als statistisch signifikant erweist. Aufgrund der hierarchischen Datenstruktur sind aber die Voraussetzungen des F- und T-Tests verletzt, so dass wir uns auf die Betrachtung der geschätzten Regressionskoeffizienten nach Vorzeichen und Größe beschränken müssen. Für unsere „Durchschnittsnachbarschaft“ erwarten eine durchschnittliche Viktimisierungsrate von 4,84%. Erhöht sich die soziale Dichte im Sinne der Anzahl „öffentlicher Plätze“ um eine Einheit zu, so erwarten wir eine Zunahme derViktimisierungsrate um jeweils 0,64%. Nehmen hingegen die Zeichen des Verfalls um eine Einheit zu, so steigt die Viktimisierungsrate im Durchschnitt um 4,52%. Erhöht sich das Ausmaß der sozialen Integration der Nachbarschaft um eine Einheit, so erwarten wir eine Abnahme der Viktimisierung um 0,58%. Eine Zunahme des Minderheitenanteils wirkt sich faktisch nicht auf die Opferrate aus. Hingegen führt die Zunahme der Verbrechensbelastung der Nachbarschaft um 1 %, zu einer geringfügen Erhöhung des Viktimisierungsrate um 0,04%. Gemessen an seinem standardisierten Regressionskoeffizienten übt das Kontextmerkmal „Zeichen des Verfalls“ mit einem ß-Koeffizienten von +0,44 den stärksten Einfluß auf Viktimisierungsrate durch Gewaltdelikte aus. Ihm folgen mit deutlichem Abstand die soziale Dichte (ß=+0,12) und die allgemeine Kriminalitätsbelastung der Nachbarschaft (ß=+0,09). Hingegen unterschreiten die Kontextmerkmale soziale Integration und Minderheitenanteil deutlich die für eine inhaltliche Interpretation geltende |0,10|-Grenze. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 60 6.3 Entwicklung eines Mehrebenenmodells für die Erklärung des Viktimisierungsrisikos durch Gewaltdelikte Auf der Grundlage der in Abschnitt 6.1 und 6.2 durchgeführten Arbeitsschritte entwickeln wir nun ein Verallgemeinertes hierarchisches Zweiebenenmodell, bei dem wir zum einen innerhalb der Nachbarschaften das Logit der Viktimisierung durch Gewaltdelikte (DVICVIOL) auf der Basis unserer exogenen Individualmerkmale schätzen. Zum anderen zerlegen wir die Varianz der geschätzten logistischen Regressionskonstante und ausgewählter Steigungskoeffizienten mit Hilfe der bereits vorgestellten Kontextmerkmale. SOZIALE DICHTE: Anzahl öffentlicher Plätze (MBUSYPLA(CGM)) Ebene 2: Nachbarschaftskontext ETHNISCHE HETEROGENITÄT: % Minderheiten (PMINORI(CGM)) ZEICHEN DES VERFALLS: (MINCIVIL(CGM)) SOZIALE INTEGRATION: (MNINTEGR(CGM)) PROXIMITY TO CRIME: (PVICTION(CGM)) Ebene 1: Befragte in ihrer Nachbarschaft Logit-Regressionskonstante: Verheiratete weiße Männer ß1 ALTER (CGM) ß2 ß0j Y ij: Logit (DVICVIOL) Abb. 13: FRAU vs. Mann Ethnische Minderheit (MINORITY) ß3j ß4 HH-Einkommensklasse (INCOME(CGM)) ß5 Alleinstehend (LIVALONE) ß6 Ausserhäusliche Aktivitäten (DANGACT(CGM)) Theoriegeleitetes Logit-Zweiebenenmodell zur Erklärung des Viktimisierungsrisikos durch Gewaltdelikte Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 61 Die Schätzgleichungen des logistischen Mehrebenenmodells : Level / Ebene 2: Between&Context&Regression 2 a) Logistic Intercept&as&Outcome: β 0 j β 0 j ' γ 0 0 % γ 0 1 ( ( PMINORI. j& PMINORI.. ) % γ 0 2 ( ( MNINTEGR. j& MNINTEGR.. ) % γ 0 3 ( ( MINCIVIL. j& MINCIVIL.. ) % u 0 j 2 b) Fixed Logistic Slope: β 1 j β1j ' γ10 2 c) Fixed Logistic Slope: : β 2 j β2j ' γ20 2 d) Logistic Slope&as&Outcome: β 3 j β 3 j ' γ 3 0 % γ 3 1 ( ( PMINORI. j& PMINORI.. ) % γ 3 2 ( ( MNINTEGR. j& MNINTEGR.. ) % γ 3 3 ( ( MINCIVIL. j& MINCIVIL.. ) % u 3 j 2 e) Fixed&Logistic Slopes: β 4 j β 4 j ' γ40 2 f) Fixed&Logistic Slopes: β 5 j β 5 j ' γ50 2 g) Fixed&Logistic Slopes: β 6 j β 6 j ' γ60 Level / Ebene 1: Logistic Within&Context Regression 1) ln P ( DVICVIOL ' 1) 1 & P ( DVICVIOL ' 1 ) ' β 0 j % β 1 j ( ( ALTERì j& ALTER.. ) % β 2 j ( FRAU i j ij % β 3 j ( MINORITY i j % β 4 j ( ( INCOME i j& INCOME.. ) % β 5 j ( LIVALONE i j % β 6 j ( ( DANGACT i j& DANGACT.. ) % e i j Bei dem in Abbildung 13 vorgestellten Mehrebenenmodell handelt es sich in seiner Gänze zwar um ein wünschenswertes Erklärungsmodell. Die bisherigen Erfahrungen mit der Schätzung Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 62 logistischer Mehrebenenmodelle zeigen aber, dass Modelle mit mehr als zwei Varianzkompenenten kontextabhängiger Effekte („random effects“) kaum identifizierbar sind. Zumeist gelangt der iterative Lösungsalgorithmus der Maxiumum-Marginal-Likelihood oder des Laplace6Verfahren nicht zu einer konvergierenden Lösung. Dies ist darauf zurückzuführen, dass die logistischen Within-Context-Regressionen wegen der geringen Fallzahlen der einzelnen Kontexte zumeist sehr instabile logistische Schätzer liefern. Für eine stabile Schätzung der kontextabhängige Effekte benötigen wir aber mindestens zehn Fälle pro „random-effect“ in jeder einzelnen Kontexteinheit. Ein Blick auf die Verteilung der Anzahl der Befragten innerhalb der Nachbarschaften offenbart uns in Tabelle 11, dass sie zwischen 13 und 21 Personen schwanken. Daher können wir höchstens zwei kontextabhängige Effekte in unserem logistischen Mehrebenenmodell schätzen. Tab.11: Gültig Verteilung der Befragtanzahl innerhalb der 300 untersuchten Nachbarschaften 13 14 15 16 17 18 19 20 21 Gesamt Häufigkeit 1 3 8 26 50 180 23 5 4 300 Prozent ,3 1,0 2,7 8,7 16,7 60,0 7,7 1,7 1,3 100,0 Gültige Prozente ,3 1,0 2,7 8,7 16,7 60,0 7,7 1,7 1,3 100,0 Kumulierte Prozente ,3 1,3 4,0 12,7 29,3 89,3 97,0 98,7 100,0 Aus diesem Grunde sind wir gezwungen, unser logistisches Mehrebenenmodell stark zu vereinfachen. Wie den Schätzgleichungen zu entnehmen ist, erklären wir zum einen die Variation der kontextabhängigen logistischen Regressionskonstante durch die Nachbarschaftsmerkmale Ethnische Heterogenität, Soziale Integration und den Zeichen des Verfalls. Die logistische Regressionskonstante ß0j liefert uns den Erwartungswert des Logits der Viktimisierung durch Gewaltdelikte für weiße, verheiratete Männer im Durchschnittsalter von rd. 49 Jahren, deren Haushaltseinkommen und außerhäuslichen Aktivitäten dem jeweiligen Gesamtmittelwert entspricht. Als zweiten „random-effect“ schätzen wir den logistischen Steigungskoeffizienten ß3j, der für ihre farbigen Nachbarn die Abweichung ihres Logits der Viktimisierung von demjenigen der Referenzgruppe erfasst. Anschließend verwenden wir zur Varianzaufklärung dieses kontextabhängigen logistischen Steigungskoeffizienten die drei bereits vorgestellten Nachbarschaftsmerkmale. Auf die Kriminalitätsbelastung der Nachbarschaft als exogenes Kontextmerkmal müssen wir verzichten, da wir sie durch Aggregation der selbstberichteten Opfererfahrungen der Befragten gebildet haben. Hierdurch kreieren wir einen definitorischen Zusammenhang zwischen der Kriteriumsvariable der logistischen Regression und diesem Kontextmerkmal, der dazu führt, dass der iterative Schätzalgorithmus keine Konvergenzlösung findet. Daher müssen auf die „Proximity to Crime“ als kontextuellen Erklärungsfaktor verzichten. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 63 7. Die Schätzung des Generalized Hierarchical Linear Model mit HLM 5 Um die Mehrebenenmodelle der Arbeitsschritte 2 bis 5 mit HLM 5 schätzen zu können, importieren wir zunächst unsere SPSS-Datendatei „miethewhlm.sav“, die bereits die hierarchische Datenstruktur enthält. Anschließend spezifizieren wir die einzelnen Mehrebenenmodelle, deren Schätzgleichungen wir ebenfalls vorstellen. 7.1 Das Importieren von SPSS-Daten in HLM 5 Die Vollversion von HLM 5 beinhaltet eine DMBSCOPY 7-Teillizenz, die es gestattet, aus fast allen bekannten Statistikprogrammen und Datenbanken Level-1 bis Level-3 Datendateien direkt zu importieren. In der Studentenversion beschränkt sich der Datenimport auf SPSS, SYSTAT sowie SAS 5-Transport-Dateien. HLM 5 baut sich selbständig die benötigte hierarchische Datenstruktur in der „Sufficient-Statistics-Matrix“ (SSM-Datei) auf, wobei für die nichtlinearen Wahrscheinlichkeitsmodelle die importierten Daten aus ihren Ursprungsdateien mehrfach im Rahmen der iterativen Lösungen eingelesen werden. Daher sollten Arbeitsgruppen ihre Sufficient-Statistical-Matrix-Dateien auf demselben gemeinsamen Netzlaufwerk aufbauen, wo sie auch die ursprünglichen Datendatei abgelegt haben. HLM 5 protokolliert die Rahmen der menügesteuerten Variablenauswahl benötigten Befehle in einer Response-Kommandodatei, die intern den Suffix „*.rsp“ erhält. Zusätzlich führt HLM bei der Generierung der hierarchischen Datenstruktur eine deskriptive Analyse der eingelesenen Variablen durch, wobei es in der Datei „hlm2ssm.sts“ für die einzelnen Analyseebenen getrennt die zugehörigen Fallzahlen, Mittelwerte, Standardabweichungen, Minima und Maxima protokolliert. Nach der graphischen Spezifikation der Mehrebenengleichungssystems protokolliert HLM alle zur Schätzung des Modells benötigten Befehle in einer mit dem Suffix „*.hlm“ versehenen Kommandodatei, deren Name der Nutzer selbst festlegt. Das gesamt Ausgabeprotokoll speichert HLM in einer mit der Endung „*.out“ versehenen Datei, deren Name vom Nutzer ebenfalls frei zu wählen ist. Als zusätzliche Optionen bietet HLM 5 die Möglichkeit an, sich für SPSS, SYSTAT oder SAS neben den Level-2 Prädiktoren die Residuen der Kleinste-Quadrate- und der „Empirical Bayes“Schätzungen im Sinne ihrer kontextspezifischen Abweichungen von den „fixed effects“ der Populationsschätzung extern speichern zu lassen. Diese ASCII-Datei enthält neben den für das Einlesen benötigten Befehlen zusätzlich die auf der Basis der Kontextmerkmale geschätzten Erwartungswerte („fitted values“) der kontextabhängigen Regressionskoeffizienten der Level-1Gleichung. Auf ihrer Grundlage können wir später beispielsweise in SPSS detaillierte Analysen der Residuen im Sinne der Identifikation von besonders stark abweichenden Kontexteinheiten durchführen.7 Um Daten aus SPSS in HLM einzulesen, rufen wir im File-(Datei-) Menü den Unterpunkt „SSM“ auf, wobei wir die Erstellung einer neuen „Sufficient-Statistics-Matrix“ anfordern, deren Level-1 und Level-2 Daten wir aus einem anderen Statistikpaket („Stat package input“) einlesen wollen. 7 Vgl. Raudenbush, Bryk, Cheong&Congdon 2000, S. 41-49 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - Abb. 14: Abb. 15: WiSe 2001/2002 Programminterne Dateiverwaltung von HLM 5 Erstellen einer neuen HLM-SSM-Arbeitsdatei über den Datenimport aus SPSS 64 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 Nach dem Aufruf der Datenimportoption erwartet HLM 5 zunächst eine genau Spezifikation der zu erstellten hierarchischen Datenstruktur. Bei Querschnittsanalysen unterscheidet HLM zwischen 2- und 3-Ebenenmodellen („HLM2" bzw. „HLM3"). Für Wiederholungsmessung bietet HLM ebenfalls 2(„HMLM“) bzw. 3-Ebenenmodelle („HMLM2") an, die aber ein Set von Dummyvariablen für die einzelAbb. 16: nen Messzeitpunkte erfordern. 65 Festlegung der Art des zu schätzenden Mehrebenenmodells Danach erscheint das eigentlich HLM-Menü für die Erstellung des „SSM-File“, wobei HLM standardmäßig davon ausgeht, dass die Daten als SPSS, SAS oder SYSTAT-Dateien vorliegen. Wenn wir die Option „Anything else“ im Auswahlfeld „Input File Type“ wählen, aktivieren wir das DMBSCOPY-Modul für den Datenimport aus anderen Statistikprogrammen und Datenbanken. Über den „Browse“-Schaltknopf rufen wir das Dateiauswahlmenü für die Level-1 bzw. Level-2 Ebene auf. HLM kann sowohl die Level-1 und Level-2 Variablen aus getrennten Dateien mit einer gemeinsamen Kontextkennung also auch aus einer einzigen Datendatei einlesen, die bereits die zu generierende hierarchische Datenstruktur enthält. Abb. 17: Erstellungsmenü für die Auswahl der einzulesenden Level-1 und Level-2Datensätze aus SPSS oder anderen Statistikprogrammen Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 66 Als Level-1-Datei lesen wir unsere SPSS-Datendatei „miethewhlm.sav“ ein, die ebenfalls die bereits auf der Individualebene gespiegelten Kontextmerkmale enthält. Abb. 18: Auswahl des Level-1-SPSS-Datensatzes Als Kontextkennung oder ID-Variable wählen wir das Merkmal „BLOCKICT“aus, welche die numerische Straßenblock-im-Census-Tact-Kennung enthält. Als Kontextkennung läßt HLM sowohl numerische als auch alphanumerische Variablen zu, die maximal zwölf Stellen umfassen dürfen. Bei letzteren haben wir darauf zu achten, dass in beiden Level-1 und Level-2 Datensätzen die Buchstabenkennung gleichermaßen links oder rechtsbündig eingetragen ist. Abb. 19: Auswahl der Kontextkennung und der Level-1-Variablen Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - Abb. 20: WiSe 2001/2002 67 Auswahl weiterer Level-1-Variablen Die Kontextmerkmale der Nachbarschaft lesen wir ebenfalls aus unserer Datendatei „miethewhlm.sav“ ein, wobei wir zunächst die Kontextkennung „BLOCKICT“ als ID-Variable auswählen und anschießend die in die SSM-Datei zu übernehmenden Kontextmerkmale jeweils durch ein „Häkchen“ markieren. Abb. 21: Festlegung der Level-2-Kennung im Level-2Datensatz Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - Abb. 22: WiSe 2001/2002 68 Auswahl der Kontextmerkmale im Level-2 Datensatz Nachdem wir im Importhauptmenü den vollständigen Dateinamen „miethepw.ssm“ und die absolute Pfadadressierung der SSM-Datei „d:\multilev\hlm5\“ angegeben haben, vereinbaren wir weiterhin das Vorliegen von „fehlenden Angaben“ bei den Level-1-Variablen. HLM 5 bietet als Möglichkeiten ihrer Behandlung den fallweisen bzw. paarweisen Ausschluss der zugehörigen Beobachtungseinheiten an. Bei ersterem schließt HLM alle Fälle bei der Erstellung der SSMDatei aus, die bereits auf einer einzigen Variable einen fehlenden Wert aufweisen. Da wir verschiedene abhängige Variablen haben, empfiehlt es sich den paarweisen Ausschluss zu wählen. Hierbei übernimmt HLM zunächst alle Fälle in die SSM-Datei und schließt erst bei den konkreten Mehrebenenanalyse Fälle mit fehlenden Angaben aus. Für die Ebenen 2 und 3 läßt HLM nur Kontexteinheiten zu, deren Kontextmerkmale keine fehlenden Angaben aufweisen. Vor der eigentlichen Erstellung der SSM-Arbeitsdatei, speichern wir die von uns im Importmenü vorgenommenen Einträge und Auswahlen in einer Befehlsdatei, dem sogenannten „Response-File“. Es empfiehlt sich, bei jeder Generierung einer hierarchischen Datenstruktur mit HLM eine eigene Kommandodatei anzulegen, die HLM über die Dateiendung „*.rsp“ eindeutig identifiziert. Alternativ zur Vorgehensweise des paarweisen Ausschluß haben wir eine HLM-Arbeitsdatei „miethelw.ssm“ auf der Basis der fallweisen Eliminierung fehlender Angaben erstellt, deren Steuerdatei unter dem Namen „miethelw.rsp“ gespeichert worden ist. Bei den späteren Mehrebenenanalysen haben wir darauf zu achten, dass die SSM-Datei und die zu ihrer Generierung verwendeten SPSS-SAV-Dateien im selben Arbeitsverzeichnis auf dem lokalen PC bzw. dem Netzlaufwerk liegen, wo der „Sufficient-Statistics-Metafile“zuvor erstellt worden ist. Bei der Schätzung der „Verallgemeinerten Hierarchischen Linearen Modelle“ liest WHLM 5 im Rahmen des iterativen Schätzverfahrens mehrfach die ursprünglichen SPSS-Daten. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - Abb. 23: WiSe 2001/2002 69 Vereinbarung des „paarweisen Ausschlusses“ für fehlende Angaben der Level-1Variaben bei der Erstellung der „Sufficient-Statistics-Matrix“ (SSM-Arbeitsdatei) Abb. 24: Speicherung der Befehlsdatei (*.rsp) für den Datenimport und die Generierung der hierarchischen Datenstruktur in der HLMArbeitsdatei „MIETHEPW.SSM“ Wir starten die Erstellung der SSM-Arbeitsdatei durch das Drücken des Schaltknopfes „Make SSM“. Nach der Betätigung des Schaltknopf „Check Stats“, ruft HLM 5 im Notespad-Editor von Windows die Datei „hlm2ssm.sts“ auf, welche deskriptive Statistiken zu den Level-1 und Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 70 Level-2 Variablen enthält. Mit ihrer Hilfe erkennen wir, ob HLM 5 bei der Anforderung der „Pairwise Deletion“ die fehlenden Angaben der Level-1 Variablen korrekt identifiziert hat. Die Anzahl gültiger Fälle schwankt hierbei auf der Level-1-Ebene zwischen 4.713 und 5.302 Befragten. LEVEL-1 DESCRIPTIVE STATISTICS VARIABLE NAME PERCRISK FEARPATT FEARBURG FEARWALK DVICBURG DVICVIOL ALTER AGEGROUP FRAU MANN MINORITY INCOME LIVALONE DANGACT CARRYVAL SAFEPREC EXPGOODS ASSESS GBARRIER CORNER BUSYPLAC INCIVILI INTEGRAT Q100 Q155 N 5180 5190 5221 5302 5291 5301 5296 5296 5302 5302 5236 4713 5230 5302 5180 5302 5302 5302 5302 5295 5302 5302 5302 5206 5291 MEAN 2.10 1.83 2.16 0.40 0.19 0.05 48.58 4.36 0.50 0.50 0.15 3.35 0.26 0.87 6.29 3.85 2.45 1.22 0.45 0.21 3.44 1.32 3.51 1.78 0.53 SD 0.74 1.09 1.15 0.49 0.39 0.21 17.95 1.72 0.50 0.50 0.36 1.42 0.44 0.81 5.23 1.51 1.46 0.61 0.57 0.41 1.91 1.35 1.81 1.97 0.50 MINIMUM 1.00 1.00 1.00 0.00 0.00 0.00 17.00 1.00 0.00 0.00 0.00 1.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 MAXIMUM 4.00 4.00 4.00 1.00 1.00 1.00 97.00 7.00 1.00 1.00 1.00 7.00 1.00 3.00 16.00 9.00 5.00 2.00 2.00 1.00 9.00 5.00 6.00 7.00 1.00 MINIMUM 0.00 0.00 0.00 0.00 1.44 0.82 1.33 2.17 0.00 0.00 11.11 MAXIMUM 0.25 25.00 93.33 3.33 5.30 7.24 5.31 5.50 55.56 35.71 100.00 LEVEL-2 DESCRIPTIVE STATISTICS VARIABLE NAME NETHHET PNETHHET PMINORI MINCIVIL MNINTEGR MBUSYPLA MINCOME MSAFEPRE PVICBURG PVICVIOL PVICTION N 300 300 300 300 300 300 300 300 300 300 300 MEAN 0.09 9.21 15.51 1.33 3.51 3.45 3.36 3.85 18.97 4.85 59.75 SD 0.08 7.95 19.76 0.70 0.79 1.34 0.66 0.67 11.30 7.24 15.47 Wenn wir die „Listwise Deletion“ anfordern und in der SSM-Datei „miethelw.ssm“ abspeichern, erhalten wir die folgende Kennziffern für die univariaten Verteilungen der Level-1 und Level-2-Variablen, wobei die zugehörige SSM-Datei 4391 Befragte in 300 Nachbarschaften umfaßt. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 71 LEVEL-1 DESCRIPTIVE STATISTICS VARIABLE NAME PERCRISK FEARPATT FEARBURG FEARWALK DVICBURG DVICVIOL ALTER AGEGROUP FRAU MANN MINORITY INCOME LIVALONE DANGACT CARRYVAL SAFEPREC EXPGOODS ASSESS GBARRIER CORNER BUSYPLAC INCIVILI INTEGRAT Q100 Q155 N 4391 4391 4391 4391 4391 4391 4391 4391 4391 4391 4391 4391 4391 4391 4391 4391 4391 4391 4391 4391 4391 4391 4391 4391 4391 MEAN 2.11 1.85 2.17 0.40 0.20 0.05 47.27 4.24 0.49 0.51 0.14 3.38 0.25 0.91 6.39 3.82 2.59 1.23 0.46 0.21 3.49 1.37 3.53 1.87 0.51 SD 0.74 1.09 1.13 0.49 0.40 0.21 17.32 1.67 0.50 0.50 0.35 1.42 0.43 0.82 5.20 1.50 1.41 0.61 0.57 0.41 1.91 1.37 1.82 1.98 0.50 MINIMUM 1.00 1.00 1.00 0.00 0.00 0.00 17.00 1.00 0.00 0.00 0.00 1.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 MAXIMUM 4.00 4.00 4.00 1.00 1.00 1.00 97.00 7.00 1.00 1.00 1.00 7.00 1.00 3.00 16.00 9.00 5.00 2.00 2.00 1.00 9.00 5.00 6.00 7.00 1.00 MINIMUM 0.00 0.00 0.00 0.00 1.44 0.82 1.33 2.17 0.00 0.00 11.11 MAXIMUM 0.25 25.00 93.33 3.33 5.30 7.24 5.31 5.50 55.56 35.71 100.00 LEVEL-2 DESCRIPTIVE STATISTICS VARIABLE NAME NETHHET PNETHHET PMINORI MINCIVIL MNINTEGR MBUSYPLA MINCOME MSAFEPRE PVICBURG PVICVIOL PVICTION N 300 300 300 300 300 300 300 300 300 300 300 MEAN 0.09 9.21 15.51 1.33 3.51 3.45 3.36 3.85 18.97 4.85 59.75 SD 0.08 7.95 19.76 0.70 0.79 1.34 0.66 0.67 11.30 7.24 15.47 Nach der Generierung der SSM-Arbeitsdatei ruft HLM 5 direkt den graphischen Editor für die Erstellung der Gleichungen für die Binnen- und Zwischenkontextregressionen auf, wobei HLM die Level-1 und Level-2 Merkmale in getrennten Variablenlisten verwaltet. 7.2 Arbeitsschritt 2: Die Schätzung des Random-Intercept-Only-Logit-Model Mit Hilfe des Random-Intercept-Only-Logit-Model schätzen wir die Obergrenze der Varianzaufklärung bei der Viktimisierung durch Gewaltdelikte, welche durch die Berücksichtigung der Kontextzugehörigkeit maximal erzielbar ist. Hierfür benötigen wir die folgenden Schätzgleichungen, die wir mit HLM 5 graphisch spezifizieren. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 72 Die Schätzgleichungen des Logit&Random&Intercept&Only&Model : Level / Ebene 2: Between&Context&Regression 2 ) Logistic Random Intercept: β 0 j β0j ' γ00 % u0j Level / Ebene 1: Logistic Within&Context Regression 1) ln P ( DVICVIOL ' 1) 1 & P ( DVICVIOL ' 1 ) ' β0j % eij ij Im ersten Arbeitsschritt wählen wir die Kriteriumsvariable aus, indem wir mit dem Pfeil der Computermaus die Variable „DVICVIOL“ auswählen und die linke Maustaste drücken. Sie erscheint dann in roter Schrift, wobei wir sie im zugehörigen Kontextmenü als „Outcome Variable“ definieren. Sie gibt uns an, ob der Befragte innerhalb der letzten zwei Jahre Opfer einer „Gewalttat“ im Sinne eines Raubüberfalls oder einer erlittenen Körperverletzung in der eigenen Nachbarschaft geworden ist. Abb. 25: Auswahl der abhängigen Variablen des 2-Ebenen-Modells im graphischen Editor für die Spezifikation der „Within-“ und „Between-Context-Regression“Gleichungen Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 73 HLM 5 spezifiziert automatisch ein Random-Intercept-Only-Model, um zu ermitteln, in welchem Ausmaß die Kriteriumsvariable vom untersuchten Kontext abhängt.8 Im linearen Modell gibt uns die zugehörige Interklassenkorrelation den Varianzanteil der Kriteriumsvariable an, der maximal durch die Kontextzugehörigkeit des Befragten erklärbar ist. Um das Random-InterceptOnly-Model der logistischen Regression für Individualdaten zu schätzen, müssen wir zunächst zwei weitere Arbeitsschritte absolvieren. Zuerst rufen wir das „Basic Specification“-Menü von HLM auf, um dort die wichtigsten Grundeinstellungen vorzunehmen. Hierzu zählen im Bereich der linearen Mehrebenenmodelle die Obergrenze der Iterationen, das Konvergenzkriterium sowie die Auswahl des Schätzverfahrens. Zusätzlich legen wir fest, wie HLM verfahren soll, wenn die Obergrenze der Iterationen ohne Konvergenz überschritten wird oder die Kovarianzmatrix der Level-2-Residuen fast keine Varianz aufweist. Abb. 26: 8 Automatische Spezifikation des „Random-Intercept-Only-Models“ als Ausgangsmodell für die Mehrebenenanalyse Im Gegensatz zur von Busing et.al.(1994) übernommenen Formelnotation bezeichnen Raudenbush, Bryk, Cheong&Congdon (2001) die Residuen der ersten Ebene mit dem Buchstaben „r“. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - Abb. 27: WiSe 2001/2002 74 Auswahl des Schätzverfahrens, der Iterationsobergrenze und Angabe der Ausgabedatei sowie ihrer Titelzeile Zusätzlich vereinbaren wir neben dem Namen der Ausgabedatei eine Titelzeile zur eindeutigen Beschreibung des spezifizierten Modells. Darüber hinaus bietet uns HLM 5 die Möglichkeit, neben den OLS- und Empirical-Bayes-Residuen der kontextspezifischen Schätzer sie selbst als „fitted values“ sowie eine Auswahl der Kontextvariablen der zweiten Ebene in einer externen Datei zu speichern. HLM 5 fügt die zum Einlesen in SPSS, SYSTAT oder SAS benötigten Steuerbefehle selbsttätig ein. Hierzu drücken wir den Schaltkopf „Create Residual File“. Über die Schaltfläche „Graph Equations“ fordern wir HLM 5 auf, zunächst eine spezielle Datei mit dem Suffix „*.geq“ anzulegen, in der HLM 5 das Ergebnis der Schätzung der „fixed-effects“ speichert. Nach der Schätzung des Mehrebenenmodells rufen wir über die Option „Graph Equations“ des Dateimenüs den eigentlichen Grafikeditor auf, der uns die Auswahl der darzustellenden Effekte exogener Individual- und Kontextmerkmale ermöglicht. Für die Spezifikation des logistischen Regressionsmodells für Individualdaten rufen wir das „Optional-Specifications“-Menü auf und wählen die Option „Setup Nonlinear Model“. Es dient dazu, für die erste Analyseebene das logistisches Regressionsmodell mit einer binären, multinomialen oder ordinalen Kriteriumsvariablen anzufordern. Für unser binäres logistisches Regressionsmodell wählen wir die „Bernoulli“-Option. Bei ordinalen oder multinomialen Logitmodellen haben wir zusätzlich die Anzahl der Antwortkategorien der Kriteriumsvariable anzugeben. Ebenfalls lassen sich dort Poisson- und Negativ-Binomial-Regressionsmodelle für Zählvariablen mit HLM 5 auf der Basis von Individual- und Aggregatdaten schätzen. Letztere erlauben es, die Effekte exogener Merkmale auf die Häufigkeit oder Rate seltener Ereignisse zu bestimmen, wobei das Nichteintretens im Sinne der Nullhäufigkeit einer Linkszensierung entspricht. Bei der Modellierung von Raten ist zusätzlich die Angabe derjenigen Variablen erforderlich, welche die Größe der Risikopopulation („exposure“) für die einzelnen Kontexteinheiten enthält. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - Abb. 28: WiSe 2001/2002 Anforderung der logistischen Regression als nichtlinearen Wahrscheinlichkeitsmodells für die Level-1-Gleichung im „Optional Specifications“-Menü Abb. 29: Auswahl des logistischen Regressionsmodells für binäre Wahlalternativen mit Individualdaten (Bernoulli-Modell) mit der Laplace6-Schätzung 75 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - Abb. 30: WiSe 2001/2002 76 Speichern der Modellspezifikation in der HLMBefehlsdatei „dvicviolriom.hlm“ Abb. 31: HLM 5-Aufforderung das modifizierte RIOM extern zu speichern Nach der Konvergenz des Iterativen Schätzverfahrens rufen wir im Datei-Menü die Option „View Output“ auf, welche das Ausgabeprotokoll im Windows-eigenen Notepad-Editor zur Bearbeitung öffnet: Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - Abb. 32: WiSe 2001/2002 77 Edition der von HLM erstellten Protokolldatei Die Datei „dvicviolriom.out“ enthält das zum logistischen Random-Intercept-Only-Model gehörende Ausgabeprotokoll von HLM 5, die hier zunächst ungekürzt dokumentiert wird. Die Autoren präsentieren zunächst die Kleinste-Quadrate-Lösung der Startschätzung. Hieran schließen sich die mit PQL und Laplace6 geschätzten „fixed“- und „random-effects“ des logistischen Regressionsmodells an, wobei die Autoren zwischen der kontextspezifischen und der Populationsschätzung unterscheiden. Program: Authors: Publisher: HLM 5 Hierarchical Linear and Nonlinear Modeling Stephen Raudenbush, Tony Bryk, & Richard Congdon Scientific Software International, Inc. (c) 2000 [email protected] www.ssicentral.com ------------------------------------------------------------------------------Module: HLM2.EXE (5.04.21205.1) Date: 28 February 2002, Thursday Time: 15: 7:11 ------------------------------------------------------------------------------SPECIFICATIONS FOR THIS NONLINEAR HLM2 RUN Thu Feb 28 15:07:11 2002 ------------------------------------------------------------------------------Problem Title: MIETHE: VIKTIMISIERUNGSRISIKO GEWALTDELIKTE RIOM The data source for this run = D:\MULTILEV\HLM5\MIETHEPW.SSM The command file for this run = D:\multilev\hlm5\dvicviolriom.hlm Output file name = D:\MULTILEV\HLM5\DVICVIOLRIOM.OUT The maximum number of level-2 units = 300 The maximum number of micro iterations = 100 Method of estimation: full PQL Maximum number of macro iterations = 100 Distribution at Level-1: Bernoulli The outcome variable is DVICVIOL Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 78 The model specified for the fixed effects was: ---------------------------------------------------Level-1 Coefficients ---------------------INTRCPT1, B0 Level-2 Predictors --------------INTRCPT2, G00 The model specified for the covariance components was: --------------------------------------------------------Tau dimensions INTRCPT1 Summary of the model specified (in equation format) --------------------------------------------------Level-1 Model Prob(Y=1|B) = P log[P/(1-P)] = B0 Level-2 Model B0 = G00 + U0 Level-1 variance = 1/[P(1-P)] Level-1 OLS regressions ----------------------Level-2 Unit INTRCPT1 -----------------------------------------------------------------------------11 0.00000 12 0.00000 13 0.05263 21 0.00000 22 0.05556 23 0.00000 31 0.05882 32 0.05556 33 0.00000 41 0.00000 The average OLS level-1 coefficient for INTRCPT1 = 0.04850 Least Squares Estimates ----------------------sigma_squared = 0.04527 The outcome variable is DVICVIOL Least-squares estimates of fixed effects ---------------------------------------------------------------------------Standard Fixed Effect Coefficient Error T-ratio d.f. P-value ---------------------------------------------------------------------------For INTRCPT1, B0 INTRCPT2, G00 0.047529 0.002922 16.266 5301 0.000 ---------------------------------------------------------------------------The outcome variable is DVICVIOL Least-squares estimates of fixed effects (with robust standard errors) ---------------------------------------------------------------------------Standard Fixed Effect Coefficient Error T-ratio d.f. P-value ---------------------------------------------------------------------------For INTRCPT1, B0 INTRCPT2, G00 0.047529 0.004067 11.685 5301 0.000 ---------------------------------------------------------------------------- Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 The least-squares likelihood value = 681.914338 Deviance = -1363.82868 Number of estimated parameters = 2 RESULTS FOR LINEAR MODEL WITH THE IDENTITY LINK FUNCTION Sigma_squared = Tau INTRCPT1,B0 0.04528 0.00250 Standard Errors of Tau INTRCPT1,B0 0.00041 Tau (as correlations) INTRCPT1,B0 1.000 ---------------------------------------------------Random level-1 coefficient Reliability estimate ---------------------------------------------------INTRCPT1, B0 0.494 ---------------------------------------------------The value of the likelihood function at iteration 7 = 7.246404E+002 The outcome variable is DVICVIOL Estimation of fixed effects: (linear model with identity link function) ---------------------------------------------------------------------------Standard Approx. Fixed Effect Coefficient Error T-ratio d.f. P-value ---------------------------------------------------------------------------For INTRCPT1, B0 INTRCPT2, G00 0.047972 0.004111 11.668 299 0.000 ---------------------------------------------------------------------------RESULTS FOR NON-LINEAR MODEL WITH THE LOGIT LINK FUNCTION: Unit-Specific Model (macro iteration 9) Tau INTRCPT1,B0 0.69723 Standard Errors of Tau INTRCPT1,B0 0.18184 Tau (as correlations) INTRCPT1,B0 1.000 ---------------------------------------------------Random level-1 coefficient Reliability estimate ---------------------------------------------------INTRCPT1, B0 0.300 ---------------------------------------------------The value of the likelihood function at iteration 2 = -5.544347E+003 The outcome variable is DVICVIOL Final estimation of fixed effects: (Unit-specific model) ---------------------------------------------------------------------------Standard Approx. Fixed Effect Coefficient Error T-ratio d.f. P-value ---------------------------------------------------------------------------For INTRCPT1, B0 INTRCPT2, G00 -3.090842 0.088074 -35.094 299 0.000 ---------------------------------------------------------------------------- 79 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 Final estimation of variance components: ----------------------------------------------------------------------------Random Effect Standard Variance df Chi-square P-value Deviation Component ----------------------------------------------------------------------------INTRCPT1, U0 0.83500 0.69723 299 406.80083 0.000 ----------------------------------------------------------------------------RESULTS FOR LAPLACE-6 ITERATION 9 Tau INTRCPT1,B0 0.94148 Standard Errors of Tau INTRCPT1,B0 0.26969 Tau (as correlations) INTRCPT1,B0 1.000 ---------------------------------------------------Random level-1 coefficient Reliability estimate ---------------------------------------------------INTRCPT1, B0 0.363 ---------------------------------------------------The likelihood at Laplace iteration 10 is -4.859557E+003 The outcome variable is DVICVIOL Final estimation of fixed effects (Laplace) ---------------------------------------------------------------------------Standard Approx. Fixed Effect Coefficient Error T-ratio d.f. P-value ---------------------------------------------------------------------------For INTRCPT1, B0 INTRCPT2, G00 -3.381974 0.130082 -25.999 299 0.000 ---------------------------------------------------------------------------Statistics for current covariance components model -------------------------------------------------Deviance = 9719.113140 Number of estimated parameters = 2 RESULTS FOR NON-LINEAR MODEL WITH THE LOGIT LINK FUNCTION: Population Average Model The value of the likelihood function at iteration 3 = -6.115471E+003 The outcome variable is DVICVIOL Final estimation of fixed effects: (Population-average model) ---------------------------------------------------------------------------Standard Approx. Fixed Effect Coefficient Error T-ratio d.f. P-value ---------------------------------------------------------------------------For INTRCPT1, B0 INTRCPT2, G00 -2.979408 0.089126 -33.429 299 0.000 ---------------------------------------------------------------------------The outcome variable is DVICVIOL Final estimation of fixed effects (Population-average model with robust standard errors) ---------------------------------------------------------------------------Standard Approx. Fixed Effect Coefficient Error T-ratio d.f. P-value ---------------------------------------------------------------------------For INTRCPT1, B0 INTRCPT2, G00 -2.979408 0.087965 -33.870 299 0.000 ---------------------------------------------------------------------------- 80 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 81 HLM 5 protokolliert das auf dem Bildschirm spezifizierte Random-Intercept-Only-Models für die Schätzung des Viktimisierungsrisikos durch Gewaltdelikte in der Befehlsdatei „dvicviolriom.hlm“, die wir über das File-Menü mit dem Eintrag „Manually edit command file“ aufrufen. Abb. 33: HLM 5 Befehlsdatei für die Schätzung des Random-Intercept-Only-Logit-Modell mit PQL und Laplace 6 Für die Schätzung des „reinen Nullmodells“ entfernen wir den zur logistischen Regressionskonstanten gehörenden „Fehlerterm“ der zweiten Ebene, indem wir das Kästchen für den „Error term for currently selected level-2 equation“ anklicken. Hierdurch nehmen wir die zur logistischen Regressionskonstanten gehörende Varianzkomponente aus der Gleichung heraus. HLM 5 schätzt zwar mit PQL das reine Nullmodell im Sinne des kontextübergreifenden durchschnittlichen Risikos der Viktimisierung, aber das Programm gibt für das binäre Logitmodell nicht die zugehörige Devianz an. Daher können wir keinen globalen Likelihood-Ratio-χ2-Test durchführen, der simultan die „fixed“ und „random-effects“ auf ihre statistische Signifikanz hin prüft. Für die Berechnung des Intra-Class-Correlation-Koeffizienten verwenden wir die mit Laplace6 geschätzte Varianzkomponente der kontextspezifischen logistischen Regressionskonstanten „Tau INTRCPT1, B0". Dieses Verfahren unterschätzt im Gegensatz zur PQL-Methode die Varianz der kontextspezifischen Logitkoeffizienten nicht, wie Raudenbush&Yang (1998) eindeutig gezeigt haben. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 82 Berechnung der Intra&Class&Correlaton ρI : ρI ' τ20 τ 2 % π / 3 2 0 ' 0,94148 ' 0,2225 . 22,25 % 0,94148 % 3,29 Die Kontextzugehörigkeit der Befragten erklärt maximal 22,25% der Variation der Viktimisierungslogits. Daher ist es erforderlich, ein Mehrebenenmodell mit exogenen Individal- und Kontextvariablen zu schätzen. Im Vergleich zur explorativen logistischen Regression in Abschnitt 6.1 (Tabelle 6) fällt die Varianzaufklärung etwas niedriger als das ∆-Aldrich&NelsonPseudo-R2 mit Veall&Zimmermann-Korrektur aus. Dies ist darauf zurückzuführen, dass wir im explorativen Modell bereits die exogenen Individualmerkmale auspartialisiert haben, während wir im Logit-RIOM ausschließlich den Effekt der Kontextzugehörigkeit ermitteln. 7.3 Arbeitsschritt 3: Schätzung Random-Intercept-Logit-Model mit exogenen Individualmerkmalen Wir entwickeln zunächst ein logistisches Regressionsmodell mit ausgewählten Level-1-Prädiktoren , sprich Personenmerkmalen, für die Vorhersage der Viktimisierung durch Gewaltdelikte innerhalb der eigenen Nachbarschaft. Hierzu benötigen wir die folgenden Schätzgleichungen: Die Schätzgleichungen des Logit&Random&Intercept&Model : M.1 Level / Ebene 2: Between&Context&Regression 2 a) Logistic Random Intercept: β 0 j β0j ' γ00 % u0j Fixed Logistic Slopes: 2 b) 2 c) 2 d) 2 e) 2 f) 2 g) β1j β2j β3j β4j β5j β6j ' ' ' ' ' ' γ10 γ20 γ30 γ40 γ50 γ60 Level / Ebene 1: Logistic Within&Context Regression 1) ln P ( DVICVIOL ' 1) 1 & P ( DVICVIOL ' 1 ) ' β 0 j % β 1 j ( ( ALTERì j& ALTER.. ) % β 2 j ( FRAU i j ij % β 3 j ( MINORITY i j % β 4 j ( ( INCOME i j& INCOME.. ) % β 5 j ( LIVALONE i j % β 6 j ( ( DANGACT i j& DANGACT.. ) % e i j Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 83 HLM 5 geht per Voreinstellung davon aus, dass alle logistischen Steigungskoeffizienten der Within-Context-Regression über die Kontexte hinweg variieren dürfen. Im unserem ersten Alternativmodell M1 verwenden wir zur Vorhersage des Viktimisierungsrisikos durch Gewaltdelikte das Alter (ALTER), Geschlecht (FRAU), den ethnischen Status (MINORITY), die Einkommensklasse (INCOME), den Single-Indikator (LIVALONE) sowie die Anzahl risikoträchtiger Freizeitaktivitäten des Befragten (DANGACT). Um die logistischen Regressionskonstanten aus inhaltlicher Sicht zu festzulegen, zentrieren wir wie bei der explorativen Analyse das Lebensalter, die Einkommensklasse sowie die risikoträchtigen Freizeitaktivitäten an ihrem jeweiligen Gesamtmittelwert. Die kontextspezifische Regressionskonstante schätzt nunmehr das Logit der Opferwahrscheinlichkeit für die Referenzgruppe der verheirateten weißen Männer im Durchschnittsalter, die über ein mittleres Einkommen verfügen und sich im durchschnittlichem Maße Risiken außerhalb ihres Hauses aussetzen. Bei der Auswahl der einzelnen exogenen Indvidualmerkmale entscheiden wir, ob wir sie unzentriert, group-mean- oder grand-meanzentriert in die Level-1-Gleichung aufnehmen. Am Gruppen-/Kontextmittelwert zentrierte Individualmerkmale stellt HLM fett dar, während es am Gesamtmittelwert zentrierte Merkmale zusätzlich kursiv unterlegt. Die nicht-zentrierten exogenen Merkmale erhalten keine zusätzlichen Textattribute. Die zu den exogenen Variablen gehörenden „random-effects“ entfernen wir, indem wir jeweils mit Hilfe des Schaltkästchen „Error term for currently selected level-2 equation“ den jeweiligen „uk“-Term entfernen. Über die „Save as“-Option des Datei-Menüs speichern wir die zugehörige Kommandodatei unter dem Dateinamen „dvicviom1.hlm“ extern ab. Abb. 34: Graphische Spezifikation des Alternativmodells 1 mit „random-intercept“ Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 84 HLM 5 merkt sich die Spezifikation des logistischen Regressionsmodells für unsere erste Ebene. Nach dem Programmaufruf über den Menüpunkt „Run Analysis“, fordert uns HLM 5 auf, das geänderte Mehrebenenmodell von dem eigentlichen Start in einer Befehlsdatei zu speichern. Wir erhalten das folgende um die OLS-Schätzung und die Populationsschätzung gekürzte Ausgabeprotokoll für das erste Alternativmodell, das mit Modellspezifikation in der Gleichungsform beginnt. Mit der Schätzung des „Population-average model“ beschäftigen wir uns ausführlich nach der Diskussion des Alternativmodells M.4. Summary of the model specified (in equation format) --------------------------------------------------Level-1 Model Prob(Y=1|B) = P log[P/(1-P)] = B0 + B1*(ALTER) + B2*(FRAU) + B3*(MINORITY) + B4*(INCOME) + B5*(LIVALONE) + B6*(DANGACT) Level-2 B0 = B1 = B2 = B3 = B4 = B5 = B6 = Model G00 + U0 G10 G20 G30 G40 G50 G60 Level-1 variance = 1/[P(1-P)] RESULTS FOR NON-LINEAR MODEL WITH THE LOGIT LINK FUNCTION: Unit-Specific Model (macro iteration 9) Tau INTRCPT1,B0 0.49759 Standard Errors of Tau INTRCPT1,B0 0.16334 Tau (as correlations) INTRCPT1,B0 1.000 ---------------------------------------------------Random level-1 coefficient Reliability estimate ---------------------------------------------------INTRCPT1, B0 0.235 ---------------------------------------------------The value of the likelihood function at iteration 2 = -5.658150E+003 The outcome variable is DVICVIOL Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 Final estimation of fixed effects: (Unit-specific model) ---------------------------------------------------------------------------Standard Approx. Fixed Effect Coefficient Error T-ratio d.f. P-value ---------------------------------------------------------------------------For INTRCPT1, B0 INTRCPT2, G00 -3.287995 0.132424 -24.829 299 0.000 For ALTER slope, B1 INTRCPT2, G10 -0.007222 0.004551 -1.587 4384 0.112 For FRAU slope, B2 INTRCPT2, G20 0.024606 0.147030 0.167 4384 0.867 For MINORITY slope, B3 INTRCPT2, G30 -0.028085 0.207135 -0.136 4384 0.893 For INCOME slope, B4 INTRCPT2, G40 -0.140200 0.058068 -2.414 4384 0.016 For LIVALONE slope, B5 INTRCPT2, G50 0.453327 0.161461 2.808 4384 0.005 For DANGACT slope, B6 INTRCPT2, G60 0.279542 0.090779 3.079 4384 0.003 ---------------------------------------------------------------------------Final estimation of variance components: ----------------------------------------------------------------------------Random Effect Standard Variance df Chi-square P-value Deviation Component ----------------------------------------------------------------------------INTRCPT1, U0 0.70540 0.49759 299 347.36580 0.028 ----------------------------------------------------------------------------RESULTS FOR LAPLACE-6 ITERATION 17 Tau INTRCPT1,B0 0.64469 Standard Errors of Tau INTRCPT1,B0 0.20952 Tau (as correlations) INTRCPT1,B0 1.000 ---------------------------------------------------Random level-1 coefficient Reliability estimate ---------------------------------------------------INTRCPT1, B0 0.282 ---------------------------------------------------The likelihood at Laplace iteration 18 is -4.843457E+003 The outcome variable is DVICVIOL Final estimation of fixed effects (Laplace) ---------------------------------------------------------------------------Standard Approx. Fixed Effect Coefficient Error T-ratio d.f. P-value ---------------------------------------------------------------------------For INTRCPT1, B0 INTRCPT2, G00 -3.507118 0.163042 -21.511 299 0.000 For ALTER slope, B1 INTRCPT2, G10 -0.007577 0.004686 -1.617 4384 0.106 For FRAU slope, B2 INTRCPT2, G20 0.025334 0.159463 0.159 4384 0.874 For MINORITY slope, B3 INTRCPT2, G30 -0.046630 0.207379 -0.225 4384 0.822 For INCOME slope, B4 INTRCPT2, G40 -0.140606 0.050116 -2.806 4384 0.005 For LIVALONE slope, B5 INTRCPT2, G50 0.456312 0.176947 2.579 4384 0.010 For DANGACT slope, B6 INTRCPT2, G60 0.285527 0.094558 3.020 4384 0.003 ---------------------------------------------------------------------------- 85 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 86 Statistics for current covariance components model -------------------------------------------------Deviance = 9686.914928 Number of estimated parameters = 8 Um zu überprüfen, ob die Einbeziehung der exogenen Individualmerkmale zu einer statistisch bedeutsamen Verbesserung der Vorhersage des Opferrisiko führt, berechnen wir einen partiellen Likelihood-Ration-χ2 auf der Basis der Devianzen des RIOM und 1.Alternativmodells, wobei wir von den Ergebnissen der Laplace6-Approximation ausgehen. Partieller L.R.χ2&Test ' DevianceRIOM & DevianceM.1 ' 9.719,11 & 9.686,91 ' 32,20 Anzahl der Freiheitsgrade ' ParameterzahlM.1 & ParameterzahlRIOM ' 8 & 2 ' 6 Kritischer χ2&Wert (F.G.' 6 ; α ' 0,05 ) ' 12,59 Da L.R.χ2 $ χ2kritisch ist; muß H0 verworfen werden ! Die Einbeziehung der exogenen Individualmerkmale führt zu einer signifikanten Verbesserung der Vorhersage des Risikos, Opfer einer Gewalttat in der eigenen Nachschaft zu werden, da wir die Nullhypothese des partiellen Likelihood-Ratio-χ2-Tests mit einer Irrtumswahrscheinlichkeit von weniger als 5 % verwerfen. Um die Verbesserung des Modellfits im Sinne der praktischen Signifikanz zu bestimmen, berechnen wir das PRE-R2 auf der Basis der vorliegenden Devianzen des RIOM und Alternativmodells 1. Berechnung des Proportional&Reduction&of&Error&R 2 auf der Basis der Devianzen von RIOM und M.1: PRE&R 2 ' DevianceRIOM & DevianceM.1 DevianceRIOM ' 9.719,11 & 9.686,91 ' 0,0033 9.719,11 Im Vergleich zum Random-Intercept-Only-Model erzielen wir lediglich eine Reduktion der Devianz um 0,33 %, die somit eher bescheiden ausfällt. Da HLM 5 die Log-Likelihood des reinen Nullmodell mit der logistischen Regressionskonstanten als „fixed effect“ nicht schätzt, fällt uns die Grundlage, um die Gesamtanpassung mit Hilfe des Aldrich&Nelson Pseudo-R2 und seiner von Veall&Zimmermann (1992,1994) vorgeschlagenen Korrektur zu bestimmen. Formal gesehen berücksichtigt unser Random-Intercept-Logit-Modell M.1 in hinreichendem Maß bei der Schätzung der fixed-effects die Klumpenbildung der Substichproben auf der Nachbarschaftsebene. Seine Varianzkomponente σ2u0j ermittelt hierbei die Varianz des Viktimisierungslogits der Referenzgruppe über die 300 Nachbarschaften hinweg. Seine Varianz hat einen Wert von 0,64 und erweist sich, gemessen am geschätzten Standardfehler von 0,21 gemäß der Daumenregel für T-Werte, als statistisch signifikant, da dieser Varianzschätzer rd. dreimal Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 87 so groß ist wie sein eigener Standardfehler. Im Vergleich zum gepoolten logistischen WithinContext-Regressionsmodell der explorativen Analyse zeichnen sich sowohl Gemeinsamkeiten als auch Unterschiede ab. Alle im explorativen Modell signifikanten Effekte der exogenen Individualmerkmale erweisen sich auch im Logit-Random-Intercept-Modell als statistisch signifikant, wobei ihre Vorzeichen der Effektrichtung ebenfalls übereinstimmen. Hingegen fallen ihre Effektstärken im Logit-Random-Intercept-Modell deutlich geringer als im explorativen Logitmodell aus. Der Einfluß der Einkommensklasse sinkt gemessen an seinem Logitschätzer von -0,187 auf -0,141. Der risikoträchtige Effekt des Singledaseins verringert sich von +0,577 auf +0,456. Gleichermaßen sinkt der Einfluß der außerhäuslichen Aktivitäten von +0,319 auf +0,286. Ebenfalls verringt sich das durch die logistische Regressionskonstante geschätzte Logit des Opferrisikos der Referenzgruppe von -3,295 auf -3,507. In beiden Modellen unterscheiden sich die Logitschätzer des Geschlechtseffekts nur nach der zweiten Kommastelle. Hingegen wechselt der Logitschätzer für den Effekt des Minderheitenstatus sein Vorzeichen (+0,115 vs. -0,025), ohne aber die Signifikanzschwelle zu erreichen. 7.4 Arbeitsschritt 4: Schätzung des Random-Logit-Intercept-Random-LogitSlope-Model Beim zweiten Alternativmodell (M2) schätzen wir zusätzlich die Varianzkomponente des kontextabhängigen Effektes der „Rassenzugehörigkeit“. Sowohl die logistischen Regressionskonstante als auch der Effekt der „Rassenzugehörigkeit“ dürfen daher im Alternativmodell 2 über die Kontexte hinweg variieren. Die Schätzgleichungen des Logit&Random&Intercept&Random&Slope&Model : M.2 Level / Ebene 2: Between&Context&Regression Logistic Random Intercept: β 0 j 2 a) β 0 j ' γ 0 0 % u 0 j Fixed Logistic Slopes: 2 b) β 1 j ' γ 1 0 2 c) β 2 j ' γ 2 0 Random Logistic Slope: β 3 j 2 d) β 3 j ' γ 3 0 % u 3 j Fixed Logistic Slopes: 2 e) β 4 j ' γ 4 0 2 f) β 5 j ' γ 5 0 2 g) β 6 j ' γ 6 0 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 88 Level / Ebene 1: Logistic Within&Context Regression 1) ln P ( DVICVIOL ' 1) 1 & P ( DVICVIOL ' 1 ) ' β 0 j % β 1 j ( ( ALTERì j& ALTER.. ) % β 2 j ( FRAU i j ij % β 3 j ( MINORITY i j % β 4 j ( ( INCOME i j& INCOME.. ) % β 5 j ( LIVALONE i j % β 6 j ( ( DANGACT i j& DANGACT.. ) % e i j Um in HLM 5 die Varianzkomponente des Minderheiteneffekts zu schätzen, klicken wir das vor β3 stehende Kästchen mit der linken Maustaste an, woraufhin HLM den Term u3 in die zugehörige Gleichung einfügt. Seine Varianz erklären wir später mit Hilfe der bereits genannten Kontextmerkmale der Nachbarschaften. Abb. 35: Graphische Spezifikation des Alternativmodells 2 als „random-intercept / randomslope“ Logitmodell Wir erhalten das folgende ebenfalls um die OLS-Startschätzung und die Populationsschätzung gekürzte Ausgabeprotokoll, das mit den zu schätzenden Gleichungen der Binnen- und Zwischen-Kontext-Regressionen beginnt: Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 Summary of the model specified (in equation format) --------------------------------------------------Level-1 Model Prob(Y=1|B) = P log[P/(1-P)] = B0 + B1*(ALTER) + B2*(FRAU) + B3*(MINORITY) + B4*(INCOME) + B5*(LIVALONE) + B6*(DANGACT) Level-2 B0 = B1 = B2 = B3 = B4 = B5 = B6 = Model G00 + U0 G10 G20 G30 + U3 G40 G50 G60 Level-1 variance = 1/[P(1-P)] RESULTS FOR NON-LINEAR MODEL WITH THE LOGIT LINK FUNCTION: Unit-Specific Model (macro iteration 304) Tau INTRCPT1,B0 MINORITY,B3 0.61762 -0.43430 -0.43430 0.63817 Standard Errors of Tau INTRCPT1,B0 0.19618 MINORITY,B3 0.36002 0.36002 0.81362 Tau (as correlations) INTRCPT1,B0 1.000 -0.692 MINORITY,B3 -0.692 1.000 ---------------------------------------------------Random level-1 coefficient Reliability estimate ---------------------------------------------------INTRCPT1, B0 0.236 MINORITY, B3 0.053 ---------------------------------------------------Note: The reliability estimates reported above are based on only 212 of 300 units that had sufficient data for computation. Fixed effects and variance components are based on all the data. The value of the likelihood function at iteration 2 = -5.579065E+003 The outcome variable is DVICVIOL Final estimation of fixed effects: (Unit-specific model) ---------------------------------------------------------------------------Standard Approx. Fixed Effect Coefficient Error T-ratio d.f. P-value ---------------------------------------------------------------------------For INTRCPT1, B0 INTRCPT2, G00 -3.304502 0.134729 -24.527 299 0.000 For ALTER slope, B1 INTRCPT2, G10 -0.007119 0.004562 -1.560 4384 0.118 For FRAU slope, B2 INTRCPT2, G20 0.032845 0.147349 0.223 4384 0.824 For MINORITY slope, B3 INTRCPT2, G30 0.105929 0.210828 0.502 299 0.615 For INCOME slope, B4 INTRCPT2, G40 -0.138964 0.058142 -2.390 4384 0.017 For LIVALONE slope, B5 INTRCPT2, G50 0.449720 0.161965 2.777 4384 0.006 For DANGACT slope, B6 INTRCPT2, G60 0.275432 0.091057 3.025 4384 0.003 ---------------------------------------------------------------------------- 89 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 Final estimation of variance components: ----------------------------------------------------------------------------Random Effect Standard Variance df Chi-square P-value Deviation Component ----------------------------------------------------------------------------INTRCPT1, U0 0.78589 0.61762 211 293.20839 0.000 MINORITY slope, U3 0.79886 0.63817 211 226.05524 0.227 ----------------------------------------------------------------------------Note: The chi-square statistics reported above are based on only 212 of 300 units that had sufficient data for computation. Fixed effects and variance components are based on all the data. RESULTS FOR LAPLACE-6 ITERATION 66 Tau INTRCPT1,B0 MINORITY,B3 0.84159 -0.59384 -0.59384 0.98301 Standard Errors of Tau INTRCPT1,B0 0.27830 MINORITY,B3 0.39799 0.39799 1.08501 Tau (as correlations) INTRCPT1,B0 1.000 -0.653 MINORITY,B3 -0.653 1.000 ---------------------------------------------------Random level-1 coefficient Reliability estimate ---------------------------------------------------INTRCPT1, B0 0.293 MINORITY, B3 0.078 ---------------------------------------------------Note: The reliability estimates reported above are based on only 212 of 300 units that had sufficient data for computation. Fixed effects and variance components are based on all the data. The likelihood at Laplace iteration 67 is -4.841572E+003 The outcome variable is DVICVIOL Final estimation of fixed effects (Laplace) ---------------------------------------------------------------------------Standard Approx. Fixed Effect Coefficient Error T-ratio d.f. P-value ---------------------------------------------------------------------------For INTRCPT1, B0 INTRCPT2, G00 -3.583221 0.176167 -20.340 299 0.000 For ALTER slope, B1 INTRCPT2, G10 -0.007510 0.004825 -1.556 4384 0.119 For FRAU slope, B2 INTRCPT2, G20 0.036200 0.163523 0.221 4384 0.825 For MINORITY slope, B3 INTRCPT2, G30 0.130763 0.416451 0.314 299 0.753 For INCOME slope, B4 INTRCPT2, G40 -0.138806 0.051456 -2.698 4384 0.007 For LIVALONE slope, B5 INTRCPT2, G50 0.454781 0.178727 2.545 4384 0.011 For DANGACT slope, B6 INTRCPT2, G60 0.281963 0.099641 2.830 4384 0.005 ---------------------------------------------------------------------------- 90 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 91 Statistics for current covariance components model -------------------------------------------------Deviance = 9683.143038 Number of estimated parameters = 10 Der Effekt der Minderheitenzugehörigkeit auf das Viktimisierungsrisiko hat nach der Laplace6Approximation eine kontextübergreifende Varianz von 0,983, die sich gemessen an ihrem geschätzten Standardfehler von 1,085 als nicht signifikant erweist. Da die Variation der kontextabhängigen Logitschätzer im Vergleich zu den linearen Schätzer der klassischen Mehrebenenanalyse immer deutlich niedriger ausfällt, sollten wir uns davor hüten, diesen „random-effect“ vorschnell aus der weiteren Modellbildung zu eliminieren. 7.5Arbeitsschritt 5: Schätzung der Coefficient-as-Outcome-Logit-Models Im Alternativmodell 3 erklären wir die Variation der kontextspezifischen Logitkonstanten und der logistischen Steigung des Minoritäteneffekts durch die beiden Kontextmerkmale des „Minoritätenanteils in Prozent“ (PMINORI) und der „sozialen Integration“ der Nachbarschaft (MNINTGR), die ebenfalls das Ausmaß der „informellen sozialen Kontrolle“ erfasst. Ihm liegt das folgende Gleichungssystem zugrunde. ie Schätzgleichungen des Alternativmodells 3 : M.3 evel / Ebene 2: Between&Context&Regression a) Logistic Intercept&as&Outcome: β 0 j β 0 j ' γ 0 0 % γ 0 1 ( ( PMINORI. j& PMINORI.. ) % γ 0 2 ( ( MNINTEGR. j& MNINTEGR.. ) % u 0 j Fixed Logistic Slopes: b) β 1 j ' γ 1 0 c) β 2 j ' γ 2 0 Logistic Slope&as&Outcome: β 3 j d) β 3 j ' γ 3 0 % γ 3 1 ( ( PMINORI. j& PMINORI.. ) % γ 3 2 ( ( MNINTEGR. j& MNINTEGR.. ) % u 3 j Fixed&Logistic Slopes: e) β 4 j ' γ40 f) β 5 j ' γ50 g) β 6 j ' γ60 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 92 Level / Ebene 1: Logistic Within&Context Regression 1) ln P ( DVICVIOL ' 1) 1 & P ( DVICVIOL ' 1 ) ' β 0 j % β 1 j ( ( ALTERì j& ALTER.. ) % β 2 j ( FRAU i j ij % β 3 j ( MINORITY i j % β 4 j ( ( INCOME i j& INCOME.. ) % β 5 j ( LIVALONE i j % β 6 j ( ( DANGACT i j& DANGACT.. ) % e i j Um dieses „Logit-Coefficient-as-Outcome-Model“ in HLM 5 zu spezifizieren, klicken wir auf das Auswahlmenü der „LEVEL-2 VARS“ und wählen mit der linken Maustaste das entsprechende Kontextmerkmal aus. HLM 5 bietet uns nun an, es in die ausgewählte Level-2 Gleichung einzufügen, wobei wir die Entscheidung zwischen seiner Grand-Mean-Zentrierung und keiner Zentrierung zu treffen haben. Mit Hilfe dieser beiden Optionen bestimmen wir inhaltlich die Zusammensetzung des Referenzkontextes. Da wir innerhalb der Kontexteinheiten die Abweichung des Viktimisierungsrisikos „farbiger“ Befragter von ihren weißen Nachbarn schätzen, besteht die Gefahr, dass wir ein reines Artefakt schätzen, wenn wir den Minderheitenanteil unzentriert als Prädiktor verwenden. In diesem Fall würden wir die Differenz der Viktimisierungslogits für Farbige und Weiße schätzen, ohne dass in dieser Nachbarschaft ein Angehöriger ethnischer Minoritäten wohnt. Daher zentrieren wir den Minoritätenanteil an seinem eigenen GrandMean der 300 untersuchten Nachbarschaften. Da eine völlig sozial desintegrierte Nachbarschaft ebenfalls nicht zu erwarten ist, zentrieren wir die „soziale Integration“ ebenfalls an ihrem Gesamtmittelwert. Die Nichtzentrierung von Level2-Prädiktoren empfiehlt sich nur bei Dummyvariablen als Kontextmerkmalen, da diese unmittelbar den Niveauunterschied der logistischen Within-Regressionskonstanten zwischen dem Kontext mit vorliegendem Merkmal und einem Vergleichskontext ohne dieses Merkmal erfassen. Bei den kontextabhängigen logistischen Steigungskoeffizienten („random-effects“) misst der zur „Cross-Level-Interaction“ gehörende γ-Koeffizient unmittelbar den durchschnittlichen Niveauunterschied des zugehörigen Logiteffekts der Dummyvariablen zwischen Kontexten mit und ohne dieses nominale Level-2-Merkmal. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - Abb. 36: WiSe 2001/2002 93 Auswahl der zur Erklärung der kontextspezifischen Effekte benötigten Level-2Merkmale für das Alternativmodell 3 Im interaktiven Gleichungseditor von HLM erhalten wir dann das folgende Gleichungssystem mit den zu schätzenden „fixed-“ und „random-effects“: Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - Abb. 37: WiSe 2001/2002 94 Spezifikation des Logit-Coefficient-as-Outcome-Model Unser Vergleichs- oder Referenzkontext besteht aus Nachbarschaften mit einem durchschnittlichem Minderheitenanteil und einem mittleren Ausmaß an „sozialer Integration“ bzw. „informeller sozialer Kontrolle“. Die zur „Between-ContextRegression“ gehörende Logitkonstante γ00 erfasst den Erwartungswert des Logits der Referenzgruppe im dargestellten Referenzkontext. Die Level-2-Logitkonstante γ30 schätzt unmittelbar die Abweichung des Viktimsierungslogits der „Farbigen“ in diesem Referenzkontext. Die logistischen Steigungskoeffizienten der 2.Ebene schätzen die Effekte der Kontextmerkmale auf das jeweilige Viktimisierungslogit als Abweichung vom beschriebenen Referenzkontext. Bei ihnen handelt es sich um die zu schätzenden „Cross-Level-Interactions“ - die eigentlichen „Wechselwirkungseffekte zwischen den Analyse-ebenen“. Sie geben uns Aufschluss darüber, wie stark das betrachtete Kontextmerkmal jeweils den Effekt des exogenen Individualmerkmals innerhalb der Level-2-Einheiten moderiert. Wir erhalten das folgende Ausgabprotokoll für die PQL und Laplace6-Schätzungen des Logit-Mehrebenenmodells: Summary of the model specified (in equation format) --------------------------------------------------Level-1 Model Prob(Y=1|B) = P Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 95 log[P/(1-P)] = B0 + B1*(ALTER) + B2*(FRAU) + B3*(MINORITY) + B4*(INCOME) + B5*(LIVALONE) + B6*(DANGACT) Level-2 Model B0 B1 B2 B3 B4 B5 B6 = = = = = = = G00 + G01*(PMINORI) + G02*(MNINTEGR) + U0 G10 G20 G30 + G31*(PMINORI) + G32*(MNINTEGR) + U3 G40 G50 G60 Level-1 variance = 1/[P(1-P)] RESULTS FOR NON-LINEAR MODEL WITH THE LOGIT LINK FUNCTION: Unit-Specific Model (macro iteration 62) Tau INTRCPT1,B0 MINORITY,B3 0.51311 -0.25883 -0.25883 0.46174 Standard Errors of Tau INTRCPT1,B0 0.18642 MINORITY,B3 0.31394 0.31394 0.75423 Tau (as correlations) INTRCPT1,B0 1.000 MINORITY,B3 -0.532 -0.532 1.000 ¶ ¶ ¶ Kovarianzmatrix der Level-2-Residuen u0j und u3j Geschätzte Standardfehler der Level-2 -Residuen Geschätzte Korrelation zwischen den Level-2-Residuen der kontextabhängigen logistische Regressionskonstanten und Steigungskoeffizienten ---------------------------------------------------Random level-1 coefficient Reliability estimate ---------------------------------------------------INTRCPT1, B0 0.217 MINORITY, B3 0.046 ---------------------------------------------------Note: The reliability estimates reported above are based on only 212 of 300 units that had sufficient data for computation. Fixed effects and variance components are based on all the data. The value of the likelihood function at iteration 2 = -5.613274E+003 The outcome variable is DVICVIOL Final estimation of fixed effects: (Unit-specific model) ---------------------------------------------------------------------------Standard Approx. Fixed Effect Coefficient Error T-ratio d.f. P-value ---------------------------------------------------------------------------For INTRCPT1, B0 INTRCPT2, G00 -3.270516 0.135141 -24.201 297 0.000 PMINORI, G01 0.023051 0.004729 4.875 297 0.000 MNINTEGR, G02 -0.335083 0.119264 -2.810 297 0.005 For ALTER slope, B1 INTRCPT2, G10 -0.003387 0.004707 -0.720 4380 0.472 For FRAU slope, B2 INTRCPT2, G20 0.048725 0.148400 0.328 4380 0.742 For MINORITY slope, B3 INTRCPT2, G30 0.256896 0.264264 0.972 297 0.331 PMINORI, G31 -0.030507 0.008895 -3.429 297 0.001 MNINTEGR, G32 0.076769 0.256825 0.299 297 0.765 For INCOME slope, B4 INTRCPT2, G40 -0.092250 0.059491 -1.551 4380 0.121 For LIVALONE slope, B5 INTRCPT2, G50 0.352054 0.166611 2.113 4380 0.034 For DANGACT slope, B6 INTRCPT2, G60 0.245427 0.091979 2.668 4380 0.008 ---------------------------------------------------------------------------- Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 ¶ 96 Final estimation of variance components: Varianzkomponenten der Level-2-Residuen ----------------------------------------------------------------------------Random Effect Standard Variance df Chi-square P-value Deviation Component ----------------------------------------------------------------------------INTRCPT1, U0 0.71632 0.51311 209 253.50899 0.019 MINORITY slope, U3 0.67951 0.46174 209 168.25300 >.500 ----------------------------------------------------------------------------Note: The chi-square statistics reported above are based on only 212 of 300 units that had sufficient data for computation. Fixed effects and variance components are based on all the data. RESULTS FOR LAPLACE-6 ITERATION 79 Tau INTRCPT1,B0 MINORITY,B3 0.67027 -0.33890 -0.33890 0.72828 Standard Errors of Tau INTRCPT1,B0 0.25121 MINORITY,B3 0.41222 0.41222 1.02497 Tau (as correlations) INTRCPT1,B0 1.000 MINORITY,B3 -0.485 -0.485 1.000 ---------------------------------------------------Random level-1 coefficient Reliability estimate ---------------------------------------------------INTRCPT1, B0 0.264 MINORITY, B3 0.069 ---------------------------------------------------Note: The reliability estimates reported above are based on only 212 of 300 units that had sufficient data for computation. Fixed effects and variance components are based on all the data. The likelihood at Laplace iteration 79 is -4.825420E+003 The outcome variable is DVICVIOL Final estimation of fixed effects (Laplace) ---------------------------------------------------------------------------Standard Approx. Fixed Effect Coefficient Error T-ratio d.f. P-value ---------------------------------------------------------------------------For INTRCPT1, B0 INTRCPT2, G00 -3.507357 0.178091 -19.694 297 0.000 PMINORI, G01 0.024293 0.005604 4.335 297 0.000 MNINTEGR, G02 -0.368766 0.139684 -2.640 297 0.009 For ALTER slope, B1 INTRCPT2, G10 -0.003668 0.004991 -0.735 4380 0.462 For FRAU slope, B2 INTRCPT2, G20 0.051224 0.168590 0.304 4380 0.761 For MINORITY slope, B3 INTRCPT2, G30 0.212570 0.460109 0.462 297 0.644 PMINORI, G31 -0.031763 0.009341 -3.400 297 0.001 MNINTEGR, G32 0.072430 0.299067 0.242 297 0.809 For INCOME slope, B4 INTRCPT2, G40 -0.091657 0.053443 -1.715 4380 0.086 For LIVALONE slope, B5 INTRCPT2, G50 0.355781 0.186651 1.906 4380 0.056 For DANGACT slope, B6 INTRCPT2, G60 0.251391 0.100592 2.499 4380 0.013 ---------------------------------------------------------------------------- Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 97 Statistics for current covariance components model -------------------------------------------------Deviance = 9650.839697 Number of estimated parameters = 14 Bevor wir uns der inhaltlichen Interpretation geschätzten γ-Koeffizienten zuwenden, betrachten wir zunächst die Anpassung unseres logistischen „Coefficient-as-Outcome-Model“ im Sinne statistischer und praktischer Signifikanz. Hierzu berechnen wir den zugehörigen partiellen Likelihood-Ratio-χ2-Test und das partielle PRE-R2 im Vergleich zum in Abschnitt 7.3 geschätzten „Random-Intercept-Only“-Logitmodell. Partieller L.R.χ2&Test ' DevianceRIOM & DevianceM.3 ' 9.719,11 & 9.650,84 ' 68,27 Anzahl der Freiheitsgrade ' ParameterzahlM.1 & ParameterzahlRIOM ' 14 & 2 ' 12 Kritischer χ2&Wert (F.G.' 6 ; α ' 0,05 ) ' 21,03 Da L.R.χ2 $ χ2kritisch ist; muß H0 verworfen werden ! Berechnung des Proportional&Reduction&of&Error&R 2 auf der Basis der Devianzen von RIOM und M.3: PRE&R 2 ' DevianceRIOM & DevianceM.3 DevianceRIOM ' 9.719,11 & 9.650,84 ' 0,007 9.719,11 Mit einer Irrtumswahrscheinlichkeit von weniger als 5%, verwerfen wir die Nullhypothese des partiellen Likelihood-Ratio-χ2-Tests, die behauptet, dass alle im Vergleich zum RandomIntercept-Only-Modell zusätzlich berücksichtigten exogenen Individual- und Kontextmerkmale keinen statistischen bedeutsamen Einfluß auf die Vorhersage der Viktimisierungslogits ausüben. Die entsprechende Reduktion der zugehörigen Devianz fällt mit 0,7 % eher sehr bescheiden aus. Dieses partielle PRE-R2 liefert eine aber unrealistische Einschätzung der Modellanpassung, da es nur die Verbesserung des Fits im Vergleich zum maximalen Erklärungsbeitrag der Kontextzugehörigkeit erfasst. Letzterer hat schätzungsweise rd. 22,25% betragen, wie der Intra-KlassenKorrelationskoeffizient des R-I-O-Logitmodell gezeigt hat. Um die Erklärungsbeiträge der Kontextmerkale im Hinblick auf die kontextabhängigen logistischen Regressionskonstante und den Minderheiteneffekt zu ermitteln, berechnen wir das von Bryk&Raudenbush (2002, S. 85) vorgeschlagenen Level-2-PRE-R2 für „random-effects“, das auf der Logik der Proportionalen Fehlerreduktion beruht. Für den als Kriteriumsvariable betrachteten kontextabhängigen Koeffizienten ermittelt es die durch die Einbeziehung der Level2-Merkmale erzielte Reduktion der Varianzkomponente und setzt sie ins Verhältnis zu seiner Variation im einfachen „random-coefficient-model“. Dieses Level-2-PRE-R2 ist zwar theore- Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 98 tisch auf den Wertebereich von Null bis Eins begrenzt, aber bei einer hohen Multikollinearität der Level-2-Prädiktoren können negative Werte auftreten. Berechnung des Bryk & Raudenbush&R 2 für die Ebene 2 : Bryk & Raudenbush&R 2 Level 2 ' σ̂ 2uqj ( MRandom Intercept&Slope ) & σ̂ 2uuqj ( MCoefficient as Outcome ) σ̂ 2uqj ( MRandomIntercept&Slope ) Level 2&PRE&R 2 (β 0 j ) ' 0,84159 & 0,67027 ' 0,2036 ( 100 ' 20,36 % 0,84159 Level 2&PRE&R 2 (β 3 j ) ' 0,98301 & 0,72828 ' 0,2591 ( 100 ' 25,91 % 0,98301 Legende: σ̂ 2u 0 j : Geschätzte Varianz der Residuen der kontextspezifischen σ̂ Geschätzte Varianz der Residuen der kontextspezifischen 2 u kj : logistischen Regressionskonstanten β0j logistischen Steigungskoeffizienten β kj MCoefficient as Outcome : Coefficient&as&Outcome&Model mit den Level&2&Kontextvariablen MRandom Intercept&Slope : Random&Intercept&Random&Slope&Logitmodell ohne Kontextmerkmale Unsere beiden Nachbarschaftsmerkmale Prozentsatz ethnischer Minoritäten und Ausmaß der sozialen Integration erklären rd. 20,36% der Variation des Opferrisikos der Referenzgruppe, die aus weißen verheirateten Männern im Durchschnittsalter mit mittleren Einkommen und Freizeitaktivitäten besteht. Die zu ihnen gehörenden Wechselwirkungseffekte zwischen den Ebenen erklären rd. 25,91% der Abweichung der Opferwahrscheinlichkeit ihrer „farbigen Nachbarn“. Diese Begrifflichkeit ist insofern ungenau, da sich die auf die Kontextmerkmale zurückzuführende Varianzaufklärung nicht auf die Wahrscheinlichkeit selbst sondern auf deren geschätztes Logit bezieht. Beide Kontextmerkmale üben folglich einen hohen praktisch deutsamen Einfluß auf die differentiellen Opferrisiken der Referenz- und Minderheitengruppen innerhalb der untersuchten Nachbarschaften aus, den es anhand der geschätzten γ-Koeffizienten der Laplace6Approximation inhaltlich zu bestimmen gilt. Um die Interpretation des im Alternativmodell 3 geschätzten „fixed-effects“ und „cross-levelinteractions“ zu erleichtern, tragen wir sie in das Gleichungssystem des geschätzten logistischen Mehrebenenmodells ein und kennzeichnen signifikante Effekt jeweils mit einem Sternchen. Bei Irrtumswahrscheinlichkeiten zwischen 5 und 10% setzen wir das Sternchen in Klammern. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 99 chätzgleichungen mit Fixed&Effect&Koeffizienten des Alternativmodells 3 : evel / Ebene 2: Between&Context&Regression a) Logistic Intercept&as&Outcome: β 0 j β 0 j ' &3,51( % 0,02( ( ( PMINORI.j& PMINORI.. ) & 0,37( ( ( MNINTEGR. j& MNINTEGR.. ) % u 0 j Fixed Logistic Slopes: b) β 1 j ' &0,00 c) β 2 j ' %0,05 d) Logistic Slope&as&Outcome: β 3 j β 3 j ' %0,21 & 0,03( ( ( PMINORI.j& PMINORI.. ) % 0,07 ( ( MNINTEGR. j& MNINTEGR.. ) % u 3 j Fixed&Logistic Slopes: e) β 4 j ' &0,09 (() f) β 5 j ' %0,36( g) β 6 j ' %0,25( evel / Ebene 1: Logistic Within&Context Regression ) ln P ( DVICVIOL ' 1) 1 & P ( DVICVIOL ' 1 ) ' β 0 j % β 1 j ( ( ALTERì j& ALTER.. ) % β 2 j ( FRAU i j ij % β 3 j ( MINORITY ij % β 4 j ( ( INCOME ij& INCOME.. ) % β 5 j ( LIVALONE ij % β 6 j ( ( DANGACT ij& DANGACT.. ) % e ij Der Koeffizient γ00 von -3,51 erfasst das Logit des Opferrisikos der Referenzgruppe im Durchschnittskontext, der durch einen Anteil ethnischer Minoritäten von 15,51 % und einem Ausmaß der sozialen Integration von 3,51 gekennzeichnet ist. Diesem Logit entspricht ein geschätztes Opferrisiko von rd. 2,9 %, wie sich leicht anhand der Prognosegleichung der logistischen Regression berechnen läßt. Pro Prozentpunkt, den sich der Anteil der ethnischen Minoritäten in der Nachbarschaft erhöht, nimmt das Logit der Referenzgruppe um +0,02 Einheiten zu. Wie dem T-Test zu entnehmen ist, erweist sich dieser Kontexteffekt als statistisch signifikant. Erhöht sich aber das Ausmaß der sozialen Integration um eine Einheit, so verringert sich das Logit des Opferrisikos der Referenzgruppe um -0,37 Einheiten. Dieser Effekt ist ebenfalls statistisch signifikant, wie der T-Wert von 2,64 belegt. Hingegen üben weder das Alter (γ10) noch das Geschlecht (γ20) kontextübergreifend einen statistisch bedeutsamen Effekt auf das Opferrisiko aus, da beide Logitkoeffizienten das übliche Signifikanzniveau weit verfehlen. Im Durchschnittskontext haben zwar Angehörige ethnischer Minoritäten mit einem Logitkoeffizienten γ30 von +0,21 ein höheres Opferrisiko als ihre weißen Nachbarn. Dieser Effekt ist mit einem T-Wert von 0,46 statistisch aber nicht signifikant. Erhöht sich hingegen der Minderhei- Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 100 tenanteil der Nachbarschaft, so nimmt ihre geschätzte Abweichung beim Opferlogit (γ31) um einen Wert von -0,032 pro Prozentpunkt ab. Mit einem T-Wert von -3,40 ist dieser Wechselwirkungseffekt statistisch signifikant. Steigt der Minoritätenanteil um deutlich mehr als 7 %, so weisen die „Farbigen“ ein deutlich geringeres Opferrisiko als ihre weißen Nachbarn auf. Hingegen nimmt das Opferrisiko der Farbigen zumindest tendenziell zu, wenn das Ausmaß der sozialen Integration ansteigt, wie der γ32-Koeffizient von +0,07 belegt. Gemessen an seinem TWert von 0,24 ist er aber nicht statistisch signifikant. Kontextübergreifend sinkt das Opferrisiko, wenn die Befragten, gemessen an ihrer Einkommensklasse, einer höhereren Schicht angehören. Der zugehörige Logitkoeffizient γ40 verfehlt mit einem Wert von -0,09 knapp das übliche 5%Signifikanzniveau. Kontextübergreifend erhöhen das Singledasein und außerhäusliche Freizeitaktivitäten das Risiko, Opfer einer Gewalttat zu werden. Der zum Singledasein gehörende Logitkoeffizient (γ50) verfehlt mit einem Wert von +0,36 sehr knapp die 5%-Schwelle der Irrtumswahrscheinlichkeit, indiziert aber, dass Alleinstehende ein signifikant höheres Opferrisiko haben die verheirateten Mitglieder der Vergleichsgruppe. Wie dem Logitkoeffizienten (γ60) von +0,25 zu entnehmen ist, erhöht sich in signifikanten Maße das Risiko, Opfer eines Raubüberfalls oder einer Körperverletzung zu werden, wenn der Befragten verstärkt außerhäuslichen Freizeitaktivitäten nachgeht. HLM 5 bietet die Möglichkeit, sich die geschätzten „fixed-effects“ der 2. Ebene graphisch darzustellen. Dies erleichtert in erheblichen Maße die Interpretation der Wechselwirkungseffekt zwischen den Analyseebenen. Hierzu rufen wir im Dateimenü die Option „Graph Equations“ auf. Abb. 38: Aufruf des Graph Equations-Menüs für die graphische Darstellung der geschätzten „fixed effects“ Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - Abb. 39: WiSe 2001/2002 101 Anforderung der geschätzten Viktimisierungswahrscheinlichkeiten für Minderheiten und Weiße in Abhängigkeit von Kontextmerkmalen Minoritätenanteil und soziale Integration der Nachbarschaft Der Grafikeditor von HLM 5 bietet uns die Möglichkeit, unsere Grafiken interaktiv zu gestalten, wobei wir die Möglichkeit haben, die Effekte von bis zu drei exogenen Individual- und Kontextmerkmalen auf die Kriteriumsvariable als Liniendiagramme darzustellen. Bei nicht-linearen Wahrscheinlichkeismodellen wie dem binären, ordinalen oder multinomialen Logit plottet HLM direkt die geschätzten Wahlwahrscheinlichkeiten in Richtung der Y-Achse. Das entlang XAchse abzubildende Merkmal wählen wir im Optionsfeld „X-focus“ aus, wobei wir uns zwischen den Merkmalen der ersten und zweiten Entscheiden entscheiden müssen. In unserem Fall wählen wir für die X-Achse die Variable PMINORI, die den Prozentsatz ethnischer Minderheiten in der Nachbarschaft enthält. Im zweiten Auswahlfeld legen wir „For continuous X“ den Wertebereich unserer Kontextvariablen fest. Voreingestellt ist der Bereich zwischem dem 10und 90er Percentil. Neben dem Interquartilsabstand, dem Mittelwert +/- 2 Standardfehlern steht uns auch der gesamte Wertebereich von X zur Verfügung. Hierbei haben wir zu beachten, dass die vor der Schätzung durchgeführten Zentrierungen am Grand-Mean auch für die Grafik gelten. Über das „Z focus(1)“-Menü wählen wir unser exogenes Individualmerkmal Minoritätenstatus (MINORITY) aus, wobei HLM 5 selbst feststellt, dass es sich um eine Dummyvariable handelt. Per Voreinstellung wählt HLM beide Gruppen für die Darstellung der zugehörigen Funktionsscharen aus. Im „Z-focus(2)“-Menü wählen wir als drittes Merkmal das Ausmaß der sozialen Integration der Nachbarschaft (MNINTEGR) aus, wobei wir uns auf neben dem Median auf die untere und obere Quartilsgrenze in der Darstellung beschränken. Hierdurch gewährleisten wir die Übersichtlichkeit unsere Grafik, da sie nur eine Schar von sechs Funktionen enthält, jeweils drei Integrationsstufen für die Weißen und drei für die „Farbigen“. In den „Choose up to 6"Feldern können wir aber auch für jede unserer Z-Variablen bis zu sechs Funktionswerte vorgeben, die dann als Funktionsscharen gezeichnet werden. Im Menü „Categories / transforms / Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 102 interactions“ können wir für die Ausprägungen unserer nominalen Prädiktoren Werteetiketten vergeben, die dann HLM als Gruppennamen in die Grafik aufnimmt. Außerdem stellt uns HLM für metrische Variablen als mathematische Transformationen neben dem natürlichem Logarithmus die e- und quadratische Funktion zur Verfügung. Darüber hinaus können wir dort die Interaktion der beiden ausgewählten Z-Variablen spezifizieren. Im Auswahlmenü „Ranges / Titles / Color“ legen wir die Wertebereiche der Y- und X-Achse fest, geben die jeweiligen Achsenbeschriftungen vor und wählen zwischen der Schwarzweiß- und farbigen Darstellung. Abb. 40: Übersicht der Optionen des Grafikeditors von HLM 5 (Raudenbush,Bryk,Cheong&Congdon 2001, S.229) Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - Abb. 41: Abb. 42: WiSe 2001/2002 103 Angabe der Wertebereiche, der Achsenbeschriftungen sowie des Abbildungstitels Graphische Darstellung der geschätzten „Wechselwirkungseffekte zwischen den Ebenen“ auf das Viktimisierungsrisiko durch Gewaltdelikte Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 104 In Abbildung 42 zeichnet sich deutlich der Wechselwirkungseffekt zwischen der Zugehörigkeit zur ethnischen Minorität der Befragten und dem Minderheitenanteil der Nachbarschaft in seiner Wirkung auf das Opferrisiko bei Gewaltdelikten ab. Während für die Weißen der Referenzgruppe mit zunehmenden Minderheitenanteil ihr Opferrisiko stetig steigt (drei oberen blauen Linien), nimmt vice versa die Opferwahrscheinlichkeit der „Farbigen“ stetig ab (drei unteren roten Linien). Durch die Unterschiede der sozialen Integration auf der Nachbarschaftsebene wird dieser negative Wechselwirkungseffekt nur geringfügig moderiert, wobei er seine Richtung beibehält. Hieraus ist inhaltlich zu schließen, dass in Nachbarschaften mit überdurchschnittlichem Anteil ethnischer Minderheiten das Opferrisko stark ansteigt, wobei vor allem die dort lebenden Weißen Opfer eines Raubüberfalls oder einer Körperverletzung geworden sind. Umgekehrt sinkt bei einem unterdurchschnittlichen Anteil ethnischer Minoritäten das Opferrisiko insgesamt, wobei es aber für die dort lebenden Farbigen höher als für ihre weißen Nachbarn ausfällt. Wir können die mit WHLM erstellte Grafik mit den Tastenkombinationen STRG c und STRG v in jedes beliebige Windows-Programm exportieren, wenn wir die Grafik mit dem Mauszeiger zuvor markiert haben. Abb. 43: Speichern der erstellten Grafik als „enhanced (Windows) metafile“ (*.emf) Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 105 Im Alternativmodell 4 berücksichtigen wir als weiteres Kontextmerkmal die „Zeichen des Verfalls“ der jeweiligen Nachbarschaft und verwenden sie zur Erklärung der Variation der logistischen Konstanten sowie des Steigungskoeffizienten der Minoritätenzugehörigkeit. Wir erhalten das folgende Gleichungssystem: Die Schätzgleichungen des Alternativmodels 4 : M.4 Level / Ebene 2: Between&Context&Regression 2 a) Logistic Intercept&as&Outcome: β 0 j β 0 j ' γ 0 0 % γ 0 1 ( ( PMINORI. j& PMINORI.. ) % γ 0 2 ( ( MNINTEGR. j& MNINTEGR.. ) % γ 0 3 ( ( MINCIVIL. j& MINCIVIL.. ) % u 0 j Fixed Logistic Slopes: 2 b) β 1 j ' γ 1 0 2 c) β 2 j ' γ 2 0 Logistic Slope&as&Outcome: β 3 j 2 d) β 3 j ' γ 3 0 % γ 3 1 ( ( PMINORI. j& PMINORI.. ) % γ 3 2 ( ( MNINTEGR. j& MNINTEGR.. ) % γ 3 3 ( ( MINCIVIL. j& MINCIVIL.. ) % u 3 j Fixed&Logistic Slopes: 2 e) β 4 j ' γ40 2 f) β 5 j ' γ50 2 g) β 6 j ' γ60 Level / Ebene 1: Logistic Within&Context Regression 1) ln P ( DVICVIOL ' 1) 1 & P ( DVICVIOL ' 1 ) ' β 0 j % β 1 j ( ( ALTERì j& ALTER.. ) % β 2 j ( FRAU i j ij % β 3 j ( MINORITY i j % β 4 j ( ( INCOME i j& INCOME.. ) % β 5 j ( LIVALONE i j % β 6 j ( ( DANGACT i j& DANGACT.. ) % e i j Im interaktiven Gleichungseditor von HLM sieht das zu schätzende Gleichungssystem folgendermaßen aus: Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - Abb. 44: WiSe 2001/2002 Graphische Spezifikation des Alternativmodells M4 mit den „Zeichen des Verfalls“ als Kontextmerkmal Wir erhalten das folgende gekürzte Ausgabeprotokoll: Summary of the model specified (in equation format) --------------------------------------------------Level-1 Model Prob(Y=1|B) = P log[P/(1-P)] = B0 + B1*(ALTER) + B2*(FRAU) + B3*(MINORITY) + B4*(INCOME) + B5*(LIVALONE) + B6*(DANGACT) Level-2 B0 = B1 = B2 = B3 = B4 = B5 = B6 = 106 Model G00 + G01*(PMINORI) + G02*(MINCIVIL) + G03*(MNINTEGR) + U0 G10 G20 G30 + G31*(PMINORI) + G32*(MINCIVIL) + G33*(MNINTEGR) + U3 G40 G50 G60 Level-1 variance = 1/[P(1-P)] RESULTS FOR NON-LINEAR MODEL WITH THE LOGIT LINK FUNCTION: Unit-Specific Model (macro iteration 408) Tau INTRCPT1,B0 MINORITY,B3 0.18353 -0.11654 -0.11654 0.33397 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse Standard Errors of Tau INTRCPT1,B0 0.14380 MINORITY,B3 0.27029 Tau (as correlations) INTRCPT1,B0 1.000 MINORITY,B3 -0.471 WiSe 2001/2002 0.27029 0.71413 -0.471 1.000 ---------------------------------------------------Random level-1 coefficient Reliability estimate ---------------------------------------------------INTRCPT1, B0 0.091 MINORITY, B3 0.033 ---------------------------------------------------Note: The reliability estimates reported above are based on only 212 of 300 units that had sufficient data for computation. Fixed effects and variance components are based on all the data. The value of the likelihood function at iteration 2 = -5.914887E+003 The outcome variable is DVICVIOL Final estimation of fixed effects: (Unit-specific model) ---------------------------------------------------------------------------Standard Approx. Fixed Effect Coefficient Error T-ratio d.f. P-value ---------------------------------------------------------------------------For INTRCPT1, B0 INTRCPT2, G00 -3.404381 0.138166 -24.640 296 0.000 PMINORI, G01 0.010320 0.004820 2.141 296 0.032 MINCIVIL, G02 1.024933 0.135675 7.554 296 0.000 MNINTEGR, G03 -0.081511 0.116844 -0.698 296 0.485 For ALTER slope, B1 INTRCPT2, G10 0.000011 0.004727 0.002 4378 0.998 For FRAU slope, B2 INTRCPT2, G20 0.087578 0.148295 0.591 4378 0.554 For MINORITY slope, B3 INTRCPT2, G30 0.358099 0.280262 1.278 296 0.202 PMINORI, G31 -0.022985 0.009617 -2.390 296 0.017 MINCIVIL, G32 -0.532944 0.322755 -1.651 296 0.098 MNINTEGR, G33 -0.085273 0.265723 -0.321 296 0.748 For INCOME slope, B4 INTRCPT2, G40 -0.050135 0.059449 -0.843 4378 0.399 For LIVALONE slope, B5 INTRCPT2, G50 0.290290 0.166545 1.743 4378 0.081 For DANGACT slope, B6 INTRCPT2, G60 0.189072 0.092482 2.044 4378 0.041 ---------------------------------------------------------------------------- Final estimation of variance components: ----------------------------------------------------------------------------Random Effect Standard Variance df Chi-square P-value Deviation Component ----------------------------------------------------------------------------INTRCPT1, U0 0.42840 0.18353 208 220.41062 0.264 MINORITY slope, U3 0.57790 0.33397 208 196.59113 >.500 ----------------------------------------------------------------------------Note: The chi-square statistics reported above are based on only 212 of 300 units that had sufficient data for computation. Fixed effects and variance components are based on all the data. 107 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 108 RESULTS FOR LAPLACE-6 ITERATION 23 Tau INTRCPT1,B0 MINORITY,B3 0.21500 -0.12664 -0.12664 0.45844 Standard Errors of Tau INTRCPT1,B0 0.20103 MINORITY,B3 0.33321 0.33321 0.97157 Tau (as correlations) INTRCPT1,B0 1.000 MINORITY,B3 -0.403 -0.403 1.000 ---------------------------------------------------Random level-1 coefficient Reliability estimate ---------------------------------------------------INTRCPT1, B0 0.104 MINORITY, B3 0.045 ---------------------------------------------------Note: The reliability estimates reported above are based on only 212 of 300 units that had sufficient data for computation. Fixed effects and variance components are based on all the data. The likelihood at Laplace iteration 23 is -4.798865E+003 The outcome variable is DVICVIOL Final estimation of fixed effects (Laplace) ---------------------------------------------------------------------------Standard Approx. Fixed Effect Coefficient Error T-ratio d.f. P-value ---------------------------------------------------------------------------For INTRCPT1, B0 INTRCPT2, G00 -3.494678 0.176545 -19.795 296 0.000 PMINORI, G01 0.010460 0.005148 2.032 296 0.042 MINCIVIL, G02 1.044556 0.143394 7.285 296 0.000 MNINTEGR, G03 -0.083892 0.125448 -0.669 296 0.503 For ALTER slope, B1 INTRCPT2, G10 -0.000119 0.005067 -0.023 4378 0.982 For FRAU slope, B2 INTRCPT2, G20 0.088024 0.166573 0.528 4378 0.597 For MINORITY slope, B3 INTRCPT2, G30 0.274493 0.477687 0.575 296 0.565 PMINORI, G31 -0.023375 0.010922 -2.140 296 0.032 MINCIVIL, G32 -0.543821 0.342188 -1.589 296 0.112 MNINTEGR, G33 -0.098314 0.328649 -0.299 296 0.765 For INCOME slope, B4 INTRCPT2, G40 -0.050291 0.054800 -0.918 4378 0.359 For LIVALONE slope, B5 INTRCPT2, G50 0.293539 0.187360 1.567 4378 0.117 For DANGACT slope, B6 INTRCPT2, G60 0.192665 0.098673 1.953 4378 0.050 ---------------------------------------------------------------------------- Statistics for current covariance components model -------------------------------------------------Deviance = 9597.729712 Number of estimated parameters = 16 Die Verbesserung gegenüber dem Random-Intercept-Only-Logitmodell beurteilen wir erneut anhand des partiellen Likelihood-Ratio-χ2-Tests und des partiellen Deviance PRE-R2. Die festgestellte Devianzreduktion von 1,25 % erweist sich als statistisch signifikant. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 109 Partieller L.R.χ2&Test ' DevianceRIOM & DevianceM.4 ' 9.719,11 & 9.597,73 ' 121,38 Anzahl der Freiheitsgrade ' ParameterzahlM.1 & ParameterzahlRIOM ' 16 & 2 ' 14 Kritischer χ2&Wert (F.G.' 14 ; α ' 0,05 ) ' 23,68 Da L.R.χ2 $ χ2kritisch ist; muß H0 verworfen werden ! Berechnung des Proportional&Reduction&of&Error&R 2 auf der Basis der Devianzen von RIOM und M.4: PRE&R 2 ' DevianceRIOM & DevianceM.4 DevianceRIOM ' 9.719,11 & 9.597,73 ' 0,0125 9.719,11 Aufschluß über die Erklärungsbeiträge der verwendeten Kontextmerkmale geben uns die beiden Level-2-PRE-R2 die kontextabhängige logistische Konstante und die Steigung des Minderheitenstatus. Berechnung des Bryk & Raudenbush&R 2 für die Ebene 2 : Bryk & Raudenbush&R 2 Level 2 ' σ̂ 2uqj ( MRandom Intercept&Slope ) & σ̂ 2uuqj ( MCoefficient as Outcome ) σ̂ 2uqj ( MRandomIntercept&Slope ) Level 2&PRE&R 2 (β 0 j ) ' 0,84159 & 0,21500 ' 0,7445 ( 100 ' 74,45 % 0,84159 Level 2&PRE&R 2 (β 3 j ) ' 0,98301 & 0,45844 ' 0,5336 ( 100 ' 53,36 % 0,98301 Legende: σ̂ 2u 0 j : Geschätzte Varianz der Residuen der kontextspezifischen σ̂ Geschätzte Varianz der Residuen der kontextspezifischen 2 u kj : logistischen Regressionskonstanten β0j logistischen Steigungskoeffizienten β kj MCoefficient as Outcome : Coefficient&as&Outcome&Model mit den Level&2&Kontextvariablen MRandom Intercept&Slope : Random&Intercept&Random&Slope&Logitmodell ohne Kontextmerkmale Die drei Nachbarschaftsmerkmale Prozentsatz ethnischer Minoritäten, Ausmaß sozialer Integration sowie des wahrgenommenen „Verfalls“ (MINCIVIL) erklären rd. 74,45 % der Variation des Opferlogits der Referenzgruppe und rd. 53,36 % der Variation der Abweichung des Opferlogits der „Farbigen“ innerhalb der Nachbarschaft. Sie sind folglich hervorragend geeignet, Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 110 die Variabilität der kontextabhängigen Effekt zu erklären. Um die Interpretation der geschätzten fixed-effects zu erleichtern, setzen wir die mit der Laplace6-Approximation geschätzten γKoeffizienten in das zugrunde liegende Gleichungssystem wieder ein, wobei wir sie nach der zweiten Kommastelle aufrunden und ihre 5 %-Signifikanz mit einem Sternchen markieren. Bei Irrtumswahrscheinlichkeiten zwischen 5 und 15 % setzen wir das Sternchen wieder in Klammern. Hierdurch gewinnen wir einen Überblick über die Kontextabhängigkeit des Opferrisikos der Referenzgruppe und ihrer „farbigen“ Nachbarn: Schätzgleichungen mit Fixed&Effect&Koeffizienten des Alternativmodells 4 : Level / Ebene 2: Between&Context&Regression 2 a) Logistic Intercept&as&Outcome: β 0 j β 0 j ' &3,49( % 0,01( ( ( PMINORI.j& PMINORI.. ) & 0,08 ( ( MNINTEGR. j& MNINTEGR.. ) % 1,04( ( ( MINCIVIL. j& MINCIVIL.. ) % u 0 j Fixed Logistic Slopes: 2 b) β 1 j ' &0,00 2 c) β 2 j ' %0,09 2 d) Logistic Slope&as&Outcome: β 3 j β 3 j ' %0,27 & 0,02( ( ( PMINORI.j& PMINORI.. ) & 0,10 ( ( MNINTEGR. j& MNINTEGR.. ) & 0,54 (() ( ( MINCIVIL.j& MINCIVIL.. ) % u 3 j Fixed&Logistic Slopes: 2 e) β 4 j ' & 0,05 2 f) β 5 j ' %0,29 (() 2 g) β 6 j ' %0,19( Level / Ebene 1: Logistic Within&Context Regression 1) ln P ( DVICVIOL ' 1) 1 & P ( DVICVIOL ' 1 ) ' β 0 j % β 1 j ( ( ALTERì j& ALTER.. ) % β 2 j ( FRAU i j ij % β 3 j ( MINORITY i j % β 4 j ( ( INCOME i j& INCOME.. ) % β 5 j ( LIVALONE i j % β 6 j ( ( DANGACT i j& DANGACT.. ) % e i j Für unsere Referenzgruppe der weißen verheirateten Männer im Durchschnittskontext haben wir ein Logit, Opfer einer Gewalttat zu werden, von -3,49 geschätzt, welches einem Opferrisiko von rd. 2,96% entspricht. Im Vergleich zum Alternativmodell 4 hat sich die geschätzte Operwahr- Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 111 scheinlichkeit der Referenzgruppe nur unwesentlich verändert. Hingegen halbiert sich der Effekt des Nachbarschaftsmerkmals Prozentsatz ethnischer Minoritäten auf das geschätzte Opferlogit der Referenzgruppe. Pro Prozentpunkt farbiger Nachbarn steigt es nur noch um einen Wert von +0,01, wobei dieser Kontexteffekt statistisch signifikant ist. Nehmen hingegen die „Zeichen des Verfalls“ um eine Einheit im Vergleich zum Durchschnittskontext , so steigt das Opferlogit der Vergleichsgruppe um einen Wert von +1,04. Bei einem Zuwachs von mehr als drei Indikatoren des Verfalls überschreitet das geschätzte Opferrisiko der Referenzgruppe bereits die 50 % Marke. Dieser Kontexteffekt erweist sich ebenfalls als statistisch bedeutsam. Verglichen mit dem Alternativmodell 4 büßt das Nachbarschaftsmerkmal Ausmaß der sozialen Integration seinen Einfluß mit einem γ-Koeffizienten von -0,08 fast vollständig ein und verliert seine statistische Signifikanz. Hierin spiegelt sich der starke Einfluß der „Zeichen des Verfalls“ wider, den wir bereits bei den explorativen Analysen der Nachbarschaftsebene identifiziert haben. Das Ausmaß der sozialen Integration und die „Zeichen des Verfalls“ haben bereits dort mit einem Koeffizienten von -0,40 negativ miteinander korreliert, wobei die Korrelation ersterer mit der Gewaltopferrate mit -0,27 nur halb so hoch aus wie diejenige der „Zeichen des Verfalls“ mit einem Pearsons r von +0,55. Dies erklärt den Einflussverlust des Kontextmerkmals soziale Integration. Wie im Alternativmodell 3 üben weder das Alter noch das Geschlecht der Befragten einen signifikanten Einfluß auf das Logit der Viktimisierung aus. Beide Effekt sind weder praktisch noch statistisch bedeutsam. Im Durchschnittskontext steigt zwar das Opferlogit der „Farbigen“ im Vergleich zu ihren weißen Nachbarn um +0,26 an, aber dieser Gruppenunterschied erweist sich ebenso wie im Modell 4 nicht als statistisch signifikant. Wenn der Prozentsatz der Farbigen um einen Punktwert zunimmt, sinkt der geschätzte Viktimisierungsunterschied um einen Logitwert von -0,02. Im Vergleich zum Durchschnittskontext unterschreitet ihr Opferrisiko dasjenige ihrer weißen Nachbarn bereits bei einem Zuwachs um mehr als 15 %. Diese schon im Modell 4 identifizierte „Cross-Level-Interaction“ ist ebenfalls statistisch signifikant. Nehmen hingegen die „Zeichen des Verfalls“ um eine Einheit zu, so reduziert sich das Opferlogit der ethnischer Minoritäten um einen Logitwert von -0,54. Hierdurch sinkt das geschätzte Risiko der Farbigen, Opfer einer Gewalttat zu werden, deutlich unterhalb desjenigen ihrer weißen Nachbarn. Mit einer Irrtumswahrscheinlichkeit von rd. 11 % verfehlt dieser Kontexteffekt die übliche Signifikanzgrenze von 5 %. Ebenso wie im Alternativmodell 4 wirkt sich das Ausmaß der sozialen Integration nicht statistisch bedeutsam auf den Viktimisierungsunterschied von farbigen und weißen Nachbarn aus, die Tür an Tür leben. Im Vergleich zum Alternativmodell 4 halbiert sich der kontextübergreifend geschätzte Effekt sozialer Ungleichheit von -0,09 auf -0,05, wobei er sich als statistisch nicht signifikant erweist. Der ebenfalls kontextübergreifend geschätzte Effekt des Singledaseins erreicht einen um +0,29 höheren Logitwert als die Referenzgruppe, büßt aber im Vergleich zum Alternativmodell 4 seine statistische Signifikanz ein. Hingegen behauptet sich der Effekt der außerhäuslichen Freizeitaktivitäten auf das Viktimisierungsrisko bei Gewaltdelikten. Mit einem mit ihm verbundenen Anstieg des Opferlogits um +0,19 Einheiten entpuppt er sich erneut als statistisch signifikant. Summa summarum zeigt sich, dass die untersuchten Kontextmerkmale Prozentsatz ethnischer Minoritäten, Ausmaß der sozialen Integration sowie die „Zeichen des Verfalls“ sehr gut dazu geeignet sind, die Unterschiede der Viktimisierung durch Gewaltdelikte zwischen Farbigen und ihren weißen Nachbarn zu erklären. Hingegen üben die exogenen Individualmerkmale Alter, Geschlecht und Einkommensklasse keinen bedeutsamen Einfluß auf die Wahrscheinlichkeit aus, Opfer einer Gewalttat innerhalb der eigenen Nachbarschaft zu werden. Lediglich das Singledasein als „Lebensstil“ und das Ausmaß an außerhäuslichen Freizeitaktivitäten führen zu einem zumindest tendenziell signifikant höherem Opferrisiko. Ihr Effekte variieren selbst aber nicht Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 112 bedeutsam über die Nachbarschaften hinweg, wie explorative Analysen im Vorfeld gezeigt haben. Für die Vorhersage des Viktimisierungsrisikos auf der Grundgesamtheitsebene, in unserem Falle aller Nachbarschaften Seattles im Jahre 1990, haben Raudenbush et.al. (2000) das „Population Average Model“ entwickelt, dessen γ-Koeffizienten sie mit konventioniellen und „robusten“ Standardfehlern präsentieren. Letztere reagieren ihres Erachtens weniger sensitiv auf die Fehlspezifikation der Kovarianzstruktur zwischen den Ebenen sowie die Verletzung ihrer Verteilungsannahmen. RESULTS FOR NON-LINEAR MODEL WITH THE LOGIT LINK FUNCTION: Population Average Model The value of the likelihood function at iteration 3 = -5.923850E+003 The outcome variable is DVICVIOL Final estimation of fixed effects: (Population-average model) ---------------------------------------------------------------------------Standard Approx. Fixed Effect Coefficient Error T-ratio d.f. P-value ---------------------------------------------------------------------------For INTRCPT1, B0 INTRCPT2, G00 -3.384627 0.130059 -26.024 296 0.000 PMINORI, G01 0.010204 0.004729 2.158 296 0.031 MINCIVIL, G02 1.024644 0.131766 7.776 296 0.000 MNINTEGR, G03 -0.083251 0.113775 -0.732 296 0.464 For ALTER slope, B1 INTRCPT2, G10 -0.000128 0.004513 -0.028 4378 0.978 For FRAU slope, B2 INTRCPT2, G20 0.085503 0.140690 0.608 4378 0.543 For MINORITY slope, B3 INTRCPT2, G30 0.371528 0.258051 1.440 296 0.150 PMINORI, G31 -0.022621 0.009059 -2.497 296 0.013 MINCIVIL, G32 -0.550148 0.305372 -1.802 296 0.071 MNINTEGR, G33 -0.091648 0.250170 -0.366 296 0.714 For INCOME slope, B4 INTRCPT2, G40 -0.049054 0.056459 -0.869 4378 0.385 For LIVALONE slope, B5 INTRCPT2, G50 0.283468 0.159072 1.782 4378 0.074 For DANGACT slope, B6 INTRCPT2, G60 0.187070 0.087936 2.127 4378 0.033 ---------------------------------------------------------------------------The outcome variable is DVICVIOL Final estimation of fixed effects (Population-average model with robust standard errors) ---------------------------------------------------------------------------Standard Approx. Fixed Effect Coefficient Error T-ratio d.f. P-value ---------------------------------------------------------------------------For INTRCPT1, B0 INTRCPT2, G00 -3.384627 0.109568 -30.891 296 0.000 PMINORI, G01 0.010204 0.004606 2.215 296 0.027 MINCIVIL, G02 1.024644 0.128331 7.984 296 0.000 MNINTEGR, G03 -0.083251 0.105999 -0.785 296 0.432 For ALTER slope, B1 INTRCPT2, G10 -0.000128 0.004392 -0.029 4378 0.977 For FRAU slope, B2 INTRCPT2, G20 0.085503 0.126685 0.675 4378 0.500 For MINORITY slope, B3 INTRCPT2, G30 0.371528 0.233490 1.591 296 0.111 PMINORI, G31 -0.022621 0.008420 -2.687 296 0.008 MINCIVIL, G32 -0.550148 0.301488 -1.825 296 0.068 MNINTEGR, G33 -0.091648 0.217278 -0.422 296 0.673 For INCOME slope, B4 INTRCPT2, G40 -0.049054 0.061167 -0.802 4378 0.423 For LIVALONE slope, B5 INTRCPT2, G50 0.283468 0.151276 1.874 4378 0.060 For DANGACT slope, B6 INTRCPT2, G60 0.187070 0.082750 2.261 4378 0.024 ---------------------------------------------------------------------------- Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 113 Um die Interpretation zu erleichtern, setzen wir wieder die γ-Koeffizienten des PopulationAverage-Model in das zugehörige Gleichungssystem ein und weisen die Signifikanzen auf der Grundlage der „robusten Standardfehler“ jeweils mit enem Sternchen bei höchstens 5% bzw. einem eingeklammerten Sternchen für den Bereich zwischen 5 und 15% aus. Schätzgleichungen des Population Average Model ( M.4 ) mit robusten Standardfehlern: Level / Ebene 2: Between&Context&Regression 2 a) Logistic Intercept&as&Outcome: β 0 j β 0 j ' &3,38( % 0,01( ( ( PMINORI.j& PMINORI.. ) & 0,08 ( ( MNINTEGR. j& MNINTEGR.. ) % 1,02( ( ( MINCIVIL. j& MINCIVIL.. ) Fixed Logistic Slopes: 2 b) β 1 j ' &0,00 2 c) β 2 j ' %0,09 2 d) Logistic Slope&as&Outcome: β 3 j β 3 j ' %0,37 (() & 0,02( ( ( PMINORI. j& PMINORI.. ) & 0,09 ( ( MNINTEGR.j& MNINTEGR.. ) & 0,55 (() ( ( MINCIVIL.j& MINCIVIL.. ) Fixed&Logistic Slopes: 2 e) β 4 j ' & 0,05 2 f) β 5 j ' %0,28 (() 2 g) β 6 j ' %0,19( Level / Ebene 1: Logistic Within&Context Regression 1) ln P ( DVICVIOL ' 1) 1 & P ( DVICVIOL ' 1 ) ' β 0 j % β 1 j ( ( ALTERì j& ALTER.. ) % β 2 j ( FRAU i j ij % β 3 j ( MINORITY ij % β 4 j ( ( INCOME ij& INCOME.. ) % β 5 j ( LIVALONE ij % β 6 j ( ( DANGACT ij& DANGACT.. ) % e ij Im Vergleich zu unser kontextspezifischen Analyse („Unit-specific model“) des Alternativmodells 4 mit der Laplace6-Approximation weist das Grundgesamtheitsmodell („PopulationAverage-Model“) weder im Bereich der γ-Koeffizienten noch der identifizierten Signifikanzen bedeutsame Unterschiede auf. Bis auf die zweite Kommastelle entsprechen sich die γ-Koeffizienten beider Modelle weitgehend, wobei die Signifikanzeinschätzung auf der Basis „robuster Standardfehler“ zu keiner neuen Bewertung führt. Dies dürfte daran liegen, dass unsere Studie Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 114 mit 300 untersuchten Nachbarschaften mit durchschnittlich rd. 18 Befragten eine ausreichende Stichprobengröße für die Schätzung der Kontexteffekt und ihrer Wechselwirkungen bereitstellt. Die relative geringe Anzahl von Befragten innerhalb der einzelnen Nachbarschaften reicht für eine Schätzung weiterer kontextabhängiger Effekt exogener Individualmerkmale nicht aus, da wir gemäß der Daumenregel von Long (1997, S. 54) mindestens 10 Fälle pro Logitschätzer der Within-Regression benötigen. 8. Schätzung des logistischen Zweiebenenmodells mit dem Freeware-Programm MIXOR Die beiden an der Univeristy of Illionois at Chicago tätigen Biometriker Hedeker&Gibbons haben das von ihnen entwickelte DOS-Extender Programm MIXOR zur Schätzung von logistischen Zweiebenenmodell 1996 erstmals der Fachöffentlichkeit vorgestellt. Seine Version 2, die über eine Windows-basierte Bedienungsoberfläche verfügt, kann der interessierte Leser sich über die folgende Internetadresse beschaffen: url://www.uic.edu/~Hedeker/mixwin.html. Dort findet er neben Patchen zu Windows XP ein Handbuch und einführende Literatur als PDFDateien. MIXOR gehört zu einer umfangreichen Familie von Zweiebenenmodellen, die Hedeker & Gibbon (1999) als „Random-Regression-Models“ bezeichnen. Sie haben Zweiebenenmodelle für metrische, binäre, ordinale und multinomiale Kriteriumsvariablen entwickelt. Hinzu kommt noch ein Poisson-Regressionsmodell für Zählvariablen mit zu schätzenden Varianzkomponenten. Da es sich beim binären Logit um einen Spezialfall des ordinalen, kumulativen Logits handelt, welches in der Biometrie unter der Bezeichnung „Proportional Odds Model“9 firmiert, wenden wir uns kurz seiner spezifischen Schätzgleichung zu. Vereinfachte Schätzgleichung des ordinalen, kumulativen Logits: ˆ Logit K P (Y # j ) P (Y # j ) ˆ ' Logit ' µ j & Σ βk xki 1 & P (Y # j ) P(Y > j) k ' 0 Restriktion: 1) µ 1 ' 0 2) βk ist für alle Schwellenübergänge identisch Legende: i : k : j : µj : Fälle Unabhängige Variablen Betrachtete Kategorie des ordinalen Indikators Y Zur Ausprägung Y j gehörende Schwellenwert von Y ( Das kumulative Logit geht von der Messannahme, dass es sich bei der ordinalen Kriteriumsvariable Y um eine ungenaue Erhebung einer sich dahinter verbergenden latenten Variable Y* 9 S. in der Biometrie: McCullagh (1980); McCullagh&Nelder (19892, S. 151 ff.); in den Sozialwissenschaften: McKelvey&Zavoina (1975), Greene (20035, S. 736 ff.) Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 115 handelt, die als Verteilung entweder der logistischen oder Normalverteilungsdichte folgt. Die Kategorien der Indikatorvariablen Y markieren hierbei die Übergänge auf dieser latenten Variable im Sinne von Schwellenwerten. Unter den Annahmen, dass erstens der erste Schwellenwert Null sei und zweitens dass die Effekte der exogenen Merkmale für alle Übergänge gleich seien, schätzt MIXOR jeweils das kumulative Logit der Wahrscheinlichkeiten höchsten die betrachtete Schwelle zu erreichen vs. sie zu überspringen. Im Vergleich zum klassischen Logitmodell vertauscht das kumulative Logit zwar Zähler und Nenner, wobei beide gleichermaßen den ersten Schwellenwert auf Null fixieren. Durch die Substraktion des linearen Prädiktors modellieren wir aber die Wahrscheinlichkeit, den vorgegebenen Schwellenwert der ordinalen Indikatorvariablen zu überschreiten. Aufgrund der ersten Restriktion können wir ein logistischen Regressionsmodell für binäre Wahlalternativen schätzen, das eine Regressionskonstante für das Logit der Referenzgruppe bei Dummykodierung enthält und als reines „fixed-effect“-Modell identische Schätzer wie die logistische Regression in SPSS liefert. Im ordinalen Fall entspricht die in MIXOR gewählte Voreinstellung der Parametrisierung von McKelvey & Zavaoina (1975), die ebenfalls Greene (2003) für sein Programm LIMDEP gewählt hat. Sie liegt ebenfalls dem verallgemeinerten hierarchisch linearen Modell des Programms HLM 5 zugrunde. Hingegen erfordert die von McCullagh (1980) für sein Programm PLUM entwickelte Parametrisierung des frei zu schätzenden ersten Schwellenwerts, dass wir für jede Ausprägung einer nominalen exogenen Variablen eine eigene Dummyvariable im Modell angeben. Diese spezielle Form des „Proportional Odds Model“ ist in SPSS seit der Version 10.0 unter der Bezeichnung PLUM implementiert. Im Gegensatz zu HLM 5 handelt es sich bei MIXOR um ein übersetztes FORTRAN 77-Programm, dessen Steuerung und Modellspezifikation ursprünglich über fünf „Lochkarten“ bzw. Kommandozeilen erfolgt ist. Seine Version 2 stellt uns fünf Menüs zur Verfügung, die dem Einlesen der Daten, der Modellauswahl sowie seiner Spezifikation dienen. MIXOR führt erstens keine Zentrierungen der exogenen Individual- und Kontextmerkmale durch und bildet zweitens nicht die zu den Wechselwirkungseffekten gehörenden Interaktionsterme zwischen den zugehörigen Individual- und Kontextmerkmalen. Beides müssen wir zuvor in einem Statistikpaket wie SPSS oder STATA durchführen und als ASCII-Rohdaten herausschreiben, wobei wir für die fehlenden Werte Codes wie „9" für einstellige und „99" für mehrstellige Variabeln selbst zu vergeben haben. Wir können sie später als fehlende Angaben in MIXOR vereinbaren, so dass das Programm entsprechend einen fallweisen Ausschluß der zugehörigen Beobachtungen selbständig ausführt. Außerdem bildet MIXOR nicht selbständig den Vektor der Einsen, den wir für die Schätzung der Regressionskonstanten im Verallgemeinerten Linearen Modell benötigen. Letzten erstellen wir daher ebenfalls in SPSS mit einer Compute-Anweisung. Hedeker&Gibbons (1996, S.7ff.) haben zur Approximation der exakten Maximum-LikelihoodLösung die Maximum-Marginal-Likelihood-Schätzung entwickelt, die basierend auf dem Fisher-Scoring-Algorithmus eine Gauss-Hermite-Quadratur zur Lösung der mehrdimensionalen Integrale verwendet, die zu den Varianzkomponenten gehören. Der Vorteil ihres Schätzverfahrens besteht darin, dass es die geschätzte Log-Likelihood oder Devianz (-2*LnL) für das Nullmodell berechnet, welches nur die logistische Regressionskonstante als „fixed effect“ enthält. Dies versetzt uns in die Lage, einen globalen Likelihood-Ratio-χ2-Test für alle geschätzten „fixed“ und „random effect“ gleichzeitig durchzuführen. Außerdem liefert es uns hierdurch die Grundlage für die Berechnung diverser Pseudo-R2, welche auf der Log-Likelihood des Nullmodells basieren. Mit MIXOR können wir maximal 8 Varianzkomponenten schätzen, wobei die Anzahl der exogenen Individual- und Kontextmerkmale 40 nicht überschreiten darf. Die Anzahl der Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 116 analysierbaren Fälle hängt allein von der Größe der Hauptspeichers des PCs ab. Das MIXORÄquivalent zum Alternativmodell 5 mit 5301 Fällen ließ sich problemlos im Rahmen eines Testlaufs auf einem PIII-500-PC mit 128 MB Hauptspeicher schätzen. 8.1Aufbereitung der Miethe-Viktimisierungsdaten in SPSS Da MIXOR weder Zentrierungen selbst durchführt noch die für die Cross-Level-Effekte benötigen Interaktionsterme selbst bildet, müssen wir die drei genannten Arbeitsschritte zuvor in SPSS durchführen und die Daten anschließend als ASCII-Rohdatensatz herausschreiben. Hierbei haben wir zu beachten, dass MIXOR als amerikanisches Programm den Punkt als Dezimaltrenner verwendet. * Aufbereitung der „miethe.sav“-Daten fuer die MIXOR-Analysen. * Einlesen der Gesamtdatei. GET FILE='D:\LEHRE\METH6W2K\multilev\miethe\SPSSFWIN\miethe.sav'. recode frau (1=1) (2=0). value labels frau 1 'Frau' 0 'Mann'. freq /variables=frau. recode minority (1=1) (2=0). value labels minority 1 'Black, others' 0 'White'. freq /variables=minority. * Konstruktion der Indizes fuer Multi-Level-Analysis mit ordinalen A.V.s. recode q166 (1=1) (2=2) (3=3) (4=4) (9=9) into fearpatt. recode q167 (1=1) (2=2) (3=3) (4=4) (9=9) into fearburg. recode q76 (0=0) (1=1) (9=9) into fearwalk. recode q77 (1=1) (2=2) (3=3) (4=4) (9=9) into percrisk. var labels fearpatt 'Furcht vor taetl.Angriff/Koerperletzung'/ fearburg 'Furcht vor Einbruch in eigenes Haus/Wohnung'/ fearwalk 'Furcht nachts allein durch die Nachbarschaft zu gehen'/ percrisk 'Subjektives Sicherheitsgefuehl in eigener Nachbarschaft'. value labels fearpatt 1 'weniger als 1-mal pro Monat' 2 '1-mal im Monat' 3 '1-mal in der Woche' 4 'jeden Tag'/ fearburg 1 'weniger als 1-mal pro Monat' 2 '1-mal im Monat' 3 '1-mal in der Woche' 4 'jeden Tag'/ fearwalk 1 'ja' 0 'nein' / percrisk 1 'sehr sicher' 2 'ziemlich sicher' 3 'ziemlich unsicher' 4 'sehr unsicher'. * Recodierung der fehlenden Angaben auf den Wert „9" für einstellige Variablen. missing values fearpatt fearburg fearwalk percrisk (9). freq /variables=fearpatt to percrisk. recode frau,minority (SYSMIS=9). missing values frau, minority (9). freq /variables=frau minority. recode dvicburg (SYSMIS=9). recode dvicviol (SYSMIS=9). missing values dvicburg,dvicviol (9). freq /variables=dvicburg,dvicviol. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 117 * Aufbereitung der Nachbarschaftsindikatoren als GRAND-MEAN-CENTERED Variablen. * Zentrierung am Mittelwert der Gesamtstichprobe. compute ngmcethh=nethhet - 9.11. compute ngmcpmin=(aminori - 0.1515)*100. compute ngmcbusy=mbusypla - 3.4427. compute ngmcintg=mnintegr - 3.5140. compute ngmcinci=mincivil - 1.3240. compute ngmcburg=(avicburg - 0.1879)*100. compute ngmcviol=(avicviol - 0.0475)*100. var labels ngmcethh 'Nachbarschaft (GMC): Ethnische Heterogenitaet' / ngmcpmin 'Nachbarschaft (GMC): Prozentsatz ethnischer Minoritaeten'/ ngmcbusy 'Nachbarschaft (GMC): Mittlere soziale Dichte'/ ngmcintg 'Nachbarschaft (GMC): Mittelwert soziale Integration'/ ngmcinci 'Nachbarschaft (GMC): Mittelwert Zeichen des Verfalls'/ ngmcburg 'Nachbarschaft (GMC): Prozent Einbruchsopfer i.l.2 J.'/ ngmcviol 'Nachbarschaft (GMC): Prozent Gewaltopfer i.l.2 J.'. * Bildung der Interaktionseffekte: MINORITY mit NGMCPMIN,NGMCINTG,NGMCINCI. compute iminpmin=minority*ngmcpmin. compute iminintg=minority*ngmcintg. compute imininci=minority*ngmcinci. execute. * Erstellung des Einservektors für die Regressionskonstante in MIXOR. compute one=1. * Rekodierung der „fehlenden Werte“ der mehrstelligen Kontextvariablen „99". recode ngmcethh,ngmcpmin,ngmcbusy,ngmcintg,ngmcinci,ngmcburg,ngmcviol, iminpmin,iminintg,imininci gmcalter gmcincom gmcdanga gmccarry gmcsafep gmcegood gmcgbarr gmcasses (SYSMIS=99). missing values ngmcethh,ngmcpmin,ngmcbusy,ngmcintg,ngmcinci,ngmcburg,ngmcviol, gmcalter gmcincom gmcdanga gmccarry gmcsafep gmcegood gmcgbarr gmcasses iminpmin,iminintg,imininci (99). freq /variables= ngmcethh,ngmcpmin,ngmcbusy,ngmcintg,ngmcinci,ngmcburg,ngmcviol,gmcalter, gmcincom,gmcdanga,gmccarry,gmcsafep,gmcegood,gmcgbarr,gmcasses,one . recode livalone corner (SYSMIS=9). missing values livalone corner (9). freq /variables=livalone corner. * Umstellung auf den Punkt als Dezimaltrenner. set decimal=dot. * Herausschreiben des aufbereiteten ASCII-Rohdatensatz: MIETHE3.DAT. write outfile='D:\LEHRE\METH6W2K\multilev\miethe\SPSSFWIN\miethe3.dat' table / blockict probnr one fearpatt fearburg fearwalk percrisk dvicburg dvicviol frau minority gmcalter gmcincom gmcdanga gmccarry gmcsafep gmcegood gmcgbarr gmcasses corner livalone ngmcbusy ngmcinci ngmcintg ngmcpmin ngmcethh ngmcburg ngmcviol iminpmin,iminintg,imininci (F4.0,1X,F5.0,1X,9(F1.0,1X), 8(F8.4,2X), 2(F1.0,1X),10(F9.4,1X)) . execute. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 118 Mit Hilfe der Table-Option des Write-Befehls von SPSS erhalten wir einen Auflistung der in die Datei „miethe3.dat“ herausgeschriebenen Variablen einschließlich ihrer Spaltenangaben. Diese Übersicht benötigen wir, um später in MIXOR über die zugehörige Variablennummer die entsprechenden Merkmale im Modell als endogene oder exogene Variablen zu spezifizieren und ihre fehlenden Werte zu vereinbaren. Daher ist es erforderlich, das SPSS-Ausgabeprotokoll um die Angabe der Variablennummer zu ergänzen. Write will generate the following Nr. Variable 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. BLOCKICT PROBNR ONE FEARPATT FEARBURG FEARWALK PERCRISK DVICBURG DVICVIOL FRAU MINORITY GMCALTER GMCINCOM GMCDANGA GMCCARRY GMCSAFEP GMCEGOOD GMCGBARR GMCASSES CORNER LIVALONE NGMCBUSY NGMCINCI NGMCINTG NGMCPMIN NGMCETHH NGMCBURG NGMCVIOL IMINPMIN IMININTG IMININCI Rec Start End Format 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 6 12 14 16 18 20 22 24 26 28 30 40 50 60 70 80 90 100 110 112 114 124 134 144 154 164 174 184 194 204 4 10 12 14 16 18 20 22 24 26 28 37 47 57 67 77 87 97 107 110 112 122 132 142 152 162 172 182 192 202 212 F4.0 F5.0 F1.0 F1.0 F1.0 F1.0 F1.0 F1.0 F1.0 F1.0 F1.0 F8.4 F8.4 F8.4 F8.4 F8.4 F8.4 F8.4 F8.4 F1.0 F1.0 F9.4 F9.4 F9.4 F9.4 F9.4 F9.4 F9.4 F9.4 F9.4 F9.4 Die „miethe3.dat“-Datei weist die folgende hierarchische Datenstruktur auf, bei der die Fälle innerhalb ihrer Nachbarschaft geschachtelt sind. Aus Platzgründen stellt das Bildschirmfenster des Programmer‘s File Editor nur jeweils 80 von insgesamt 212 Spalten dar. Die erste Spalte enthält die Level-2-Nachbarschaftskennung, die zweite die Probandennummer, gefolgt vom Vektor der Einsen sowie den ordinalen bzw. binären Kriteriumsvariablen zur Risikoeinschätzung, Furcht vor Kriminalität sowie den eigenen Opfererfahrungen. Danach schließen sich die zuvor Grand-Mean-zentrierten exogenen Individual- und Kontextmerkmale an. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - Abb. 45: WiSe 2001/2002 119 Hierarchische Datenstruktur der für MIXOR aufbereiteten Miethe-Daten (miethe3.dat) 8.2Schätzung des Fixed-Logit-Intercept-Modells mit MIXOR Für die Berechnung des globalen Likelihood-Ratio-χ2-Tests und diverser Pseudo-R2 benötigen wir die Log-Likelihood bzw. Deviance des logistischen Nullmodells, welches nur die Regressionskonstante als „fixed effect“ enthält. Mit ihm schätzen wir kontextübergreifend das Logit der Wahrscheinlichkeit, Opfer eines Raubüberfalls oder einer Körperverletzung zu werden. Nach dem Aufruf von MIXOR steht uns dessen in Abb. 46 gezeigtes Hauptmenü zur Verfügung. MIXOR bietet uns die Möglichkeit, zwei maximal 60 Zeichen lange Titelzeilen zu definieren, mit denen es später das Ausgabeprotokoll kommentiert. Während die erste Zeile die näheren Angaben zum Datensatz enthält, dokumentiert die zweite Zeilen den geschätzten Modelltypus. MIXOR unterscheidet drei Arten von Dateitypen, die es für seinen Ablauf benötigt. Der „Definition File Name:“ enthält als Kommandodatei alle zur Steuerung von MIXOR und zur Modellspezifikation benötigten Befehle in der für FORTRAN-Programme üblichen Kurzform, die noch aus den Zeitalter der Lochkarten stammend, in bestimmten Spaltenbereichen Zahlenoder Buchstabenangaben erwartet. In dieser speziellen Kommandodatei legt MIXOR alle relevanten Befehle aus den Steuermenüs ab, so dass wir diese Datei jederzeit per doppelten linken Mausklick aus dem Dateimenü auswählen und über die Bedienungsmenüs verändern können. Über das Eingabefeld „Input File Name:“ geben wir die einzulesende ASCII-Rohdatendatei an, welche die Variablen jeweils getrennt durch ein Leerzeichen enthält. Die Anzahl der im Datensatz enthaltenen Variablen spezifizieren wir im Feld „Number of Data Fields“. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 120 Diejenige Variable, welche die Kontextkennung der Level-2-Einheiten enthält, geben wir über ihre Ordnungs-/Spaltennummer im Feld „Field for Level-2-Units:“ an. In unserem Fall handelt es sich um die erste Variable des Rohdatensatzes. Auf einen Ausdruck der Messwerte der Kontexteinheiten verzichten wir, indem wir im Feld „Level-2 Units to List:“ den Wert Null eintragen. MIXOR bietet die Möglichkeit, die Level-2-Einheit über eine Designvariable zu gewichten, die über eine nachträgliche Randanpassung an die Grundgesamtheit die Repräsentativität der Kontexteinheiten oder bei Messwiederholungen der Personen im Nachhinein garantieren soll. Hierzu wählen wir im Feld „Unit Weighting:“ die Option „differential“ anstatt der Voreinstellung „equal“. MIXOR fordert dann die Angabe der Gewichtungsvariable über ihre zugehörige Ordnungs-/Spaltennummer an. Über das Feld „Function Model“ bietet die MIXOR die Möglichkeit zwischen verschiedenen Verteilungs- bzw. „Link“-Funktionen zu wählen. Neben der logistischen, der kumulativen Normalverteilung stellt es die doppelt logarithmische (log-log) sowie deren komplementäre Variante (comp.log-log) zur Verfügung. In unserem Fall wählen wir die logistischen Verteilungsfunktion aus, um eine Vergleichbarkeit mit den HLM 5 Ergebnissen zu gewährleisten. Die Felder „Convergence Criterion:“, „Number of Quadrature Points:“, „Prior Distribution“ sowie „Prior for Numerical Quadrature:“ beziehen sich auf rein technische Angaben für die „Maximum-Marginal-Likelihood“-Schätzung, wobei wir für die zu schätzende Modellfolge die technischen Voreinstellungen beibehalten. Abb. 46: MIXOR-Hauptmenü für das Einlesen des Rohdatensatzes, Festlegung der Ausgabedatei sowie des zu schätzenden Modelltyps Im Feld „Output File Name“ geben wir den Namen der Ausgabe-/ Protokolldatei an, wobei MIXOR per Voreinstellung denselben verwendet wie die Befehlsdatei. Im Variablenmenü spezifizieren wir anschließend das zu schätzende Modell, indem wir die zugehörigen Variablen über ihre Ordnungs-/Spaltennummer aufrufen. Zuerst wählen wir unsere ordinale Kriteriumsvariablen im Feld „Ordinal Outcome Variable Field:“ aus. In unserem Fall entspricht der Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 121 Variablen DVICVIOL die neunte Datenspalte. Über das Feld „Ordinal Outcome Var. Label:“ vergeben wir ein maximal acht Zeichen langes Etikett für die Kriteriumsvariable, unter dem sie im Ausgabeprotokoll eindeutig geführt wird. Im Feld „Ordinal Outcome Variable Categories:“ geben wir die Anzahl der Kategorien von Y an und definieren ihre zugehörigen Zahlenkodes im rechts daneben liegenden Feld. Da das „fixed-intercept-logit-model“ keine Varianzkomponente enthält, setzen wir im Feld „Number of Random Effects:“ den Wert auf Null. Im rechts daneben liegenden Feld „Number of Explanatory Var.Effects:“ geben wir an, dass wir nur den „festen Effekt“ der logistischen Regressionskonstante schätzen wollen. Im darunter liegenden Auswahlfeld geben wir unter „Field“ an, an welcher Spaltenposition sich der Vektor der Einsen befindet, den wir für die Schätzung der Zweiebenenmodelle benötigen und den MIXOR nicht automatisch bildet. Für die zuschätzenden „fixed“ und „random“-Effekte vergeben wir jeweils ein maximal acht Zeichen langes Etikett, das zu seiner Bezeichnung in der Ausgabedatei verwendet wird. In unserem Fall geben wir die Abkürzung „intrcpt“ für die Regressionskonstante an. Abb. 47: MIXOR-Untermenü für die Definition der „fixed-“ und „random-effects“ sowie ihrer Etiketten Wenn wir im Feld „Perform Crosstabulation:“ die Option „yes“ wählen, fordert MIXOR uns auf, die Spaltennummer und Ausprägungsanzahl des exogenen Merkmals für die zu berechnende Kreuztabelle mit der abhängigen Variablen anzugeben. Im Menü „Starting Values“ bietet uns MIXOR neben der automatischen Wahl der Startwerte die Möglichkeit an, sie für die einzelnen „fixed“- und „random-effects“ per Hand vorzugeben. Die bisherigen Erfahrungen zeigen aber, dass die automatisch gewählten Startwert meistens zu einer konvergierenden Lösung führen. Daher sollten wir die Startwerte nur dann manuell eingeben, wenn der Lösungsalgorithmus zuvor nicht konvergiert hat. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 Abb. 48: MIXOR-Untermenü für die Festlegung der Startwerte für die Maximum-Marginal-Likelihood-Schätzung Abb. 49: MIXOR-Untermenü für die Definition der „fehlenden Werte“ der verwendeten endogenen und exogenen Variablen 122 Im „Missing Values“-Menü geben wir für die Kriteriumsvariable und die exogenen Merkmale Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 123 die Kodes für die „fehlenden Angaben“ an, sofern wir deren Existenz mit der Angabe des Werts „true“ im „Missing Values Present:“-Feld bejahen. In unserem Fall haben wir den Wert „9" für die fehlenden Angaben der abhängigen Variablen und des Einser-Vektor der logistischen Regressionskonstante gewählt. Abb. 50: MIXOR-Untermenü für weitere Modelloptionen wie Rechtszensierung, Vorzeichenwechsel des Linearen Prädiktors sowie speziellere Interaktionseffekte Im „Advanced“-Menü die Möglichkeit, das „proportional hazard model“ der Ereignisdatenanalyse zu spezifizieren, bei dem zunächst wir die für die Rechtszensierung zuständige Statusvariable auswählen und anstatt seiner Subtraktion die Addition des linearen Prädiktors fordern. Im Feld „Transform to Estimate:“ wir die Schätzung von gruppenspezifischen Schwellenwerten vereinbaren. Wählen wir beim klassischen ordinalen Logitmodell die Option „Model Terms: subtract“ so führt dies dazu, dass der Effekt des „linearen Prädiktors“ zum Schwellenwert addiert wird. Inhaltlich gesehen führt dies dazu, dass wir dann ein Modellen spezifizieren, das nicht mehr das Verharren bis zum Schwellenwert sondern direkt sein Überspringen schätzt. Hierdurch drehen sich die Vorzeichen der logistischen Steigungskoeffizienten um, wie dies bei den kumulativen Logitmodellen in BMDP und SAS der Fall ist. Wir fixieren zusätzlich den Erwartungswert des „random-effecs“ auf Null im Feld „Random Effect Mean Vector:“ , so dass er als Erwartungswert den Wert des geschätzten „fixed-effects“ annimmt. Diese technischen Optionen behalten wir für alle in MIXOR zu schätzenden Modell bei. Nach der erfolgreichen Schätzung des Modells ruft MIXOR seinen Editor für die Ausgabedatei auf, der aber nur das Ausdrucken der Protokolldatei „dvicviol.out“ gestattet. Letztere können wir aber mit jedem beliebigen Editor öffnen und bearbeiten. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - Abb. 51: WiSe 2001/2002 124 MIXOR-Ausgabefenster mit der Druckoption für das Ausgabeprotokoll MIXOR speichert das Ausgabeprotokoll der Abb. 51 in der Datei: „dviolm0.out“, die sich jederzeit nachbearbeiten läßt: MIXOR - The program for mixed-effects ordinal regression analysis (version 2) Seattle Viktimisierungsstudie 1990 Miethe Daten ICPSR 2/1997 Opfer von Gewaltkriminalitaet: Fixed-Logit-Intercept-Model Response function: logistic Covariate(s) and random-effect(s) mean subtracted from thresholds ==> positive coefficient = positive association between regressor and ordinal outcome Numbers of observations ----------------------Level 1 observations = 5301 <- Anzahl gültiger Fälle nach fallweisem Ausschluß fehlender Werte Descriptive statistics for all variables ---------------------------------------Variable Minimum Maximum Mean Stand. Dev. dvicviol intrcpt 0.00000 1.00000 1.00000 1.00000 0.04754 1.00000 0.21281 0.00000 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 125 Categories of the response variable dvicviol -------------------------------------------Category Frequency Proportion 0.00 1.00 5049.00 252.00 0.95246 0.04754 Starting values --------------covariates -2.998 --------------------------------------------------------* Final Results - Maximum Marginal Likelihood Estimates * --------------------------------------------------------Total Iterations Log Likelihood Deviance (-2logL) Ridge Variable -------intrcpt = = = = 1 -1013.561 2027.122 0.000 Estimate ------------2.99752 Stand. Error -----------0.06455 Z ------------46.43930 p-value -----------0.00000 (2) note: (1) = 1-tailed p-value (2) = 2-tailed p-value Kontext- und personenübergreifend beträgt das geschätzte Logit der Viktimisierung durch Gewaltdelikte wie Raub und Körperverletzung -2,99752. Dies entspricht einer Opferwahrscheinlichkeit von 4,75 %, dem Anteilswert der Ausprägung Eins von DVICVIOL in Prozent. Die zugehörige Log-Likelihood beträgt -1013,561. Wenn wir diesen Wert mit -2 multiplizieren, erhalten wir die zugehörige Deviance von 2027,122. Beide dienen uns als Basis für die Berechnung des globalen Likelihood-Ratio-χ2-Tests sowie der auf ihnen beruhenden Pseudo-R2e von McFadden und Aldrich&Nelson. 8.3Schätzung des Random-Intercept-Only-Logit-Modell mit MIXOR Die folgende Darstellung beschränkt sich aus Platzgründen allein auf für die Spezifikation der Alternativmodelle notwendigen Änderungen in den MIXOR „Variables“ und „Missing Values“ Menüs. Im „Configuration“-Menü ändern wir lediglich neben der zweiten Titelzeile die laufenden Nummern der Befehls- und Ausgabedateien. In unserem ersten Modell schätzen wir analog zum Vorgehen der HLM-Analysen das „Random-Intercept-Only“-Logitmodell, dessen Befehlssatz wir in der Datei „dviolm1.def“ ablegen. Hierzu fordern wir im Variablenmenü die Angabe eines kontextabhängigen Effektes für die Regressionskonstante an, wählen den Vektor der Einsen über seine Ordnungs-/Spaltennummer aus und vereinbaren mit „intrcpt“ dasselbe Etikett wie für den „fixed-effect“. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 Abb. 52: Spezifikation des „Random-Intercept-Only-Logitmodel“ Abb. 53: Definition des „fehlenden Werts 9“ für die kontextabhängige Regressionskonstante 126 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 127 Wir erhalten von MIXOR in der Datei „dviolm1.out“ das folgende Ausgabeprotokoll: MIXOR - The program for mixed-effects ordinal regression analysis (version 2) Seattle Viktimisierungsstudie 1990 Miethe Daten ICPSR 2/1997 Opfer von Gewaltkriminalitaet: Random-Intercept-Only-Logit-M. Response function: logistic Random-effects distribution: normal Covariate(s) and random-effect(s) mean subtracted from thresholds ==> positive coefficient = positive association between regressor and ordinal outcome Numbers of observations ----------------------Level 1 observations = Level 2 observations = 5301 <- Anzahl der Fällle innerhalb der Kontexte 300 <- Anzahl der Kontexte Anzahl der Fälle pro Nachbarschaftú The number of level 1 observations per level 2 unit are: 18 19 19 18 18 18 18 18 17 18 18 18 18 18 18 16 18 18 18 18 18 17 18 18 18 18 18 16 14 17 18 18 19 18 20 18 18 18 20 18 17 18 18 17 13 18 18 17 18 19 18 18 17 18 15 18 18 18 18 18 15 17 16 19 18 18 18 16 18 18 21 18 18 18 18 18 18 15 17 17 18 20 16 18 18 16 17 18 18 18 18 17 16 17 18 18 17 17 21 20 18 16 18 17 18 18 17 18 18 18 19 18 18 18 21 18 19 16 18 18 17 16 18 16 16 17 19 18 18 19 17 18 18 18 18 18 18 18 18 16 21 16 17 15 16 18 19 18 18 18 18 18 17 18 17 15 18 18 17 18 18 18 18 19 15 19 18 18 18 18 18 18 18 18 18 17 19 18 18 18 16 18 18 18 18 17 18 18 19 17 14 18 18 18 19 17 17 18 18 18 17 18 18 16 17 17 18 18 19 19 19 16 16 17 17 18 18 18 18 18 18 18 18 18 17 18 17 18 17 18 18 18 18 18 17 18 17 17 18 19 19 18 18 18 17 18 19 18 18 18 18 16 18 18 14 18 17 18 17 18 18 18 16 18 18 18 18 18 18 18 15 17 19 18 18 17 18 17 16 16 18 17 17 18 17 20 16 16 18 18 16 18 18 17 17 18 15 18 19 18 Descriptive statistics for all variables ---------------------------------------Variable Minimum Maximum Mean Stand. Dev. dvicviol intrcpt intrcpt 0.00000 1.00000 1.00000 1.00000 1.00000 1.00000 0.04754 1.00000 1.00000 0.21281 0.00000 0.00000 Categories of the response variable dvicviol <-Verteilung der Kriteriumsvariablen -------------------------------------------Category Frequency Proportion 0.00 1.00 5049.00 252.00 0.95246 0.04754 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 128 Starting values --------------covariates var. terms 0.000 0.574 ==> The number of level 2 observations with non-varying responses = 161 ( 53.67 percent ) <-Angabe der Anzahl von Nachbarschaften ohne Varianz auf der Kriteriumsvariablen --------------------------------------------------------* Final Results - Maximum Marginal Likelihood Estimates * --------------------------------------------------------Total Iterations Quad Pts per Dim Log Likelihood Deviance (-2logL) Ridge Variable -------intrcpt = = = = = 16 10 -977.802 1955.604 0.000 Estimate ------------3.45478 Stand. Error -----------0.12433 Z ------------27.78749 Random effect variance term (standard deviation) intrcpt 1.03675 0.13006 7.97109 p-value -----------0.00000 (2) 0.00000 (1) note: (1) = 1-tailed p-value (2) = 2-tailed p-value Calculation of the intracluster correlation ------------------------------------------residual variance = pi*pi / 3 (assumed) cluster variance = (1.037 * 1.037) = 1.075 intracluster correlation = 1.075 / ( 1.075 + (pi*pi/3)) = 0.2461 Im Gegensatz zu HLM 5 berechnet MIXOR automatisch die Interklassenkorrelation ρ2 nach der bereits vorgestellten Formel. Die Kontextzugehörigkeit der Befragten erklärt maximal 24,61% ihres Viktimisierungslogits durch Gewaltdelikte. Dieser Erklärungsbeitrag des Universums von Nachnachschaftsmerkmalen liegt um 2,36 % höher als derjenige der Laplace6-Schäzung mit HLM 5 (ρ2= 0,225). Dies ist darauf zurückzuführen, dass geschätzte Varianz der kontextabhängigen Logitkonstanten in MIXOR mit 1,075 höher als in HLM 5 mit einem Wert von 0,9415 ausfällt. MIXOR gibt das Ausmaß der Variation des kontextabhängigen Effekts jeweils als seine geschätzte Standardabweichung an. Der von Hedeker&Gibbons mit Z bezeichnete einseitige T-Test prüft, ob die geschätzte Standardabweichung des „random effect“ signifikant von Null verschieden ist. Mit einem Wert von -3,455 liegt die logistische Regressionskonstante des „fixed effects“ nur knapp über derjenigen des mit HLM 5 geschätzten R-I-O-Logitmodells. Ihr zweiseitiger T-Test zeigt, dass sie ebenfalls signifikant von Null verschieden ist. Unter adäquater Berücksichtigung der geklumpten Stichprobenstruktur erwarten wir ein durchschnittliches Risiko, Opfer einer Gewalttat innerhalb der eigenen Nachbarschaft zu werden, von 3,06 %. Mit Hilfe des globalen Likelihood-Ratio-χ2 überprüfen wir, ob alle geschätzten „fixed“- und „random-effects“ signifikant von Null verschieden sind. Mit der Log-Likelihood des logisti- Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 129 schen Nullmodells berechnen wir ihn folgendermaßen: Globaler L.R.χ2&Test ' DevianceNullmodell & DevianceM.1 ' 2.027,122 & 1955,605 ' 71,52 Anzahl der Freiheitsgrade ' ParameterzahlM.1 & ParameterzahlNullmodell ' 2 & 1 ' 1 Kritischer χ2&Wert (F.G.' 1 ; α ' 0,05 ) ' 3,84 Da L.R. χ2 $ χ2kritisch ist; muß H0 verworfen werden ! Mit einer Irrtumswahrscheinlichkeit von weniger als 5 %, verwerfen wir die Nullhypothese des globalen Likelihood-Ratio-χ2-Werts. Wir können daher davon ausgehen, dass die geschätzte maximale Varianzaufklärung der Opferlogits auch für die Grundgesamtheit aller Nachbarschaften Seattles gilt. 8.4Schätzung des Random-Intercept-/Random-Slope-Logit-Modell mit MIXOR Als nächsten Schritt schätzen wir mit MIXOR das „random-intercept-/random-slope“-Logitmodell (M.2), um die Variabilitäten der Viktimisierungslogits der Referenzgruppe sowie ihrer farbigen Nachbarn abzuschätzen. Als exogene Individualmerkmale verwenden wir dieselben wir im HLM 5 Modell, um die Vergleichbarkeit der Ergebnisse zu gewährleisten. Wir legen die zugehörigen Steuerbefehle und das Ausgabeprotokoll in den Dateien „dviolm2.def“ bzw. „dviolm2.out“ ab. Im „Variables“-Menü definieren wir zunächst die sieben exogenen Individualmerkmale, wobei wir dieselben Variablennamen wie in SPSS benutzen. Die Regressionskonstante („intrcpt“) mit dem Vektor von Einsen zählt hierbei als „Erklärungsmerkmal“ mit. Als exogene feste Individualmerkmale vereinbaren wir die Variablen über ihre Ordnungs-/Spaltennummern und ihren Variablennamen aus SPSS: intrcpt (3), gmcalter (12), frau (10), minority (11), gmincome (13), livalone (21) sowie gmcdanga (14). Zusätzlich fordern wir einen zweiten „random effect“ an, indem wir die Spaltenzahl 11 und das Wort „minority“ als Etikett eintragen. Es empfiehlt sich für die „random“ und „fixed effects“ dieselben Labels zu verwenden, um den Ausgabeprotokoll übersichtlich und inhaltlich eindeutig zu gestalten. Im „Missing Values“-Menü geben wir die Kodes für die fehlenden Angaben bei den exogenen Merkmalen an, wobei wir mit Ausnahme der Grand-Mean-zentrierten Variablen den Wert „9" verwenden. Bei letzteren definieren wir den Wert „99" als fehlende Angabe. Im „Advanced“-Menü bietet uns MIXOR die Option an, die Kovarianz bzw. Korrelation der beiden kontextabhängigen Effekte zu schätzen. Bejahen wir im Feld „Random Effects Grouping“ mit „yes“ die Angabe, dass es sich bei den kontextabhängigen Schätzern um solche für Dummyvariablen handelt, so schätzt MIXOR deren Kovarianz nicht. Behandeln wir sie hingegen als „metrische Variablen“, so ermittelt MIXOR per Voreinstellung die Kovarianz ihrer kontextabhängigen Schätzer. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 Abb. 54: Variablen-Menü-Eintragungen des Alternativmodells 2 Abb. 55: „Missing Values“-Menü Eintragungen für die exogenen Merkmale des Alternativmodell 2 130 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 131 Abb. 56: Zusätzliche Optionen des MIXOR „Advanced“-Menü bei Alternativmodell 2 In der Datei „dviolm2.out“ legt MIXOR das folgende Ausgabeprotokoll ab: MIXOR - The program for mixed-effects ordinal regression analysis (version 2) Seattle Viktimisierungsstudie 1990 Miethe Daten ICPSR 2/1997 Gewaltopfer: Random-Intercept-Random-Slope-Logitmodell Response function: logistic Random-effects distribution: normal Covariate(s) and random-effect(s) mean subtracted from thresholds ==> positive coefficient = positive association between regressor and ordinal outcome Numbers of observations ----------------------Level 1 observations = Level 2 observations = 4659 300 The number of level 1 observations per level 2 unit are: 16 18 18 17 13 15 15 18 17 11 15 17 11 17 19 15 13 16 16 15 16 16 14 17 18 16 14 14 15 17 18 14 17 14 17 16 19 13 16 16 10 13 15 13 19 18 14 15 14 17 15 19 17 18 12 16 17 13 14 16 17 10 14 15 17 14 17 18 16 14 16 17 16 18 14 16 15 18 16 18 17 15 16 17 15 17 17 16 13 13 14 16 14 17 13 15 16 17 17 15 17 15 13 16 17 17 17 16 16 16 16 18 16 17 16 15 15 17 15 15 14 18 15 13 14 18 19 12 12 14 18 15 18 14 17 17 18 17 13 14 13 17 14 15 18 15 16 17 17 14 16 18 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse 15 14 16 17 16 17 14 12 17 17 13 15 13 16 17 16 12 17 16 15 12 12 17 14 18 18 15 18 13 14 15 18 14 14 17 17 15 14 15 15 17 16 17 16 12 15 16 15 16 14 15 17 16 16 18 14 17 15 18 15 13 14 16 13 16 17 18 16 21 13 10 12 14 15 14 14 16 18 14 14 16 17 16 16 15 14 15 14 16 15 17 15 19 15 14 18 WiSe 2001/2002 15 18 16 12 16 13 15 12 17 16 15 14 16 17 16 17 18 18 17 16 16 14 17 15 18 16 13 13 17 17 10 132 17 18 17 15 16 15 14 15 13 16 14 15 17 16 16 15 15 15 14 16 15 Descriptive statistics for all variables ---------------------------------------Variable Minimum Maximum Mean Stand. Dev. dvicviol intrcpt minority intrcpt gmcalter frau minority gmincome livalone gmcdanga 0.00000 1.00000 0.00000 1.00000 -31.57670 0.00000 0.00000 -2.00000 0.00000 -0.87500 1.00000 1.00000 1.00000 1.00000 48.42330 1.00000 1.00000 4.00000 1.00000 2.12500 0.04786 1.00000 0.14746 1.00000 -0.81709 0.48895 0.14746 0.35716 0.25563 0.02584 0.21350 0.00000 0.35460 0.00000 17.49663 0.49993 0.35460 1.42055 0.43626 0.81556 Categories of the response variable dvicviol -------------------------------------------Category Frequency Proportion 0.00 1.00 4436.00 223.00 0.95214 0.04786 Starting values --------------covariates var. terms 0.000 1.814 0.000 0.000 0.000 0.907 0.000 0.000 0.000 0.000 ==> The number of level 2 observations with non-varying responses = 169 ( 56.33 percent ) --------------------------------------------------------* Final Results - Maximum Marginal Likelihood Estimates * --------------------------------------------------------Total Iterations Quad Pts per Dim Log Likelihood Deviance (-2logL) Ridge = = = = = 32 10 -852.067 1704.134 0.000 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse Variable -------intrcpt gmcalter frau minority gmincome livalone gmcdanga Estimate ------------3.56389 -0.00622 0.02909 0.38785 -0.15358 0.48888 0.29239 Stand. Error -----------0.17673 0.00457 0.16133 0.33333 0.05128 0.17674 0.09741 WiSe 2001/2002 Z ------------20.16518 -1.35898 0.18033 1.16355 -2.99500 2.76606 3.00172 133 p-value -----------0.00000 (2) 0.17415 (2) 0.85690 (2) 0.24461 (2) 0.00274 (2) 0.00567 (2) 0.00268 (2) Random effect variance&covariance terms (Cholesky of var-covariance matrix) intrcpt 0.92913 0.15277 6.08203 0.00000 (1) covariance -0.73524 0.32000 -2.29762 0.02158 (2) minority 0.30419 1.02492 0.29679 0.38331 (1) note: (1) = 1-tailed p-value (2) = 2-tailed p-value Calculation of the random effects variance-covariance matrix -----------------------------------------------------------intrcpt variance = (0.929 * 0.929) = 0.863 covariance = (0.929 * -.735) = -.683 minority variance = (-.735 * -.735) + (0.304 * 0.304) = 0.633 Covariance expressed as a correlation = -.924 Bevor wir die einzelnen Effekt näher betrachten, überprüfen wir zunächst mit Hilfe des globalen Likelihood-Ratio-χ2, ob alle „fixed“- und „random-effects“ in der Grundgesamt signifikant von Null verschieden sind. Globaler L.R.χ2&Test ' DevianceNullmodell & DevianceA.M.2 ' 2.027,122 & 1704,134 ' 322,99 Anzahl der Freiheitsgrade ' ParameterzahlA.M.2 & ParameterzahlNullmodell ' 10 & 1 ' 9 Kritischer χ2&Wert (F.G.' 9 ; α ' 0,05 ) ' 16,92 Da L.R. χ2 $ χ2kritisch ist; muß H0 verworfen werden ! Mit einer Irrtumswahrscheinlichkeit von deutlich weniger als 5 % können wir die Nullhypothese des globalen Likelihood-Ratio-χ2-Tests verwerfen. Mindestens einer unserer geschätzten „fixed“ und „random-effects“ ist in der Grundgesamtheit signifikant von Null verschieden. Um die Modellanpassung im Sinne der praktischen Signifikanz zu bestimmen, verwenden wir zur Bestimmung der praktischen Signifikanz neben dem Deviance-PRE-R2 diejenigen von McFadden sowie Aldrich&Nelson (1984) mit der von Veall&Zimmermann (1994) vorgeschlagenen Korrektur an seiner empirischen Obergrenze. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 134 Berechnung des Proportional&Reduction&of&Error&R 2 auf der Basis der Deviancen von Null&und Alternativmodell 2: PRE&R 2 ' DevianceNullmodell & DevianceA.M.2 ' DevianceNullmodell McFadden Pseudo&R 2 ' 1 & DevianceA.M.2 DevianceNullmodell 2.027,12 & 1.704,13 ' 0,1593 2.027,12 ' 1 & 1.704,13 ' 0,1593 2.027,12 Da das McFadden Pseudo-R2 und das PRE-R2 von ihrem Konstruktionsprinzip her identisch sind, liefert sie beide denselben Wert für die auf die exogenen Merkmale zurückzuführende proportionale Reduktion der Deviance. Sie beträgt in beiden Fällen rd. 15,93%. Einen etwas realistischeren Aufschluß über die Modellanpassung vermittelt das Aldrich&Nelson Pseudo-R2 mit der von Veall&Zimmermann vorgeschlagenen Korrektur an seiner Obergrenze. Berechnung des Aldrich&Nelson Pseudo&R 2 mit Veall&Zimmermann&Korrektur für das Zweiebenen&Logitmodell M.2: 2 ( (lnLA & lnL0 ) Aldrich&Nelson&Pseudo R 2V&Z ' 2 ( (lnL A & lnL0 ) % 3,29(n &2 ( lnL0 3,29 ( n & 2 ( lnL0 L.R.&χ2A.M.2 322,99 322,99 % 3,29 ( 4659 0,0206 ' ' ' DevianceM 2027,22 0,1168 0 2027,22 % 3,29 ( 4659 DevianceM % 3,29 ( n L.R.&χ2A.M.2 % 3,29 ( n 0 ' 0,1764 oder 17,65 % Unsere exogenen Individualmerkmale und die Varianzkomponenten erklären rd. 17,65% der Varianz der geschätzten Viktimisierungslogits bei Gewaltdelikten. Dieser Anteil fällt im Vergleich zum Deviance PRE-R2 oder McFadden-Pseudo-R2 etwas höher aus und belegt eine für Feldstudien relativ gute Modellanpassung. Um die Interpretation der Effekte und ihren Vergleich mit denjenigen von HLM 5 zu erleichtern, tragen wir sie zunächst in das zugehörige Gleichungssystem ein. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 135 Die Schätzgleichungen des Logit&Random&Intercept&Random&Slope&Model : M.2 Level / Ebene 2: Between&Context&Regression Logistic Random Intercept: β 0 j 2 a) β 0 j ' &3,56( % u 0 j Fixed Logistic Slopes: 2 b) β 1 j ' & 0,01 2 c) β 2 j ' % 0,03 Random Logistic Slope: β 3 j 2 d) β 3 j ' % 0,39 % u 3 j Fixed Logistic Slopes: 2 e) β 4 j ' & 0,15( 2 f) β 5 j ' % 0,49( 2 g) β 6 j ' %0,29( Level / Ebene 1: Logistic Within&Context Regression 1) ln P ( DVICVIOL ' 1) 1 & P ( DVICVIOL ' 1 ) ' β 0 j % β 1 j ( ( ALTERì j& ALTER.. ) % β 2 j ( FRAU i j ij % β 3 j ( MINORITY ij % β 4 j ( ( INCOME ij& INCOME.. ) % β 5 j ( LIVALONE ij % β 6 j ( ( DANGACT ij& DANGACT.. ) % e ij Die geschätzten Kovarianz der kontextabhängigen logistischen Effekte stellen wir ebenfalls als Θ-Matrix dar: Kovarianzmatrix Ω der kontextabhängigen logistischen Effekte Ω' ' Pearson )s ru 0j , u3j σ2u 0j σu ( u 0j 3j σu ( u 0j 3j σ2u 3j ' 0,863() &0,683() &0,683() 0,633 ' & 0,924 Legende: () : Irrtumswahrscheinlichkeit α # 0,05 Für den Vergleich der mit MIXOR und HLM 5 geschätzten „fixed-effects“ haben wir die γ- Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 136 Koeffizienten nach der zweiten Kommastelle gerundet. Wenn wir die γ-Koeffizienten der Maximum-Marginal-Likeli-hood-Schätzung und der Laplace6-Approximation gegenüberstellen, so weichen sie mit Ausnahme der logistischen Steigung des Minoritätenstatus (γ30) nur sehr geringfügig im Bereich der zweiten Kommastelle ab. Die zugehörigen T-Test liefern nahezu identische Ergebnisse. Den γ30-Koeffizienten Farbiger schätzt MIXOR mit einem logistischen Steigungskoeffizienten von +0,39 rd. dreimal so groß wie HLM 5 (+0,13) ein. Aber beide Programme identifizieren gleichermaßen diesen Effekt als nicht statistisch signifikant. D.h., trotz der numerischen Unterschiede beider γ30-Koeffizienten begehen wir keinen Fehlschluss im Hinblick auf die Grundgesamt aller Nachbarschaften Seattles, wenn wir MIXOR anstatt HLM 5 benutzen. Für den Vergleich der geschätzten Varianzkomponenten runden wir die Elemente der Ω-Matrix beider Programme jeweils nach ihrer dritten Kommastelle. Ihre Gegenüberstellung ergibt, dass zum einen beide Programme die Varianz der kontextabhängigen logistischen Regressionskonstanten nahezu identisch einschätzen. Zum anderen zeichnen sich deutliche Unterschiede bei der geschätzten Varianz des logistischen Minderheiteneffekts sowie dessen Kovarianz mit der Regressionskonstanten ab. MIXOR schätzt die Varianz der Abweichung des Opferlogits Farbiger von demjenigen ihrer weißen Nachbarn mit einem σ2u3j-Koeffizienten von 0,633 rd. ein Drittel niedriger ein als die Laplace6-Approximation von HLM 5 (0,983). Beide Programme weisen gemäß dem zugehörigen einseitigen T-Test bzw. χ2-Test diese Varianzkomponente als statistisch nicht signifikant aus. Trotz der numerischen Differenz beider Schätzer begehen wir daher keinen Fehlschluss, wenn wir auf die Grundgesamtheit verallgemeinern. Gleichermaßen weicht die geschätzte Kovarianz der kontextabhängigen Effekt in beiden Programmen voneinander ab. Mit einem Wert von -0,43 unterschätzt HLM 5 im Vergleich zu MIXOR (-0,683) deutlich die Kovarianz bzw. Korrelation (-0,692 vs. -0,924) der beiden kontextabhängigen Effekte. In MIXOR bezieht sich der zweiseitige T-Test nicht auf die Kovarianz der kontextabhängigen Schätzer sondern auf die Cholesky-Zerlegung der zugehörigen Kovarianzmatrix. Hingegen führt HLM 5 keinen Test für die Kovarianz der kontextabhängigen Schätzer durch. Daher können wir aus inferenzstatistischer Sicht die Unterschiede der mit beiden Programmen geschätzten Kovarianzen der Level-2-abhängigen Schätzer nicht beurteilen. 8.5 Schätzung des Coefficient-as-Outcome-Logit-Modells mit MIXOR Um das Alternativmodell 4 zu schätzen, müssen wir im Variablenmenü von MIXOR die vier zu den beiden exogenen Kontextmerkmalen Minderheitenanteil und Ausmaß der sozialen Integration gehörenden „Haupt“- und „Wechselwirkungseffekte zwischen den Ebenen“ über ihre Spalten-/Ordnungsnummer im Rohdatensatz spezifizieren. Zu ihrer eindeutigen Kennzeichnung verwenden wir die Variablennamen aus SPSS. Hierdurch erhöht sich die Anzahl der zu schätzenden „fixed effects“ inklusive der logistischen Regressionskonstante auf insgesamt elf. Im Configuration-Menü haben wir zuvor für die Befehls- und Ausgabedatei den Namen „dviolm3.def /out“ vereinbart und in der zweiten Titelzeile als Modellbezeichnung „Coefficient-asOutcome-Logitmodell M.4" eingetragen. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - Abb. 57: WiSe 2001/2002 137 Benötigte zusätzliche Eintragungen für das Alternativmodell 3 in das Variables-Menü von MIXOR Für die vier zusätzlichen Variablen „gmcpmin“, „gmcintg“, „iminpmin“ und „iminintg“ vereinbaren wir im Missing-Values-Menü von MIXOR jeweils den Kode „99" für fehlende Angaben. Abb. 58: benötigte zusätzliche Eintragungen für das Alternativmodell 3 im Missing-Menü von MIXOR Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 138 Wir erhalten in der Datei „dviolm3.out“ von MIXOR das folgende Ausgabeprotokoll: MIXOR - The program for mixed-effects ordinal regression analysis (version 2) Seattle Viktimisierungsstudie 1990 Miethe Daten ICPSR 2/1997 Gewaltopfer: Coefficient-as-Outcome-Logitmodell: M.3 Response function: logistic Random-effects distribution: normal Covariate(s) and random-effect(s) mean subtracted from thresholds ==> positive coefficient = positive association between regressor and ordinal outcome Numbers of observations ----------------------Level 1 observations = Level 2 observations = 4659 300 The number of level 1 observations per level 2 unit are: 16 18 18 17 13 15 15 14 15 14 16 17 16 17 14 12 18 17 11 15 17 11 17 17 17 17 13 15 13 16 17 16 19 15 13 16 16 15 16 17 12 17 16 15 12 12 17 14 16 14 17 18 16 14 14 18 18 18 15 18 13 14 15 18 15 17 18 14 17 14 17 17 14 14 17 17 15 14 15 15 16 19 13 16 16 10 13 13 17 16 17 16 12 15 16 15 15 13 19 18 14 15 14 14 16 14 15 17 16 16 18 14 17 15 19 17 18 12 16 13 17 15 18 15 13 14 16 13 17 13 14 16 17 10 14 17 16 17 18 16 21 13 10 12 15 17 14 17 18 16 14 14 14 15 14 14 16 18 14 14 16 17 16 18 14 16 15 15 16 17 16 16 15 14 15 14 18 16 18 17 15 16 17 18 16 15 17 15 19 15 14 18 15 17 17 16 13 13 14 15 15 18 16 12 16 13 15 12 16 14 17 13 15 16 17 16 17 16 15 14 16 17 16 17 17 15 17 15 13 16 17 17 18 18 17 16 16 14 17 15 17 17 16 16 16 16 18 17 18 16 13 13 17 17 10 16 17 16 15 15 17 15 14 17 18 17 15 16 15 14 15 14 18 15 13 14 18 16 15 13 16 14 15 17 16 19 12 12 14 18 15 18 18 16 15 15 15 14 16 15 Descriptive statistics for all variables ---------------------------------------Variable Minimum Maximum Mean Stand. Dev. dvicviol intrcpt minority intrcpt gmcalter frau minority gmincome livalone gmcdanga gmcpmin gmcintg iminpmin iminintg 0.00000 1.00000 0.00000 1.00000 -31.57670 0.00000 0.00000 -2.00000 0.00000 -0.87500 -15.15000 -2.06960 -10.15000 -2.06960 1.00000 1.00000 1.00000 1.00000 48.42330 1.00000 1.00000 4.00000 1.00000 2.12500 78.18330 1.78600 78.18330 1.78600 0.04786 1.00000 0.14746 1.00000 -0.81709 0.48895 0.14746 0.35716 0.25563 0.02584 -0.00869 -0.01263 3.59405 -0.01532 0.21350 0.00000 0.35460 0.00000 17.49663 0.49993 0.35460 1.42055 0.43626 0.81556 19.31404 0.79097 13.22336 0.29598 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 139 Categories of the response variable dvicviol -------------------------------------------Category Frequency Proportion 0.00 1.00 4436.00 223.00 0.95214 0.04786 Starting values --------------covariates covariates var. terms 0.000 0.000 0.000 1.814 0.000 0.000 0.000 0.907 0.000 0.000 0.000 0.000 0.000 0.000 ==> The number of level 2 observations with non-varying responses = 169 ( 56.33 percent ) --------------------------------------------------------* Final Results - Maximum Marginal Likelihood Estimates * --------------------------------------------------------Total Iterations = 37 Quad Pts per Dim = 10 Log Likelihood = -836.624 Deviance (-2logL) = 1673.247 Ridge = 0.300 Variable Estimate Stand. Error -----------------------------intrcpt -3.50639 0.17688 gmcalter -0.00283 0.00469 frau 0.03943 0.16536 minority 0.40821 0.38073 gmincome -0.10776 0.05353 livalone 0.41046 0.18336 gmcdanga 0.26208 0.09761 gmcpmin 0.02426 0.00548 gmcintg -0.35329 0.13833 iminpmin -0.02696 0.00841 iminintg 0.18012 0.26875 Z ------------19.82333 -0.60307 0.23844 1.07217 -2.01308 2.23854 2.68507 4.42366 -2.55394 -3.20432 0.67020 p-value -----------0.00000 (2) 0.54646 (2) 0.81154 (2) 0.28364 (2) 0.04411 (2) 0.02519 (2) 0.00725 (2) 0.00001 (2) 0.01065 (2) 0.00135 (2) 0.50273 (2) Random effect variance&covariance terms (Cholesky of var-covariance matrix) intrcpt 0.81109 0.15809 5.13068 0.00000 (1) covariance -0.54127 0.39584 -1.36741 0.17150 (2) minority 0.35931 0.92946 0.38658 0.34953 (1) note: (1) = 1-tailed p-value (2) = 2-tailed p-value – Geschätzte Risidualvarianzen der kontextabhängigen Effekte: Calculation of the random effects variance-covariance matrix -----------------------------------------------------------intrcpt variance = (0.811 * 0.811) = 0.658 covariance = (0.811 * -.541) = -.439 minority variance = (-.541 * -.541) + (0.359 * 0.359) = 0.422 Covariance expressed as a correlation = -.833 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 140 Um die Modellanpassung im Sinne der statistischen und praktischen Signifikanz zu bestimmen, berechnen wir zunächst die zugehörige Likelihood-Ratio-χ2-Prüfgröße. Danach fällen wieder unsere Testentscheidung, ob sämtliche geschätzten „fixed“- und „random-effects“ in der Grundgesamtheit Null sind. Globaler L.R.χ2&Test ' DevianceNullmodell & DevianceA.M.3 ' 2.027,122 & 1.673,247 ' 353,88 Anzahl der Freiheitsgrade ' ParameterzahlA.M.3 & ParameterzahlNullmodell ' 14 & 1 ' 13 Kritischer χ2&Wert (F.G.' 13 ; α ' 0,05 ) ' 22,36 Da L.R. χ2 $ χ2kritisch ist; muß H0 verworfen werden ! Mit einer Irrtumswahrscheinlichkeit von deutlich weniger als 5 % verwerfen wir die Nullhypothese des globalen Likelihood-Ratio-χ2-Tests und gehen daher davon aus, dass die im Mehrebenenmodell berücksichtigten exogenen Individual- und Kontextmerkmale einen statistischen bedeutsamen Erklärungsbeitrag für das Logit der Viktimisierung durch Gewaltdelikte leisten. Im Vergleich zum Nullmodell beträgt die Reduktion der Deviance rd. 17,46 %, wie der folgende Formel zu entnehmen ist. Berechnung des Proportional&Reduction&of&Error&R 2 auf der Basis der Deviancen von Null&und Alternativmodell 3: PRE&R 2 ' DevianceNullmodell & DevianceA.M.3 DevianceNullmodell McFadden Pseudo&R 2 ' 1 & ' DevianceA.M.3 DevianceNullmodell 2.027,12 & 1.673,25 ' 0,1746 2.027,12 ' 1 & 1.673,25 ' 0,1746 2.027,12 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 141 Berechnung des Aldrich&Nelson Pseudo&R 2 mit Veall&Zimmermann&Korrektur für das Zweiebenen&Logitmodell M.3: L.R.&χ2A.M.3 Aldrich&Nelson&Pseudo R 2V&Z ' L.R.&χ2A.M.3 % 3,29 ( n DevianceM 0 DevianceM % 3,29 ( n 0 353,88 353,88 % 3,29 ( 4659 0,0226 ' ' 2027,22 0,1168 2027,22 % 3,29 ( 4659 ' 0,1935 oder 19,35 % Unter Berücksichtigung der extremen Ungleichverteilung der Opferwahrscheinlichkeit und ihres Komplements beträgt die durch die einbezogenen exogenen Merkmale erfolgte Varianzaufklärung rd. 19,35 %. Sie liegt somit deutlich höher als in den meisten Feldstudien. Um die Erklärungsbeiträge der exogenen Kontextmerkmale im Hinblick auf die Opferlogit der weißen Referenzgruppe und ihrer farbigen Nachbarn zu bestimmen, berechnen wir zunächst das von Bryk&Raudenbush vorgeschlagene PRE-R2 für die kontextabhängige Logitschätzer der Konstanten und der Steigung für die Minoritäten. Anschließend berechnen wir einen partiellen Likelihood-Ratio-χ2-Test, um die erzielte Varianzaufklärung der kontextabhängigen Schätzer signifikant von Null verschieden ist. Mit Hilfe unserer beiden Nachbarschaftsmerkmale Minoritätenanteil und Ausmaß sozialer Integration erklären wir rd. 23,75% der Variation des Opferlogits der Referenzgruppe. Bei der geschätzten Abweichung des Opferlogits ihrer farbigen Nachbarn erzielen wir so gar ein Anteil von 33,33% erklärter Varianz. Um die statistische Signifikanz dieser Erklärungsbeiträge gemeinsam zu überprüfen, führen wir den partiellen Likelihood-Ratio-χ2-Tests im Vergleich zum Random-Intercept/Random-Slope-Logitmodell (M.2) durch. Mit einer Irrtumswahrscheinlichkeit von deutlich weniger als 5 % verwerfen wir die Nullhypothese des partiellen Likelihood-Ratio-χ2-Tests, die besagt, dass die Effekte der einbezogenen exogenen Kontextmerkmale jeweils Null sind. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 142 Berechnung des Bryk & Raudenbush&R 2 für die Ebene 2 des Modells M.3: Bryk & Raudenbush&R 2 Level 2 ' σ̂ 2uqj ( MRandom Intercept&Slope ) & σ̂ 2uuqj ( MCoefficient as Outcome ) σ̂ 2uqj ( MRandomIntercept&Slope ) Level 2&PRE&R 2 (β 0 j ) ' 0,863 & 0,658 ' 0,2375 ( 100 ' 23,75 % 0,863 Level 2&PRE&R 2 (β 3 j ) ' 0,633 & 0,422 ' 0,3333 ( 100 ' 33,33 % 0,633 Legende: σ̂ 2u 0 j : Geschätzte Varianz der Residuen der kontextspezifischen σ̂ Geschätzte Varianz der Residuen der kontextspezifischen 2 u kj : logistischen Regressionskonstanten β0j logistischen Steigungskoeffizienten β kj MCoefficient as Outcome : Coefficient&as&Outcome&Model mit den Level&2&Kontextvariablen MRandom Intercept&Slope : Random&Intercept&Random&Slope&Logitmodell ohne Kontextmerkmale Partieller L.R.χ2&Test ' DevianceA.M.2 & DevianceA.M.3 ' 1.704,134 & 1.673,247 ' 30,89 Anzahl der Freiheitsgrade ' ParameterzahlA.M.3 & ParameterzahlA.M.2 ' 14 & 10 ' 4 Kritischer χ2&Wert (F.G.' 4 ; α ' 0,05 ) ' 9,49 Da L.R. χ2 $ χ2kritisch ist; muß H0 verworfen werden ! Um die von MIXOR geschätzten „fixed-effects“ besser mit denjenigen von HLM 5 vergleichen zu können, setzen wir sie in das Gleichungssystem des geschätzten Zweiebenen-Logitmodells M.3 ein. Hierbei kennzeichnen wir die signifikante Effekte jeweils durch ein Sternchen. Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 143 chätzgleichungen des Alternativmodells 3 mit fixed&effect&Koeffizienten von MIXOR : evel / Ebene 2: Between&Context&Regression a) Logistic Intercept&as&Outcome: β 0 j β 0 j ' &3,51( % 0,02( ( ( PMINORI. j& PMINORI.. ) & 0,35( ( ( MNINTEGR.j& MNINTEGR.. ) % u 0 j Fixed Logistic Slopes: b) β 1 j ' & 0,00 c) β 2 j ' % 0,04 d) Logistic Slope&as&Outcome: β 3 j β 3 j ' %0,41 & 0,03( ( ( PMINORI. j& PMINORI.. ) % 0,18 ( ( MNINTEGR.j& MNINTEGR.. ) % u 3 j Fixed&Logistic Slopes: e) β 4 j ' & 0,11( f) β 5 j ' % 0,41( g) β 6 j ' % 0,26( evel / Ebene 1: Logistic Within&Context Regression ) ln P ( DVICVIOL ' 1) 1 & P ( DVICVIOL ' 1 ) ' β 0 j % β 1 j ( ( ALTERìj& ALTER.. ) % β 2 j ( FRAU ij ij % β 3 j ( MINORITY i j % β 4 j ( ( INCOME i j& INCOME.. ) % β 5 j ( LIVALONE i j % β 6 j ( ( DANGACT i j& DANGACT.. ) % e i j Beim Vergleich der mit MIXOR und HLM 5 geschätzten γ-Koeffizienten zeichnen sich deutlich sowohl Gemeinsamkeiten als auch Unterschiede ab. Bei den Effekten der beiden Nachbarschaftsmerkmalen Minoritätenanteil und Ausmaß sozialer Integration auf das Opferlogit der Referenzgruppe (β0j) weist nur der Effekt der Integration eine geringfügige Abweichung an der zweiten Kommastelle auf. Beide Programme identifizieren diese Kontexteffekte als statistisch signifikant. Der Erwartungswert für das Opferlogit der Referenzgruppe (γ00) in Nachbarschaften mit durchschnittlichem Farbigenanteil und Ausmaß an sozialer Kontrolle ist ebenfalls in beiden Programmen und gleichermaßen statistisch signifikant. Die von beiden Programmen geschätzten „fixed-effects“ des Alters und Geschlechts sind weitestgehend identisch und ebenfalls nicht signifikant. Ebenfalls geringe Abweichungen der γ-Koeffizienten treten bei den „fixed-effects“ der Einkommensklasse, des Singledaseins sowie der außerhäuslichen Freizeitaktivitäten auf, wobei bis auf die Einkommensklasse die zugehörigen T-Tests nahezu identische Ergebnisse liefern. Im Gegensatz zu MIXOR weist HLM 5 den Effekt der Einkommensklasse nur als tendenziell signifikant aus, da die zugehörige Irrtumswahrscheinlichkeit des T-Tests bei 8,6 % Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 144 liegt. Die größten Unterschiede der von beiden Programmen geschätzten γ-Koeffizienten finden wir beim zweiten „random-effect“, nämlich der geschätzten Abweichung des Opferlogits der Farbigen von ihren weißen Nachbarn. Dieser geschätzte logistische Gruppenunterschied (γ30) fällt in Durchschnittsnachbarschaften mit +0,41 in MIXOR nahezu doppelt so hoch wie in HLM 5 aus. In beiden Programmen erreicht der Gruppenunterschied nicht die Signifikanzgrenze. Den Wechselwirkungseffekt des Minderheitenanteils zwischen den Analyseebenen (γ31) schätzen beide Programme mit einem Wert von -0,03 gleich hoch ein und weisen ihn gleichermaßen als statistisch signifikant aus. Hingegen schätzt MIXOR den Effekt der sozialen Integration (γ32) mit einem γ-Koeffizienten von +0,18 nahezu dreimal so hoch wie HLM 5 ein, wobei beide Programme ihn als statistisch nicht signifikant ausweisen. Die Unterschiede beider Programme bei der Varianzaufklärung der kontextabhängigen Effekte ist darauf zurückzuführen, dass beide im jeweiligen Random-Intercept/Random-Slope-Logitmodell die als Bezugsbasis dienenden Varianzkomponenten für β0j und β3j unterschiedlich hoch ermittelt haben. Desweiteren dürften die Unterschiede der geschätzten „fixed-effects“ zwischen MIXOR und HLM 5darauf zurückzuführen sein, dass wir bei beiden Programme verschiedene Formen der Grand-Mean-Zentrierung exogenen metrischer Merkmale vorgenommen haben. Während HLM 5 zunächst für die Variablen des aktuellen Modells einen fallweisen Auschluß fehlender Werte durchführt und danach erst am Grand-Mean der verbleibenden Gesamtstichprobe zentriert, haben wir bei der Datenaufbereitung für MIXOR in SPSS an den jeweiligen Mittelwerten der Ausgangsstichprobe mit 5.301 Fällen die Zentrierung vorgenommen. Die Schätzung des Alternativmodell 3 beruht aber nur noch auf 4.659 Fällen. Diese erhebliche Fallreduzierung führt dazu, dass die Mittelwerte für die zuvor am Grand-Mean der Ausgangsstichprobe zentrierten exogenen Merkmale Alter, Einkommensklasse und Ausmaß der sozialen Integration von ihrem Erwartungswert Null deutlich abweichen. Da aufgrund der nicht-linearen Verknüpfungsfunktion des Logitmodells die Effekt einzelner Variablen vom linearen Prädiktor aller exogenen Merkmale abhängen, ist nicht auszuschließen, dass die beobachteten Unterschiede der γ-Koeffizienten in beiden Programmen auf die unterschiedlichen Zentrierungen zurückzuführen sind. Ebenfalls ist noch nicht hinreichend geklärt, inwieweit die in beiden Programmen verwendeten Algorithmen der Maximum-Marginal-Likelihood-Schätzung und der Laplace6-Approximation für die beschriebenen Unterschiede der γ-Koeffizienten verantwortlich sind. Summa summarum bleibt festzuhalten, dass bei gegebener Finanzausstattung HLM 5 eher als MIXOR dem angewandten Sozialforscher zu empfehlen ist, da es erstens über einen komfortablen Datenimport verfügt, der alle gängigen Statistikprogramme unterstützt. Zweitens bietet sein graphischer Editor dem Nutzer die Möglichkeit, das zu schätzende Mehrebenenmodell sehr einfach zu spezifizieren, wobei das Programm die Zentrierung der exogenen Merkmale auf Anforderung selbst durchführt. Drittens stellt HLM 5 die Ergebnisse der Schätzung, insbesondere die Wechselwirkungseffekte der exogenen Merkmale zwischen den Ebenen, mit Hilfe seines Grafikeditors sehr anschaulich dar. Viertens sind in HLM 5 eine Vielzahl von Modellklassen der Mehrebenenanalyse implementiert, die MIXOR als einzelnes Programm nicht bietet. Zum Nachteil gereicht HLM 5, dass es weder bei der Penalized-Quasi-Likelihood- noch der Laplace6-Schätzung die Log-Likelihood des logistischen Nullmodells die Log-Likelihood oder Deviance ermittelt. Daher können für die mit HLM 5 geschätzten Logitmodellen weder einen globalen Likelihood-Ratio-χ2 noch diverse Pseudo-R2e für die Beurteilung der Modellanpassung berechnen. Angesichts des notwendigen erheblichen Aufwands der Datenaufbereitung spricht für MIXOR lediglich sein Status als „freeware“-Programm und die Möglichkeit der Schätzung von Nullmodellen für die binäre und ordinale logistische Regression. Wenn der Anwender nur Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 145 an statistisch signifikanten γ-Koeffizienten interessiert ist, so sitzt er bei der Verwendung MIXOR zumindest bei derVerallgemeinerung auf die Grundgesamtheit keinen Fehlschlüssen auf. Was die numerischen Differenzen der geschätzten γ-Koeffizienten und Varianzkomponenten angeht, sollten zukünftige Simulationsstudien zeigen, ob sie auf die Unterschiede der Schätzverfahren oder der Zentrierungen zurückzuführen sind. Alternativ zu MIXOR kann der Anwender auch auf die kostenlose Studentenedition von HLM 5 für die Schätzung von Mehrebenenmodellen zurückgreifen. Sie bietet, was die Modellklassen angeht, denselben Leistungsumfang wie die kommerzielle Version des Programms. Lediglich bei der Anzahl der berücksichtbaren Kontexte und der schätztbaren Parametern muß der Anwender Abstriche machen. Bei Zweiebenenmodellen liegt die Begrenzung der Fallzahl bei 7.200 Befragten in 350 Level-2-Kontexten. Dreiebenenmodelle können bis zu 7.500 Befragten in 1.700 Level-2 und 60 Level-3-Kontexten berücksichtigen. Pro Within- bzw. Between-Regressionsgleichung lassen maximal 5 Parameter schätzen, wobei die Gesamtzahl der β und γKoeffizienten auf 25 begrenzt ist. Die Studentenversion unterstützt lediglich den Import von Daten aus SPSS, SYSTAT oder SAS, wobei die Option des Einlesens von ASCII-Rohdaten weiterhin besteht. Sie enthält aber eine vollständige Online-Hilfe, die weitgehend das Programmhandbuch abdeckt, sowie alle Anwendungsbeispiele der Vollversion. Die Studentenversion von HLM 5 kann der Anwender von der folgenden Internetadresse kostenlos beziehen: url: http://www.ssicentral.com/other/hlmstu.htm. 9. Literaturverzeichnis Aldrich, J.H.& Nelson, F.D. (1984): Linear probability, logit, and probit models. Newbury Park: SAGE (Quantitative Applications in the Social Sciences, 45) Amemiya, T. (1981): Qualitative response models: a survey. In: Journal of Economic Literature, 21, S. 1483-1536 Busing, F.M.T.A, Meijer, E. & van der Leeden, R. (1994): MLA. Software for MultiLevel Analysis of Data with Two Levels. User‘s Guide for Version 1.0b. Leiden: Department of Psychometrics and Research Methodology at Leiden University. Cragg, S.G.& Uhler, R. (1970): The demand for automobiles. In: Canadian Journal of Economics, 3, S. 386-406 DeMaris, A. (2002): Explained Variance in Logistic Regression. A Monte Carlo Study of Proposed Measures. In: Sociological Methods&Research, 31, 1, S. 27-74 Efron, B. (1978): Regression and Anova with zero-one data. Measures of residual variation. In: Journal of American Statistical Association, 73, S. 113-121 Gibbons, R.D. & Hedeker, D. (1998): Applications of Mixed-Effect Models in Biostatistics. Chicago, Ill.: Division of Epidemiology & Biostatistics, School of Public Health, University of Illinois at Chicago. url: http://www.uic.edu/~hedeker/works.html (Pdf-Datei: sankhya3.pdf) Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 146 Goldstein, H. (19993): Multilevel Statistical Models. London: Multilevel Models Project, Institute of Education, University of London (url: http://www.arnoldpublishers.com/support/goldstein.htm) Greene, W.H. (20035): Econometric Analysis. Upper Saddle River, New Jersey: Prentice Hall Greene, W.H. (2003): EA/LimDep. For Econometric Analysis, 5th edition Version 2.0. Upper Saddle River, New Jersey: Prentice Hall. url: http://www.prenhall.com/greene/0130661899.html Hagle, T.M. & Mitchell II,G.E. (1992): Goodness of fit measures for probit and Logit. In: American Journal of Political Science, 36, 3, S. 762-784 Hedeker, D. & Gibbons, R.D. (1996a): MIXOR: a computer program for mixed-effects ordinal regression analysis. In: Computer Methods and Programs in Biomedicine, 49, S. 157-176 Hedeker,D. & Gibbons, R. D. (1996b): MIXOR: a computer program for mixed-effects ordinal regression analysis. Chicago, Ill.: Division of Epidemiology&Biostatistics, School of Public Health, University of Illinois at Chicago. url: http://www.uic.edu/~hedeker/works.html Hedeker, D. (1999): MIXOR (version 2): a program for 2-level cumulative link models. Some enhancements, extensions, and examples. Chicago, Ill.: Division of Epidemiology&Biostatistics, School of Public Health, University of Illinois at Chicago. url: http://www.uic.edu/~hedeker/manuals.html Hox, J. (2002): Multilevel Analysis. Techniques and Applications. Mahwah, New Jersey: Lawrence Earlbaum Langer, W. (2000): The Assessment of Fit in the Class of Logistic Regression Models: A Pathway out of the Jungle of Pseudo-R2. Köln: RC33-Kongress der ISA. Beziehbar über: url: http://www.soziologie.uni-halle.de/langer/papers.shtml Maddala, G.S. (1983): Limited-dependent and qualitative variables in econometrics. Cambridge: Cambridge University Press McCullagh, P. (1980): Regression Models for Ordinal Data. In: Journal of Royal Statistical Society, B, 42, 2, S.109-144 McCullagh, P. & Nelder, J.A. (19892): Generalized Linear Models. London: Chapman&Hall McFadden, D. (1979): Quantitative methods for analysing travel behaviour of individuals: some recent developments. In: Hensher, D.A.& Stopher, P.R.: (eds): Behavioural travel modelling. London: Croom Helm, S. 279-318 McKelvey, R. & Zavoina, W. (1975): A statistical model for the analysis of ordinal level dependent variables. In: Journal of Mathematical Sociology, 4, S. 103-20 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 147 Miethe, T.D.(1991): Citizen-Based Crime Control Activity and Victimization Risks: An Examination of Displacement and Free-Rider Effects. In: Criminology, 29, S. 419-439 Miethe, T.D.(1997): Testing Theories of Criminality and Victimization in Seattle 1960-1990. Ann Arbor, Michigan: Inter-Univeristy-Consortium of Political and Social Research (ICPSR Study No. 9741, 1st edition), url: http://www.icpsr.umich.edu Miethe, T.D. & Meier, R.F. (1994): Crime and Its Social Context. Toward an Integrated Theory of Offenders, Victims and Situations. Albany, N.Y.: State University of New York Press Nagelkerke, N.J.D. (1991): A note on a general definition of the coefficient of determination. Biometrika, 78, 3, S. 691-693 Rasbash, J., Browne, W., Goldstein, H., Yang, M., Plewis, I., Healy, M., Woodhouse, G., Draper,D., Langford, I. & Lewis, T. (2000): A user‘s guide to MlwinN. Version 2.1. London: Multilevel Models Project, Institute of Education, University of London Raudenbush, S.W. & Bryk, A.S. (20022): Hierarchical Linear Models. Applications and Data Analysis Methods. Thousand Oaks, Ca: SAGE (Advanced Quantitative Techniques in the Social Sciences Series, 1) Raudenbush, S.W., Bryk,A.S., Cheong, Y.F. & Congdon (2001): HLM 5. Hierarchical Linear and Nonlinear Modelng. Chicago, Ill.: Scientific Software International Raudenbush, S.W. & Yang, M. (1998): Numerical Integration via High-Order, Multivariate LaPlace Approximation with Application to Multilevel Models. In: Multilevel Modelling Newsletter, 10, 2 (Internetzeitschrift des Multilevel Models Project des Institute of Education, University of London: url: http://www.ioe.ac.uk/multilevel/ Raudenbush, S.W., Yang, M. & Yosef, M. (2000): Maximum Likelihood for hierarchical models via high-order, multivariate LaPlace approximation. In: Journal of Computational and Graphical Statistics, 9, 1, S. 141-157 Rountree, P.W., Land, K.C. & Miethe, T.D.(1994): Macro-Micro Integration in the Study of Victimization: A Hierarchical Logistic Model Analysis across Seattle Neighborhoods. In: Criminology, 32 S.387 - 414 Rountree, P.W. & Land, K.C. (1996): Perceived Risk versus Fear of Crime: Empirical Evidence of Conceptually Distinct Reactions in Survey Data. In: Social Forces, 74, 4, S. 1353-1376 Snijders, T. & Bosker, R. (1999): Multilevel Analysis. An introduction to basic and advanced multilevel modelling. London: SAGE Veall, M.R. & Zimmermann, K.F. (1992): Pseudo-R2 in the ordinal probit model. In: Journal of Mathematical Sociology, 16, 4, S. 333-342 Veall, M.R. & Zimmermann, K.F. (1994): Evaluating Pseudo-R2's for binary probit models. In: Quality&Quantity, 28, S. 151- 164 Dr. Wolfgang Langer - Methoden V: Mehrebenenanalyse - WiSe 2001/2002 148 Windmeijer, F.A.G. (1995): Goodness-of-fit measures in binary choice models. In: Econometric Reviews, 14, 1, S. 101-116 Zimmermann, K.F. (1993): Goodness of fit in qualitative choice models: review and evaluation. In: Schneeweiß, H. & Zimmermann, K. (eds): Studies in applied econometrics. Heidelberg: Physika, S. 25-74