Probability
There are 10 people randomly selected: 7 malesand 3 females. Assume that 60% of thepopulation has brown hair, 25% has black hair,and 15% has a different color; “other.”
What is the probability that we will select...
1.a male?6. a male with black hair?
2.not a female?7. a female with brown hair?
3.two males?8. a female w/brown hair or a female
4.one of each gender?    w/black hair?
5.two females?9. a male w/brown hair and a male    w/black hair?
10. not a male with different color    hair?
Chapter 6Samples and Populations
Samples and Populations
Population:
Set of individuals who share at least onecharacteristic
Sample:
A smaller number of individuals from thepopulation that share one or more givencharacteristics
Sampling Methods
Researchers want to make inferences fromdata.
Sampling methods vary according topopulation and access.
Two types of sampling methods:
Non-random samples
Random samples
Sampling Error
Mean of a sample shown as
Mean of a population shown as µ
Standard deviation of a sample shown as s
Standard deviation of a population shown as σ
Mean or standard deviation of a sample rarelyidentical to the population
This difference is known as sampling error.
Table 1: A population and three randomsamples of final exam grades
Population
70
80
93
86
85
90
56
52
67
40
78
57
89
49
48
99
72
30
96
94
                                   μ = 71.55
Sample A
Sample B
Sample C
96
40
72
99
86
96
56
56
49
52
67
56
    = 75.75
    = 62.25
     = 68.25
N = 20
7
Sampling Distributions of Means
96
92
103
100
106
93
98
102
96
107
101
99
91
108
105
95
104
102
Figure 1: The Mean Long Distance Phone Time in 100 Random Samples in
Which the Mean = 99.75 min
Standard Error of the Mean
Standard deviation of theoretical samplingdistribution can be derived.
This is known as the standard error of the mean.
Formula for standard error of the mean:
We can now calculate the range of mean values inwhich our population mean is likely to fall.
9
Standard Error of Mean
Obtained by dividing the populationstandard deviation by the square root ofthe sample size
Illustration: IQ test
Population mean of 100
Population standard deviation of 15
If we took a sample of 10, subject to a standard errorof?
With the aid of the standard error of themean, we can find the range of meanvalues within which our true populationmean is likely to fall.
Confidence Interval Cont.
Can be constructed for any level of probability
It is has become a matter of convention to use awider, less precise confidence interval having abetter probability of making an accurate or trueestimate of the population mean.
68% confidence interval =     ± (1)
95% confidence interval =     ± (1.96)
99% confidence interval =     ± (2.58)
11
Confidence Interval Cont.
How do we go about finding the 95% confidenceinterval?
We already know that roughly 95% of thesample means in a sampling distribution liebetween -2 standard deviations and +2 standarddeviations from the mean of means.
12
95% Confidence Interval Using z
Suppose we want to determine the expectedmiles per gallon for a new Ford Explorer?
Standard deviation = 4 miles/gallon
N = 100 cars
Sample Mean = 26 miles/gallon
How do we obtain a 95% confidence interval forthe mean miles/gallon for all cars of this model?
What would happen if we only used 20 cars for oursample?
13
99% Confidence Interval Using z
Now, the statistician is informed that 95%confidence is not confident enough fortheir needs. To be confident, we want 99%.
Standard deviation = 4 miles/gallon
N = 20 cars
Sample Mean = 26 miles/gallon
End Day 1
15
The t ratio
Very few situations in which the population standard deviation (andthus the standard error of the mean) is known
When the exact standard deviation of the population (σ) isunknown, the t-distribution is used
Recall that sample means (and their standard deviations) are lowerand more stable than population means
It is then necessary to inflate the sample standard deviation toproduce more accurate estimates
Standard Error for a t ratio
16
Degrees of Freedom
The greater the degrees of freedom, the larger thesample size and the closer the t distribution gets tothe normal distribution
df = N – 1
Recall that the only difference between a t and a z isthat the former uses an estimate of the standarderror based on sample data while the latter is known
What would one do for larger samples for which thedegrees of freedom may not appear in Table C?
17
The t ratio
For t-distributions, use Table C instead of Table A
Various levels of alpha
Alpha = area in the tails of the t distribution
For a 95% level of confidence, an alpha = .05.
For a 99% level of confidence, an alpha = .01.
With the addition of alpha, we now have two pieces ofinformation available and can now construct ourconfidence interval
Degrees of freedom (N – 1)
Alpha value (95% = .05 or 99% = .01)
𝐶𝐼= 𝑥  ±(𝑡)( 𝑠 𝑥 )
18
A local newspaper surveyed 20 citizens on its coverage of therecent rape case in Stuebenville, Ohio. In regards to how fairthe coverage was to the victim, the newspaper used a scaleranging from 1 (completely fair) to 10 (completely unfair).Construct a 95% and 99% confidence interval with a sample of20, a mean of 7.2, and a standard deviation of 1.7.
Suppose that a researcher wanted to examine the extent ofcooperation among kindergarten children.  To do so, sheunobtrusively observes 9 children at play for 30 minutes andnotes the number of cooperative acts engaged in by each child:The mean number of cooperative acts was 2.67 and thestandard deviation was 1.32.
Putting it all together
Estimating Proportions
We can also estimate population proportions.
Pattern of formulas is the same.
sP = standard error of the proportion
P = sample proportion
N = total number in the sample
We either use:
95% CI = P ± 1.96*spor99% CI = P ± 2.58*sp
An Illustration
Suppose a polling organization contacted 400 members of a localpolice union and asked them whether they intended to vote forcandidate A or candidate B. Suppose that 55% reported theirintention to vote for candidate A. Find the 95% confidence intervalfor candidate A.
Step 1: Obtain the standard error of the proportion.
Step 2: Multiply the standard error of the proportion by 1.96 to obtainthe margin of error.
Step 3: Add and subtract the margin of error to find the confidenceinterval.