Thống kê (Chuyên đề Toán ôn thi Tốt nghiệp 2025)

Chuyên đề Thống kê có trong bộ 8 Chuyên đề ôn thi Tốt nghiệp Toán năm 2025 đầy đủ lý thuyết và bài tập đa dạng có lời giải giúp học sinh có thêm tài liệu ôn tập cho bài thi tốt nghiệp THPT môn Toán.

Xem thử Đề thi Tốt nghiệp Toán 2025 Xem thử Đề thi thử Tốt nghiệp Toán 2025 Xem thử Chuyên đề ôn thi Tốt nghiệp Toán

Chỉ từ 350k mua trọn bộ Chuyên đề Toán ôn thi Tốt nghiệp 2025 theo cấu trúc mới bản word có lời giải chi tiết:

I. KIẾN THỨC CƠ BẢN

1. Các số đặc trưng của mẫu số liệu không ghép nhóm

1.1. Các số đặc trưng đo xu thế trung tâm

a) Số trung bình

• Giả sử ta có một mẫu số liệu là x1,x2,...,xn. Cỡ mẫu của dãy số liệu là n.

Số trung bình (hay số trung bình cộng) của mẫu số liệu này, kí hiệu x¯, được tính bởi công thức

x¯=x1+x2+...+xnn.

• Giả sử mẫu số liệu được cho dưới dạng bảng tần số

Thống kê (Chuyên đề Toán ôn thi Tốt nghiệp 2025)

Khi đó, công thức tính số trung bình trở thành x¯=n1x1+n2x2+...+nkxkn, trong đó cỡ mẫu n=n1+n2+...+nk.

• Kí hiệu fk=nkn là tần số tương đối (hay còn gọi là tần suất) của xk trong mẫu số liệu. Khi đó, số trung bình còn có thể biểu diễn là x¯=f1x1+f2x2+...+fkxk.

Ý nghĩa: Số trung bình là giá trị trung bình cộng của các số trong mẫu số liệu, nó cho biết vị trí trung tâm của mẫu số liệu và có thể dùng để đại diện cho mẫu số liệu.

b) Trung vị

Sắp xếp lại mẫu số liệu là x1,x2,...,xn theo thứ tự không giảm, ta được dãy x1*x2*...xn*.

Số trung vị của mẫu số liệu trên là giá trị ở chính giữa dãy x1*,x2*,...,xn*. Cụ thể:

– Nếu n = 2k + 1, k ∈ ℕ, thì số trung vị là xk+1*.

– Nếu n = 2k, k ∈ ℕ, thì số trung vị là 12xk*+xk+1*.

Ý nghĩa: Trung vị không bị ảnh hưởng bởi giá trị bất thường trong khi số trung bình bị ảnh hưởng bởi giá trị bất thường. Vì vậy, khi mẫu số liệu có giá trị bất thường người ta thường dùng trung vị đại diện cho các số liệu thống kê.

c) Tứ phân vị

Tứ phân vị của một mẫu số liệu gồm 3 giá trị, đó là tứ phân vị thứ nhất, thứ hai và thứ ba (lần lượt kí hiệu là Q1, Q2, Q3). Ba giá trị này chia tập hợp dữ liệu đã sắp xếp thành bốn phần đều nhau. Cụ thể:

– Giá trị tứ phân vị thứ hai, Q2, chính là số trung vị của mẫu.

– Giá trị tứ phân vị thứ nhất, Q1, là số trung vị của nửa số liệu đã sắp xếp bên trái Q2 (không bao gồm Q2 nếu n lẻ).

– Giá trị tứ phân vị thứ ba, Q3, là số trung vị của nửa số liệu đã sắp xếp bên phải Q2 (không bao gồm Q2 nếu n lẻ).

d) Mốt

Mốt là giá trị có tần số lớn nhất của mẫu số liệu. Một mẫu số liệu có thể không có mốt, có một mốt hoặc có nhiều mốt.

Ý nghĩa: Có thể dùng mốt để đo xu thế trung tâm của mẫu số liệu khi mẫu số liệu có nhiều giá trị trùng nhau.

1.2. Các số đặc trưng đo độ phân tán

a) Khoảng biến thiên

Sắp xếp lại mẫu số liệu là x1,x2,...,xn theo thứ tự không giảm, ta được dãy x1*x2*...xn*.

Khoảng biến thiên của một mẫu số liệu, kí hiệu R, là hiệu giữa giá trị lớn nhất và giá trị nhỏ nhất của mẫu số liệu đó, tức là R=xn*x1*.

Ý nghĩa: Khoảng biến thiên dùng để đo mức độ phân tán của mẫu số liệu. Khoảng biến thiên càng lớn thì mẫu số liệu càng phân tán.

b) Khoảng tứ phân vị

Khoảng tứ phân vị, kí hiệu ∆Q, là hiệu giữa tứ phân vị thứ ba Q3 và tứ phân vị thứ nhất Q1, tức là ∆Q = Q3 - Q1.

Một giá trị của mẫu số liệu được gọi là giá trị bất thường hay giá trị ngoại lệ nếu nó nhỏ hơn Q11,5ΔQ hoặc lớn hơn Q3+1,5ΔQ.

Ý nghĩa: Khoảng tứ phân vị dùng để đo mức độ phân tán của mẫu số liệu. Khoảng tứ phân vị càng lớn thì mẫu số liệu càng phân tán.

c) Phương sai và độ lệch chuẩn

• Ta có một mẫu số liệu là x1,x2,...,xn. Cỡ mẫu là n. Số trung bình là x¯.

Phương sai của mẫu số liệu trên, kí hiệu S2, được tính bởi công thức

s2=1nx1x¯2+x2x¯2+...+xnx¯2=1nx12+x22+...+xn2x¯2.

Độ lệch chuẩn, kí hiệu s, là căn bậc hai (số học) của phương sai, tức là s=s2.

• Nếu mẫu số liệu được cho dưới dạng bảng tần số như Bảng 1 thì công thức tính phương sai trở thành s2=1nn1x1x¯2+n2x2x¯2+...+nkxkx¯2 = 1nn1x12+n2x22+...+nkxk2x¯2.

Ý nghĩa: Phương sai hoặc độ lệch chuẩn càng lớn thì số liệu càng phân tán.

2. Các số đặc trưng của mẫu số liệu ghép nhóm

2.1. Các số đặc trưng đo xu thế trung tâm của mẫu số liệu ghép nhóm

a) Số trung bình

Cho mẫu số liệu ghép nhóm như ở Bảng 2.

Thống kê (Chuyên đề Toán ôn thi Tốt nghiệp 2025)

• Trung điểm x1 của nửa khoảng (tính bằng trung bình cộng của hai đầu mút) ứng với nhóm i là giá trị đại diện của nhóm đó. Chẳng hạn, giá trị đại diện của nhóm [a1; a2) là x1=a1+a22.

Số trung bình cộng của mẫu số liệu ghép nhóm, kí hiệu x¯, được tính theo công thức:

x¯=n1x1+n2x2+...+nmxmn.

Ý nghĩa: Số trung bình cộng của mẫu số liệu ghép nhóm có thể làm đại diện cho vị trí trung tâm của mẫu số liệu đó khi các số liệu trong mẫu ít sai lệch với số trung bình cộng.

b) Trung vị

Cho mẫu số liệu ghép nhóm như ở Bảng 3.

Thống kê (Chuyên đề Toán ôn thi Tốt nghiệp 2025)

Giả sử nhóm k là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng n2, tức là cfk1<n2 nhưng cfkn2. Ta gọi r, d, nk lần lượt là đầu mút trái, độ dài, tần số của nhóm k; cfk1 là tần số tích lũy của nhóm k - 1.

Trung vị của mẫu số liệu ghép nhóm, kí hiệu Me, được tính theo công thức:

Me=r+n2cfk1nkd.

Quy ước: cf0=0.

Ý nghĩa: Trung vị của mẫu số liệu có thể dùng để đại diện cho mẫu số liệu đó.

c) Tứ phân vị

Cho mẫu số liệu ghép nhóm như ở Bảng 3.

• Giả sử nhóm p là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng n4, tức là cfp1<n4 nhưng cfpn4. Ta gọi s,h,np lần lượt là đầu mút trái, độ dài, tần số của nhóm p; cfp1 là tần số tích lũy của nhóm p - 1.

Tứ phân vị thứ nhất Q1 được tính theo công thức Q1=s+n4cfp1nph.

Tứ phân vị thứ hai Q2 bằng trung vị Me.

• Giả sử nhóm q là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng 3n4, tức là cfq1<3n4 nhưng cfq3n4. Ta gọi t,l,nq lần lượt là đầu mút trái, độ dài, tần số của nhóm q; cfq1 là tần số tích lũy của nhóm q - 1.

Tứ phân vị thứ ba Q3 được tính theo công thức Q3=t+3n4cfq1nql.

Ý nghĩa: Tứ phân vị Q1,Q2,Q3 của mẫu số liệu chia mẫu số liệu đó thành bốn phần, mỗi phần chứa 25% giá trị.

d) Mốt

Cho mẫu số liệu ghép nhóm như ở Bảng 3.

Giả sử nhóm i là nhóm có tần số lớn nhất. Ta gọi u,g,ni lần lượt là đầu mút trái, độ dài, tần số của nhóm i; ni1,  ni+1 lần lượt là tần số của nhóm i - 1, nhóm i + 1. Mốt của mẫu số liệu ghép nhóm, kí hiệu Me, được tính theo công thức Mo=u+nini12nini1ni+1g.

Quy ước: n0=0;  nm+1=0.

Ý nghĩa: Mốt của mẫu số liệu ghép nhóm có thể dùng để đo xu thế trung tâm của mẫu số liệu đó.

2.2. Các số đặc trưng đo độ phân tán của mẫu số liệu ghép nhóm

a) Khoảng biến thiên

Cho mẫu số liệu ghép nhóm như ở Bảng 4, trong đó n1 và nm là các số nguyên dương.

Thống kê (Chuyên đề Toán ôn thi Tốt nghiệp 2025)

Gọi a1,  am+1 lần lượt là đầu mút trái của nhóm 1, đầu mút phải của nhóm m.

Hiệu R=am+1a1 được gọi là khoảng biến thiên của mẫu số liệu ghép nhóm đó.

Ý nghĩa:

• Khoảng biến thiên của mẫu số liệu ghép nhóm đo mức độ phân tán cho mẫu số liệu đó. Khoảng biến thiên càng lớn thì mẫu số liệu càng phân tán.

• Trong các đại lượng đo mức độ phân tán của mẫu số liệu ghép nhóm, khoảng biến thiên là đại lượng dễ hiểu, dễ tính toán. Tuy nhiên, do khoảng biến thiên chỉ sử dụng hai giá trị là a1 và am + 1 của mẫu số liệu nên đại lượng đó dễ bị ảnh hưởng bởi các giá trị bất thường.

b) Khoảng tứ phân vị

Cho mẫu số liệu ghép nhóm như ở Bảng 3. Gọi Q1,Q2,Q3 là tứ phân vị của mẫu số liệu đó. Ta gọi hiệu ΔQ=Q3Q1khoảng tứ phân vị của mẫu số liệu đó.

Ý nghĩa: Khoảng tứ phân vị của mẫu số liệu ghép nhóm giúp xác định các giá trị bất thường của mẫu đó. Khoảng tứ phân vị thường được sử dụng thay cho khoảng biến thiên vì nó loại trừ hầu hết giá trị bất thường của mẫu số liệu và nó không bị ảnh hưởng bởi các giá trị bất thường đó.

c) Phương sai và độ lệch chuẩn

Cho mẫu số liệu ghép nhóm như ở Bảng 2.

• Gọi x¯ là số trung bình cộng của mẫu số liệu đó.

Số s2=n1x1x¯2+n2x2x¯2+...+nmxmx¯2n được gọi là phương sai của mẫu số liệu đó.

• Căn bậc hai (số học) của phương sai được gọi là độ lệch chuẩn của mẫu số liệu ghép nhóm, kí hiệu là s, nghĩa là s=s2.

Ý nghĩa:

• Phương sai (độ lệch chuẩn) của mẫu số liệu ghép nhóm được dùng để đo mức độ phân tán của mẫu số liệu ghép nhóm đó.

• Độ lệch chuẩn có cùng đơn vị với đơn vị của mẫu số liệu.

• Khi hai mẫu số liệu ghép nhóm có cùng đơn vị đo và có số trung bình cộng bằng nhau (hoặc xấp xỉ nhau), mẫu số liệu nào có độ lệch chuẩn nhỏ hơn thì mức độ phân tán (so với số trung bình cộng) của các số liệu trong mẫu đó sẽ thấp hơn.

II. MỘT SỐ VÍ DỤ

Dạng I. Câu trắc nghiệm nhiều phương án lựa chọn

Mỗi câu hỏi thí sinh chỉ lựa chọn một phương án.

Ví dụ 1. Người ta ghi lại tuổi thọ của một số con ong cho kết quả như sau:

Thống kê (Chuyên đề Toán ôn thi Tốt nghiệp 2025)

Giá trị đại diện của nhóm [20; 40) là

A. 10.

B. 20.

C. 30.

D. 40.

Lời giải

Giá trị đại diện của nhóm [20; 40) là 20+402=30. Chọn C.

Ví dụ 2. Độ tuổi của 11 cầu thủ ở đội hình xuất phát của một đội bóng đá được ghi lại như sau:

32  20   19   21    28   29   21   22     29    19   29.

Tứ phân vị của mẫu số liệu trên là

A. Q1=19,Q2=22,Q3=32.

B. Q1=20,Q2=22,Q3=28.

C. Q1=20,Q2=26,Q3=29.

D. Q1=20,Q2=22,Q3=29.

Lời giải

Sắp xếp mẫu số liệu theo thứ tự tăng dần ta được 19  19  20  21 21  22  28  29  29  29  32.

Vì cỡ mẫu là 11 là số lẻ nên tứ phân vị thứ hai là Q2 = 22.

Tứ phân vị thứ nhất là trung vị của mẫu: 19; 19; 20; 21; 21. Do đó Q1 = 20.

Tứ phân vị thứ ba là trung vị của mẫu: 28; 29; 29; 29; 32. Do đó Q3 = 29.

Vậy tứ phân vị của mẫu số liệu là Q1=20,Q2=22,Q3=29. Chọn D.

Ví dụ 3. Một vườn thú ghi lại tuổi thọ (đơn vị: năm) của 20 con hổ và thu được kết quả như sau:

Thống kê (Chuyên đề Toán ôn thi Tốt nghiệp 2025)

Nhóm chứa tứ phân vị thứ nhất của mẫu số liệu trên là

A. [14; 15).

B. [15; 16).

C. [16; 17).

D. [17; 18).

Lời giải

Ta có bảng sau:

Thống kê (Chuyên đề Toán ôn thi Tốt nghiệp 2025)

Nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng n4=204=5 là nhóm [16; 17). Chọn C.

................................

................................

................................

Xem thử Đề thi Tốt nghiệp Toán 2025 Xem thử Đề thi thử Tốt nghiệp Toán 2025 Xem thử Chuyên đề ôn thi Tốt nghiệp Toán

Xem thêm các chuyên đề ôn thi tốt nghiệp THPT môn Toán năm 2025 có đáp án hay khác:


Giải bài tập lớp 12 sách mới các môn học