Tìm kiếm tài liệu miễn phí

Bài giảng Xử lý dữ liệu trong sinh học với phần mềm Excel - Bài 4: Hồi quy tương quan

Bài giảng cung cấp cho người học các kiến thức: Hồi quy tương quan, phân tích đồ thị, phân tích số liệu, thống kê phân tích,... Hi vọng đây sẽ là một tài liệu hữu ích dành cho các bạn sinh viên đang theo học môn dùng làm tài liệu học tập và nghiên cứu. Mời các bạn cùng tham khảo chi tiết nội dung tài liệu.



Đánh giá tài liệu

0 Bạn chưa đánh giá, hãy đánh giá cho tài liệu này


  • 5 - Rất hữu ích 0

  • 4 - Tốt 0

  • 3 - Trung bình 0

  • 2 - Tạm chấp nhận 0

  • 1 - Không hữu ích 0

Mô tả

Bài 4 HỒI QUY TƢƠNG QUAN
Nếu có cặp biến ngẫu nhiên X, Ythì để đánh giá mối quan hệ tuyến tính giữa X và Y
ta tính hệ số tƣơng quan rXY .
Hệ số tƣơng quan lý thuyết đƣợc định nghĩa là
XY

=

E{( X

EX )(Y

EY )}

E{( X

=

EX )(Y

DX .DY

X

EY ) }

Y

với E là ký hiệu của kỳ vọng toán học, D là phƣơng sai, là độ lệch chuẩn
Trong xử lý số liệu sau khi thu thập số liệu ta để n cặp số liệu thành 2 cột hay hai hàng
(nên để 2 cột vì thuận tiên cho các thao tác sau nàyn).
Nếu tính trực tiếp có thể dùng công thức sau:
n

n

( xi
Phƣơng sai của X

s2 X =

x)

xi2

2

i 1

(n

i 1

=

1)

( n 1)

n

n

y)2

( yi
Phƣơng sai của Y

s2 Y =

nx 2

i 1

yi2
=

( n 1)

ny 2

i 1

(n

1)

n

n

( xi
Hiệp phƣơng sai XY covar (X,Y) =

x )( yi

i 1

(n

1)

y)

xi yi
=

nx y

i 1

(n

1)

Trong các công thức trên có thể tính tổng bằng hàm Sum(dãy số), tính tổng bình
phƣơng bằng hàm Sumsq (dãy số), tổng các tich số bằng hàm Sumproduct (dãy1, dãy 2)
Nếu dùng hàm định sẵn thì s2X = var(dãyX) s2Y = var(dãyY)
Hiệp phƣơng sai = Covar(dãyX, dãyY)
Hệ số tƣơng quan rXY = Covar(X,Y)/(sX sY) hoặc hàm định sẵn Correl(dãyX, dãyY)
Hệ số tƣơng quan dƣơng kết luận tƣơng quan thuận, âm kết luận tƣơng quan nghịch
Để kiểm định giả thiết
r n 2
H0: XY = 0 đối thiết H1: XY 0 có thể tính Ttn =
sau đó
1 r2
so với Tlt = Tinv( /2, n-2) tức là giá trị trong bảng Student ở mức ý nghĩa với n - 2
bậc tự do.
Tiếp theo là tìm đƣờng hồi quy tuyến tính Y theo X, đƣờng thẳng này có phƣơng trình
Y = a + bX
a là tung độ gốc, b là hệ số góc
b tính theo công thức b = r sY / sX

a=

y -ax

Dùng hàm định sẵn thì a = Intercept(dãy Y, dãy X), b = Slope(dãy Yd, dãy X)
Cũng có thể dùng hàm Linest (Dãy Y, dãy X, 0,1) để tìm đầy đủ a, b, r2 , các sai số .. .
NDHien

Khi có một bảng nhiều biến thì nên vào Data Analysis để tính một bảng các hệ số
tƣơng quan giữa các biến bằng mục Correlation, tính một bảng các phƣơng sai và hiệp
phƣơng sai bằng mục Covariance và tìm hồi quy tuyến tính hoặc bội tuyến tính bằng mục
Regression, hai mục đầu không có gì đặc biệt, chỉ việc khai báo miền vào (Input range) bao
gồm tất cả các cột số liệu, sau đó chọn Label (nếu có têncột ở dòng đầu), miền ra (Output
range)
Phần Regression nên chọn Option Residuals và Line fit plots sẽ đƣợc một bảng tóm
tắt các thống kê, một bảng phân tích phƣơng sai, một bảng các giá trị của các hệ số hồi quy
cùng các kiểm định Student, một bảng các phần dƣ (Residu) và các đồ thị. Nếu làm hồi quy
bội tuyến tính thì chú ý miền X bao gồm các cột chứa các biến, đặt sát nhau, bao gồm cả hàng
đầu chứa tên biến, nếu có k biến thì sẽ đƣợc k đồ thị hồi quy đơn tuyến tính của Y theo
biến 1, Y theo biến 2, . . , Y theo biÕn k.
X1
52
33
72
15
40
32
76
10
68
57
24
46
35
54
66

X2
40
37
95
58
20
41
54
85
70
109
62
75
55
68
82

X3
81
90
66
40
75
80
83
70
65
45
64
71
82
63
68

Y
5.5
2.1
20.5
9.6
1.7
3.8
10.3
11.7
15.2
24.4
9.3
13
6.5
13.8
16.6

X1
X2
X3
Y

B¶ng hÖ sè t-¬ng quan
X1
X2
X3
1
0.27507
1
0.09303
-0.58
1
0.49827 0.94999
-0.6297

B¶ng hiÖp ph-¬ng sai
X1
X2
X3
X1
424.095
X2
134.643 564.971
X3
26.1667
-188.3
186.55
Y
67.4238 148.371
-56.512
Trªn ®-êng chÐo lµ ph-¬ng sai cña c¸c biÕn
X1, X2, X3, Y

Y

1

Y

43.2

Input Range trong mục Correlation bao gồm toàn bộ các cột chứa X1, X2, X3, Y
Vì hàng đầu có tên các biến nên khai LabelsV, kết quả ta đƣợc một bảng, tại các chỗ giao
nhau giữa hàng và cột ta đƣợc hệ số tƣơng quan rX1X2, rX1X3, . . .

NDHien

Tƣơng tự nhƣ vậy vào mục Covariance và khai báo nhƣ mục Correlation, kết quả
đƣợc một bảng, trên đƣờng chéo là các phƣơng sai còn tại chỗ giao nhau giữa hàng và cột ta
đƣợc hiệp phƣơng sai, đem hiệp phƣơng sai của hai biến chia cho căn của tích số hai phƣơng
sai ta đƣợc hệ số tƣơng quan.
Nếu chọn Regression thì Input Y Range là cột chứa Y, Input X Range gồm các cột
chứa X1, X2, X3. Chọn Labels vì hàng đầu có tên các biến. Bỏ qua Constant is Zero và
Confidece level (tức là để nguyên 95%). Phần Options chọn Residuals và Line fit plots còn
bỏ qua Standardized residuals, Residual plots, Normal Probability Plot.

KÕt qu¶ nh- sau:
Summary statistics
Regression Statistics
Multiple R
0.99891
R Square
0.99783
ádjusted R
0.99723
Square
Standard ìrror
0.34561
ơbservations
15
Anova
df
Regression
3

SS
603.139

MS
201.05

Residual
Total

1.31388
604.453

0.1194
se2

11
14

Coefficien
ts
ìntercept
1.69692
X1
0.10283
X2
0.19943
X3
-0.116
Hệ số
Phần dƣ (sai số)
NDHien

Bảng tóm tắt các thống kê
Các thống kê về hệ số tƣơng quan
Hệ số tƣơng quan bội R
Hệ số xác định R2
Hệ số xác định R2 điều chỉnh
Sai số chuẩn se
Số quan sát n
Bảng phân tích phƣơng sai
F
Significance F
1683
6.38E-15
Mức ý nghĩa
F thực nghiệm

Các hệ số trong hồi quy bội tuyến tính
Standar t Stat
P-value Lower 95%
d error
0.80419 2.1101
0.06
-0.0731
0.00493 20.863
0 0.091978
0.00522 38.212
0 0.187947
0.00877 -13.232
0
-0.13535
Sai số Giá trị T Mức ý nghĩa Cận dƣới

Upper
95%
3.466928
0.113673
0.210922
-0.09674
Cận trên

Residuals
Quan sát Dự báo theo Phần dƣ
hồi quy
ơbservation Predicted Residual
Y
Yhq
e
1 5.62139 -0.1214
2 2.02496 0.07504
3 20.3875 0.11247
4 10.1646 -0.5646
5 1.09507 0.60493
6 3.88035 -0.0804
7 10.6492 -0.3492
8 11.5538 0.14621
9 15.1064 0.0936
10 24.0742 0.32578
11 9.10264 0.19736
12 13.1451 -0.1451
13 6.74882 -0.2488
14 13.5001 0.29993
15 16.9458 -0.3458

Chú thích
e = Y - Yhq

Ngoµi ra cßn ®-îc 3 ®å thÞ håi quy tuyÕn tÝnh ®¬n Y theo X1, Y theo X2, Y theo X3

Y

X1 Line Fit Plot

y = 0.159x + 3.7261
R2 = 0.2483

30
25
20
15
10
5
0

Y
Linear (Y)

0

20

40

60

80

X1

Y

X2 Line Fit Plot

y = 0.2626x 5.7166
R2 = 0.9025

X3 Line Fit Plot
30

20

20

Y

10

Linear
(Y)

10
Linear
(Y)

0
-10 0

Y

Y

30

y = -0.3029x +
31.997
R2 = 0.3965

100
X2

200

0
0

50

100

X3

Ba đồ thị này khi vẽ ra có 2 dãy điểm, dãy quan sát Y, dãy dự báo theo hồi quy mầu
hồng Yhq, ta có thể vào chế độ đồ thị xoá dãy Yhq, sau đó nháy sáng dãy Y, Insert Trend line
để vẽ đƣờng hồi quy và thêm phƣơng trình, thêm hệ số R2.
NDHien

Vì Excel muốn giải quyết nhiều vấn đề nên ở phần thống kê chỉ tính toán những điểm
chủ yếu, chứ không đi sâu phân tích nhƣ ở các bộ chƣơng trình chuyên dụng để tính thống kê
SPSS, Statistica, SAS, MstatC, Statgraphics, . . . Ngoài các phần trình bầy ở trên còn có phần
tạo số ngẫu nhiên, chọn mẫu, tìm đƣờng trung bình trƣợt, làm trơn số liệu, biến đổi Fourrier. .
.mà do khuôn khổ của bài giảng chúng ta không đề cập tới.

NDHien

Tài liệu cùng danh mục Tin học văn phòng

Managing Your Junk Mail

Managing Your Junk Mail Junk email and spam are a problem everyone faces. It's not hard to get on a spammer's list, but it's difficult to get off the list. Outlook 2003 includes an improved junk mail filter that includes safe senders,


Lưu trữ, chia sẻ dữ liệu trực tuyến với YourFileLink

Lưu trữ, chia sẻ dữ liệu trực tuyến với YourFileLink Người dùng dịch vụ miễn phí này không cần đăng ký tài khoản, không giới hạn số lần upload trên một máy hoặc băng thông hay số lần tải về của một tập tin, được hỗ trợ đa định dạng tập tin... Các dịch vụ lưu trữ dữ liệu trực tuyến để chia sẻ với người khác khi người dùng không có một hosting đang nở rộ, tiêu biểu như RapidShare, MagaUpload, MediaFire… Thế nhưng, nhược điểm chung của các dịch vụ trên là việc phải đăng ký tài khoản...


Báo cáo: Lặp với số lần chưa biết trước, nhóm 2

Tham khảo tài liệu 'báo cáo: lặp với số lần chưa biết trước, nhóm 2', công nghệ thông tin, tin học văn phòng phục vụ nhu cầu học tập, nghiên cứu và làm việc hiệu quả


Bài giảng Microsoft Access - ĐH Nông Lâm TP. HCM

(LHNB) Bài giảng Microsoft Access được biên soạn nhằm trang bị cho các bạn những kiến thức về giới thiệu Microsoft Access; tạo cấu trúc và nhập dữ liệu cho table; thiết lập quan hệ giữa các table; thao tác trên dữ liệu của table; truy vấn dữ liệu - select query và một số nội dung khác.


Excel 2002 Formulas phần 6

Ví dụ, công thức mảng sau đây trả về sự thay đổi lớn nhất (có nghĩa là, sự cải thiện lớn nhất). Công thức này trả về 23, trong đó đại diện cho các điểm thi củaCác công thức mảng sau đây trả về thay đổi nhỏ nhất (có nghĩa là, sự cải thiện ít nhất). Công thức này trả về -11, đại diện cho các điểm thi của


Tự động thay đổi hình nền desktop

Tự động thay đổi hình nền desktop Windows chỉ cho phép sử dụng 1 hình nền trên desktop khiến đôi lúc bạn thấy nhàm chán. Hãy thử để desktop của Windows tự động thay đổi hình bằng các thủ thuật trong bài viết dưới đây. Windows 7 Là hệ điều hành mới nhất của Microsoft, Windows 7 được trang bị thêm rất nhiều tính năng hữu ích, trong đó có tính năng tự động thay đổi hình nền của desktop. ...


“Lên đời” toàn diện cho PC? (Phần I)

“Lên đời” toàn diện cho PC? (Phần I) Máy tính chạy như bão cấp 12 luôn là điều người dùng ao ước. Với những chiếc PC cũ, lên được cấp 7 cũng làm người dùng hài lòng. Chúng ta hãy cùng tìm hiểu quá trình đó qua loạt bài viết dưới đây. Dường như đến lúc nào đó sau một thời gian dài sử dụng, bạn sẽ thấy chiếc PC thân yêu của mình ngày càng ì ạch ngang với “rùa bò” và không đáp ứng được nhu cầu sử dụng. Khi đó, hầu như tất cả người dùng đều...


Điều khiển logic - Ngôn ngữ lập trình và ứng dụng - Lâm Tăng Đức - 3

Lệnh thực hiện việc chuyển dữ liệu từ Word IN vào Word OUT khi có sườn lên của tín hiệu vào. IN: IW, QW, VW, LW, SW, AIW, T, C, AC, Constant, ∗VD, ∗AC, ∗LD OUT: IW, QW, MW, SMW, VW, LW, SW, AIW, T, C, AC, ∗VD, ∗AC, ∗LD Word, INT IN: ID, QD, MD, VD, SMD, SD, LD, HC,AC, &VB, MOV_DW &IB, &QB, &SB, EN &MB, &T, &C, IN OUT DoubleWord, Constant, ∗VD, MOVD IN, OUT DINT ∗AC, ∗LD OUT: ID, QD, MD, VD, SMD, SD, LD, HC,AC, ∗VD, ∗AC, ∗LD Lệnh thực hiện IN: ID, QD, MD, việc chuyển dữ...


Cách vô hiệu tính năng Auto-Complete trong Outlook 2013

.Tính năng Auto-Complete trong Outlook 2013 tự động điền tên, địa chỉ email khi bạn nhập chúng vào trường To hoặc Cc. Dựa trên các ký tự mà bạn bắt đầu nhập, Outlook sẽ hiển thị danh sách các lựa chọn có thể, phù hợp với những gì bạn đã nhập. Sau đó, có thể nhấp vào địa chỉ email mong muốn trong danh sách hoặc nhấn Enter để chèn địa chỉ email. Tính năng Auto-Complete có thể giúp tiết kiệm thời gian nếu viết nhiều email và có nhiều địa chỉ liên lạc trong sổ địa chỉ. Tuy nhiên,...


Giới thiệu chung về INFOPATH 2010 phần 7

Lúc đó, trên phần thiết kế sẽ hỏi các Control sử dụng cho file XML ở phần trước. Ở đây, có thể chọn bất kỳ Control nào trong nhóm để sử dụng. Trong phần này sử dụng Control Numbered List để thử các định dạng XML.


Tài liệu mới download

13 Đề kiểm tra HK2 GDCD lớp 9
  • 11/09/2013
  • 37.323
  • 366

Từ khóa được quan tâm

Có thể bạn quan tâm

HỆ SOẠN THẢO MICROSOFT - WORD
  • 22/12/2009
  • 54.880
  • 499
Hack pass admin trong Windows XP
  • 25/10/2009
  • 16.826
  • 568

Bộ sưu tập

Danh mục tài liệu