Tìm kiếm tài liệu miễn phí

Bài giảng Ngôn ngữ R và xử lý thống kê - Phần 2: Sử dụng R cho tính toán xác suất

Bài giảng cung cấp cho người học các kiến thức: Sử dụng R cho tính toán xác suất, biến ngẫu nhiên và hàm phân phối, hàm phân phối Poisson,... Hi vọng đây sẽ là một tài liệu hữu ích dành cho các bạn sinh viên đang theo học môn dùng làm tài liệu học tập và nghiên cứu. Mời các bạn cùng tham khảo chi tiết nội dung tài liệu.



Đánh giá tài liệu

0 Bạn chưa đánh giá, hãy đánh giá cho tài liệu này


  • 5 - Rất hữu ích 0

  • 4 - Tốt 0

  • 3 - Trung bình 0

  • 2 - Tạm chấp nhận 0

  • 1 - Không hữu ích 0

Mô tả

R

7 - Sử dụng R cho tính toán xác suất
7.1 Hoán vị (permutation)
Chúng ta biết 3! = 3.2.1 = 6, và 0!=1. Nói chung, công thức tính số hoán vị cho
một số n là:n! n n -1 n - 2 n - 3

... 1. Trong R cách tính này rất đơn giản với

lệnh prod() như sau:
Tìm 3!
> prod(3:1)
[1] 6
Tìm 10!
> prod(10:1)
[1] 3628800
Tìm 10.9.8.7.6.5.4
> prod(10:4)
[1] 604800
Tìm (10.9.8.7.6.5.4) / (40.39.38.37.36)
> prod(10:4) / prod(40:36)
[1] 0.007659481
7.2 Tổ hợp (combination)

Tổ hợp tính bằng hàm choose(n,k) Thí dụ choose(5,2) = 10
7.3 Biến ngẫu nhiên và hàm phân phối
Khi nói đến “phân phối” (hay distribution) là đề cập đến các giá trị mà biến có thể
có. Các hàm phân phối (distribution function) là hàm mô tả các biến đó một cách hệ
thống. “Có hệ thống” ở đây có nghĩa là theo một mô hình toán học cụ thể với những
thông số cho trước. Trong xác suất thống kê có khá nhiều hàm phân phối, chúng ta sẽ
em xét qua một số hàm quan trọng nhất và thông dụng nhất: đó là phân phối nhị phân,
phân phối Poisson, và phân phối chuẩn. Trong mỗi luật phân phối, có 4 loại hàm quan
trọng mà chúng ta cần biết:
hàm mật độ xác suất (probability density distribution);
hàm phân phối tích lũy (cumulative probability distribution);
hàm định bậc (quantile); và
hàm mô phỏng (simulation).
R có những hàm đi nh sẵn có thể ứng dụng cho tính toán xác suất. Tên mỗi hàm được
gọi bằng một tiếp đầu ngữ để chỉ loại hàm phân phối, và viết tắt tên của hàm đó. Các tiếp đầu
ngữ là d (chỉ distribution hay xác suất), p (chỉ cumulative probability, xác suất tích lũy),
NDH

18

R

q (chỉ định bậc hay quantile), và r (chỉ random hay số ngẫu nhiên). Các tên viết tắt là norm
(normal, phân phối chuẩn), binom (binomial , phân phối nhị phân), pois (Poisson, phân
phối Poisson), v.v… Bảng sau đây tóm tắt các hàm và thông số cho từng hàm:
Mật độ
Tích lũy
Định bậc
Mô phỏng
pphoi

Chuẩn

dnorm(x, mean,sd)

pnorm(q, mean, sd)

qnorm(p, mean, sd)

rnorm(n, mean, sd)

Nhị phân

dbinom(k, n, p)

pbinom(q, n, p)

qbinom (p, n, p)

rbinom(k, n, prob)

Poisson

dpois(k, lambda)

ppois(q, lambda)

qpois(p, lambda)

rpois(n, lambda)

Uniform

dunif(x,min,max)

punif(q, min, max)

qunif(p, min, max)

runif(n, min, max)

Negative

dnbinom(x, k, p)

pnbinom(q, k, p)

qnbinom (p,k,prob)

rbinom(n, n, prob)

dbeta(x,

pbeta(q,shape1,

qbeta(p,shape1,

rbeta(n,shape1,

shape1,shape2)

shape2)

shape2)

shape2)

dgamma(x, shape,

gamma(q,shape

qgamma(p,shape

rgamma(n, shape,

rate, scale)

,rate,scale)

, rate, scale)

rate, scale)

Geometric

dgeom(x, p)

pgeom(q, p)

qgeom(p, prob)

rgeom(n, prob)

Exponentia

dexp(x, rate)

pexp(q, rate)

qexp(p, rate)

rexp(n, rate)

binomial
Beta

Gamma

l
Weibull
Cauchy

dnorm(x, mean, sd)

pnorm(q, mean, sd)

qnorm(p, mean, sd)

rnorm(n, mean, sd)

dcauchy(x, location,

pcauchy(q,

qcauchy(p,

rcauchy(n,

scale)

location, scale)

location, scale)

location, scale)

F

df(x, df1, df2)

pf(q, df1, df2)

qf(p, df1, df2)

rf(n, df1, df2)

T

dt(x, df)

pt(q, df)

qt(p, df)

rt(n, df)

Chi-

dchisq(x, df)

pchi(q, df)

qchisq(p, df)

rchisq(n, df)

squared

NDH

19

R

Chú thích: Trong bảng trên, df = degrees of freedome (bậc tự do);prob = probability
(xác suất); n = sample size (số lượng mẫu). Các thông số khác có thể tham khảo
thêm cho từng luật phân phối. Riêng các luật phân phối F, t, Chi-squared còn có một
thông số khác nữa là non-centrality parameter (ncp) được cho số 0. Tuy nhiên người
sử

dụng



thể

cho

một

thông

số

khác

thích

hợp,

nếu

cần.

NDH

20

R

7.3.2 Hàm phân phối Poisson (Poisson distribution)
Hàm phân phối Poisson, nói chung, rất giống với hàm nhị phân, ngoại trừ thông
số p thường rất nhỏ và n thường rất lớn. Vì thế, hàm Poisson thường được sử dụng để
mô tả các biến số rất hiếm xảy ra (như số người mắc ung thư trong một dân số chẳng
hạn). Hàm Poisson còn được ứng dụng khá nhiều và thành công trong các nghiên cứu kĩ
thuật và thị trường như số lượng khách hàng đến một nhà hàng mỗi giờ.
NDH

21

R

Ví dụ 4: Hàm mật độ Poisson (Poisson density probability function). Qua
theo dõi nhiều tháng, người ta biết được tỉ lệ đánh sai chính tả của một thư kí đánh máy.
Tính trung bình cứ khoảng 2.000 chữ thì thư kí đánh sai 1 chữ. Hỏi xác suất mà thư kí
đánh sai chính tả 2 chữ, hơn 2 chữ là bao nhiêu?
Vì tần số khá thấp, chúng ta có thể giả định rằng biến số “sai chính tả” (tạm đặt
tên là biến số X) là một hàm ngẫu nhiên theo luật phân phối Poisson. Ở đây, chúng ta có tỉ
lệ sai chính tả trung bình là 1 λ = 1). Luật phân phối Poisson phát biểu rằng xác suất
mà X = k, với điều kiện tỉ lệ trung bình λ

p(X = k) = e-λ λk /k!

Do đó, đáp số cho câu hỏi trên là: e -1 /2! = 0,1839
tính bằng R một cách nhanh chóng hơn bằng hàm dpois như sau:
> dpois(2, 1)
[1] 0.1839397

Chúng ta cũng có thể tính xác suất sai 1 chữ, và xác suất không sai chữ nào:
> dpois(1, 1)
[1] 0.3678794
> dpois(0, 1)
[1] 0.3678794
> dpois(2,1)

Chú ý trong hàm trên, chúng ta chỉ đơn giản cung cấp thông số k = 2 và λ = 1. Trên đây là
xác suất mà thư kí đánh sai chính tả đúng 2 chữ. Nhưng xác suất mà thư kí đánh sai
chính tả hơn 2 chữ (tức 3, 4, 5, … chữ) có thể ước tính bằng:
P X 2 P X 3 P X 4 P( X 5) ...
= 1 X ≤ 2 = 1 – 0.3678 – 0.3678 – 0.1839
Bằng R, chúng ta có thể tính như sau:
# P(X ≤ 2) > ppois(2, 1) [1] 0.9196986
# 1-P(X ≤ 2)

= 0.08

> 1-ppois(2, 1) [1] 0.0803014

7.3.3 Hàm phân phối chuẩn (Normal distribution)
Hai luật phân phối mà chúng ta vừa xem xét trên đây thuộc vào nhóm phân phối
áp dụng cho các biến số phi liên tục (discrete distributions), mà trong đó biến số có
những giá trị theo bậc thứ hay thể loại. Đối với các biến số liên tục, có vài luật phân phối
thích hợp khác, mà quan trọng nhất là phân phối chuẩn. Phân phối chuẩn là nền tảng
quan trọng nhất của phân tích thống kê. Có thể nói hầu hết lí thuyết thống kê được xây
dựng trên nền tảng của phân phối chuẩn.
Hàm mật độ phân phối chuẩn có dạng:

NDH

22

Tài liệu cùng danh mục Tin học văn phòng

Tạo mục lục cho văn bản trong Word 2003

Bạn đã soạn xong một tài liệu dài, bao gồm rất nhiều chương mục, mỗi mục lại có các số La Mã bên trong đó, việc cuối cùng bạn muốn làm với tài liệu trước khi in là tạo một mục lục cho nó sao cho giống các quyển sách trên thị trường, vậy phải làm sao? Bạn yên tâm, Microsoft Word là một chương trình soạn thảo văn bản đồ sộ, chắc chắn phải có tính năng này, để làm việc đó bạn thực hiện như sau....


GIỚI THIỆU ACCESS

Tham khảo bài thuyết trình 'giới thiệu access', công nghệ thông tin, tin học văn phòng phục vụ nhu cầu học tập, nghiên cứu và làm việc hiệu quả


Tạo kết nối quay số trong Windows XP

Kết nối quay số (Dial-up) là kiểu kết nối sử dụng Modem và đường truyền điện thoại. Đây là kiểu kết nối có tốc độ chậm dùng để truy cập Internet, fax và các chức năng khác của máy vi tính. Bài viết này sẽ hướng dẫn một trong các cách tạo kết nối quay số trong Windows XP. Chuẩn bị   Máy vi tính của bạn phải được trang bị Modem và đã được cài chương trình điều khiển (Driver). Kết nối dây tín hiệu điện thoại vào cổng Line của Modem. Xem hướng dẫn cách cài đặt Modem. Các bước cài...


The Rational Unified Process

RUP is a complete software-development process framework that comes with several out-of-the-box instances. Processes derived from RUP vary from lightweight— addressing the needs of small projects with short product cycles—to more comprehensive processes addressing the broader needs of large, possibly distributed, project teams


Những Ứng Dụng Của Tin Học

V i s tr giúp c a các ch ng ớ ự ợ ủ ươ trình soạn thảo và xử lí văn bản , xử lí ảnh , các phương tiện in gắn với máy tính , tin học đã tạo cho việc biên soạn các văn bản hành chính , lập kế hoạch công tác , luân chuyển văn thư , công nghiệp in ấn ,… một bộ mặt hoàn toàn mới.


Sử dụng Pro/II

Để khởi động chương trình kích đôi chuột vào biểu tượng của chương trình từ menu star. Cửa sổ chào mừng của Pro/II xuất hiện. Cửa sổ này có chứa các thông tin về các mở và các màu khóa được dùng trong chương trình


So sánh IE9, Chrome 10 và Firefox 4

Cuôc đua trinh duyêt đang đươc cac tên tuôi lơn đây manh trong thơi gian gân đây khi Microsoft chinh thưc trinh lang IE9, Firefox 4 có phiên ban RC va Google Chrome cung câp nhât lên phiên ban 10. Vây, trinh duyêt nao tôt nhât để lưa chon khi lươt web? Cac phiên ban mơi nhât cua 3 thương hiêu trinh duyêt lơn danh cho may tinh nay đã thưc sư có nhiêu cai tiến vê măt tôc đô, hỗ trơ cho chuân web mơi nhât, gia tôc phân cưng va cac tinh năng đôc đao khac. Nhưng...


6 điều “yêu và ghét” của Internet Explorer 9- P2

Tham khảo tài liệu '6 điều “yêu và ghét” của internet explorer 9- p2', công nghệ thông tin, tin học văn phòng phục vụ nhu cầu học tập, nghiên cứu và làm việc hiệu quả


CÁCH XỬ LÝ 326 LỖI THƯỜNG GẶP KHI DÙNG MÁY TÍNH (P10)

Tạo chữ chéo theo cạnh tam giác trong Excel dán ảnh vào Word. Khi gặp một hình tam giác bạn muốn tạo dòng chữ chạy theo một cạnh của nó, nếu máy tính của bạn cài Word97 bạn phải nhờ Excel hỗ trợ cách làm như sau: +Khởi động chương trình Excel97.//+Nháy vào nút công cụ Drawing để hiện thanh công cụ vẽ.//+Nháy vào mục AutoShapes (Khuôn mẫu) và vẽ một tam giác.//+Đạt con trỏ vào một ô và gõ chữ Đường chéo.//+Nháy vào Format\Cells. +Chọn nhãn Alignment và quay chữ Text theo chiều cạnh tam giác....


Ưu và nhược điểm của TMĐT

Tất cả các công ty đều rất quan tâm tới TMĐT đơn giản vì nó có thể giúp họ tăng thêm lợi nhuận qua việc tăng lượng bán và giảm chi phí, tuy nhiên cũng có một số hoạt động kinh doanh không thích hợp với TMĐT.


Tài liệu mới download

TCVN 7801:2008
  • 02/05/2018
  • 12.021
  • 248

Từ khóa được quan tâm

Có thể bạn quan tâm

Home Networking Bible 2nd phần 9
  • 02/11/2011
  • 18.471
  • 972
Open Source Business Models
  • 13/03/2009
  • 69.295
  • 109

Bộ sưu tập

Danh mục tài liệu