Tìm kiếm tài liệu miễn phí

Bài giảng Ngôn ngữ R và xử lý thống kê - Phần 1: Giới thiệu ngôn ngữ R

Bài giảng cung cấp cho người học các kiến thức: Giới thiệu ngôn ngữ R, cài đặt R, tải các package và cài đặt, văn phạm R, nhập dữ liệu trong R,... Hi vọng đây sẽ là một tài liệu hữu ích dành cho các bạn sinh viên đang theo học môn dùng làm tài liệu học tập và nghiên cứu. Mời các bạn cùng tham khảo chi tiết nội dung tài liệu.



Đánh giá tài liệu

0 Bạn chưa đánh giá, hãy đánh giá cho tài liệu này


  • 5 - Rất hữu ích 0

  • 4 - Tốt 0

  • 3 - Trung bình 0

  • 2 - Tạm chấp nhận 0

  • 1 - Không hữu ích 0

Mô tả

Trường Đại học Nông nghiệp Hà nội

Tài liệu tham khảo

Ngôn ngữ R và xử lý thống kê

Nguyễn đình Hiền
Hà nội 2011

R

Giới thiệu ngôn ngữ R
Năm 1996, trong một bài báo về tính toán thống kê, hai nhà thống kê học Ross
Ihaka và Robert Gentleman thuộc Trường đại học Auckland, New Zealand phác hoạ một
ngôn ngữ mới cho phân tích thống kê mà họ đặt tên là R . Sáng kiến này được rất nhiều
nhà thống kê học trên thế giới tán thành và tham gia vào việc phát triển R.
Cho đến nay càng ngày càng có nhiều nhà thống kê học, toán học, nghiên cứu trong
mọi lĩnh vực đã chuyển sang sử dụng R để phân tích dữ liệu khoa học.Trên toàn cầu đã có
một mạng lưới hàng triệu người sử dụng R.
R là một phần mềm sử dụng cho phân tích thống kê và vẽ biểu đồ. Thật ra, về bản
chất, R là ngôn ngữ máy tính đa năng, có thể sử dụng cho nhiều mục tiêu khác nhau, từ
tính toán đơn giản, toán học giải trí, tính toán ma trận (matrix), đến các phân tích thống kê
phức tạp. Vì là một ngôn ngữ, cho nên người ta có thể sử dụng R để phát triển thành các
phần mềm chuyên môn cho một vấn đề tính toán cá biệt.

Cài đặt R
Để cài đặt R trong máy tính của mình phải truy nhập vào website “Comprehensive
R Archive Network” (CRAN) sau đây:
http://cran.R-project.org.
sau đó chọn Cran mirrors thí dụ

Dựa vào vào phiên bảnvà hệ điều hành để chọn tài liệu cần tải về.

NDH

2

R

Chẳng hạn như phiên bản mới nhất dùng cho Windows

Tại các website này có thể tìm thấy rất nhiều tài liệu chỉ dẫn cách sử dụng R, đủ
trình độ, từ đơn giản đến phức tạp.
Khi đã tải R xuống phải cài đặt vào máy tính. Để làm việc này cần nhấn chuột
vào tài liệu trên và làm theo hướng dẫn cách cài đặt trên màn hình.
Sau khi cài đặt nhấp chuột vào biểu tượng R

sẽ có một cửa sỏ như sau:

Dấu mời

> báo hiệu máy đã sẵn sàng đợi lệnh để thực hiện.

2. Tải các package và cài đặt
R cung cấp một “ngôn ngữ” máy tính và một số function để làm các phân tích căn
bản và đơn giản. Nếu muốn làm những phân tích phức tạp hơn cần phải tải về máy tính
một số package khác. Package là một phần mềm nhỏ được các nhà thống kê phát triển để
giải quyết một vấn đề cụ thể, và có thể chạy trong hệ thống R. Chẳng hạn như để phân
tích hồi qui tuyến tính, R có function lm để sử dụng cho mục đích này, nhưng để làm
các phân tích sâu hơn và phức tạp hơn cần đến các package như lme4. Các package này

NDH

3

R

cần tải về và cài đặt. Địa chỉ các package vẫn là: http://cran.r-project.org, bấm vào
phần Packages”để tìm, kèm các trang web đẻ tải về. Một số package thường dùngtrong
các phân tích thống kê là:

trellis

Chức năng
Dùng để vẽ đồ thị và làm cho đồ thị đẹp hơn

lattice

Dùng để vẽ đồ thị và làm cho đồ thị đẹp hơn

agricolae

Statistical Procedures for agricultural Research

Design

Một số mô hình thiết kế nghiên cứu của F. Harrell

Epi

Dùng cho các phân tích dịch tễ học

epitools

Một package khác chuyên cho các phân tích dịch tễ học

Foreign

Dùng để nhập dữ liệu từ các phần mềm khác như
SPSS, Stata, SAS, v.v…
Linear mixed effects models
R commander
Spearman’ s rank correlation test

Tên package

lme4
Rcmdr
pspearman
survival
Zelig
Genetics
BMA

Chuyên dùng cho phân tích theo mô hình Cox (Cox’s
proportional hazard model)
Package dùng cho các phân tích thống kê trong lĩnh
vực xã hội học
Package dùng cho phân tích số liệu di truyền học
Bayesian Model Average

Các package này có thể cài đặt trực tuyến bằng cách chọn Install packages trong phần
packages của R. Nếu package đã được tải xuống máy tính việc cài đặt có thể nhanh hơn
bằng cách chọn Install package(s) from local zip file cũng trong phần packages .

3. Văn phạm R
R là một ngôn ngữ tương tác (interactive language), có nghĩa là khi chúng ta ra
lệnh, và nếu lệnh đúng “văn phạm”, R sẽ “đáp” lại bằng một kết quả. Và tương tác đó
tiếp tục cho đến khi đạt được yêu cầu. “Văn phạm” chung của R là một lệnh (command)
hay function ( “hàm”). Mà đã là hàm thì phải có thông số; cho nên theo sau hàm là
những thông số mà chúng ta phải cung cấp. Cú pháp chung của R như sau:
đối tượng reg setwd(“d:/nnR/thongke”)
thì setwd là một hàm, còn “d:/nnR/thongke” là thông số của hàm.

NDH

4

R

Để biết một hàm cần có những thông số nào, chúng ta dùng lệnh args(x), (args
viết tắt chữ arguments) mà trong đó x là một hàm chúng ta cần biết:
> args(lm)
function (formula, data, subset, weights, na.action, method = "qr",
model = TRUE, x = FALSE, y = FALSE, qr = TRUE, singular.ok = TRUE,
contrasts = NULL, offset, ...)
NULL

R là một ngôn ngữ “đối tượng” (object oriented language). Điều này có nghĩa là
các dữ liệu trong R được chứa trong object. Định hướng này ảnh hưởng đến cách viết của
R. Chẳng hạn như thay vì viết x = 5 như thông thường chúng ta vẫn viết, thì R yêu cầu
viết là x == 5.
Đối với R, x = 5 tương đương với x # lệnh sau đây sẽ mô phỏng 10 giá trị normal
> x myobject my object

Tài liệu cùng danh mục Tin học văn phòng

Tài liệu Microsoft Office Word 2003

Bài 1: Làm quen với chương trình I. Khởi động và thoát khỏi microsoft word: 1. Khởi động Word: Có 2 cách để khởi động Microsoft Word. Cách 1: Nhấn Windows+M để đến cửa Desktop. Nhấn chữ M để tìm đến biểu tượng chương trình Microsoft Office Word 2003. Nhấn Enter để khởi động chương trình.


Bài giảng Tin học đại cương: Chương 1 - Đại cương về tin học

Chương 1 "Đại cương về tin học" thuộc bài giảng Tin học đại cương được thiết kế và trình chiếu trên Powerpoint, dành cho đào tạo trình độ sơ cấp nghề. Mời các bạn cùng tham khảo nội dung bài giảng để nắm bắt thông tin chi tiết.


Modul Pelatihan Komputer Microsof Word 2003

Modul Pelatihan Komputer Microsof Word 2003 Microsoft Office adalah suatu produk perangkat kantor yang cukup handal dewasa ini. Setelah mengalami peningkatan fasilitas menuju penyempurnaan, hingga sekarang telah beredarnya Microsoft Office 2003


Giáo trình hướng dẫn phân tích phương pháp định tuyến các giao thức trong cấu hình TCPU p5

Cấu hình tổng hợp đường đi cho IEGRP +Quá trình EIGRP xây dựng và bảo trì bảng định tuyến +Kiểm tra hoạt động EIGRP +Tám bước cho quá trình xử lý sự cố nói chung +Áp dụng sơ đồ logic trên vào quá trình xử lý sự cố định tuyến +Xử lý sự cố tiến trình định tuyến RIP sử dụng lệnh show và debug. +Xử lý sự cố tiến trình định tuyến IGRP sử dụng lệnh show và debug


Windows-Word-Excel-Power Point

Con trỏ nhập văn bản: là thanh đứng màu đen, nhấp nháy. Chỉ ra vị trí thêm vào văn bản. Ở dòng thứ mấy, cột thứ mấy


Microsoft Excel

Microsoft Excel được sử dụng là phần mềm bảng tính điện tử mạnh nhất, phức tạp nhất đồng thời có nhiều ứng dụng nhất hiện nay. - Ngoài ra Microsoft Excel còn được sử dụng để quản trị cơ sở dữ liệu. - Phiên bản mới nhất hiện nay của Excel là Microsoft Excel XP, nó đáp ứng được nhiều hơn nhu cầu của người sử dụng đồng thời bổ sung các công cụ mới với những tính năng mạnh mẽ và thuận tiện, các thao tác đơn giản đỡ rắc rối hơn trong công thức và in ấn....


Bài giảng Hệ thống máy tính - Chương 2: Bộ xử lý trung tâm CPU (Central Processing Unit)

Bài giảng Hệ thống máy tính: Chương 2 - Bộ xử lý trung tâm CPU (Central Processing Unit). Nội dung chính trong chương này gồm có: Bộ xử lý trung tâm, pipeline, bộ nhớ chính, bộ nhớ thứ cấp, hệ thống I/O. Mời các bạn cùng tham khảo.


Bài giảng Tin học đại cương - ThS. Lê Thị Quỳnh Nga

Bài giảng Tin học đại cương: Giới thiệu môn học do ThS. Lê Thị Quỳnh Nga biên soạn cung cấp cho người học những thông tin cơ bản về môn học, nội dung chính của môn học. Đây là một tài liệu tham khảo hữu ích dành cho các bạn sinh viên đang và chuẩn bị bước vào môn học này.


Bài giảng Tin học ứng dụng: Phần 1 - ĐH Nha Trang

Bài giảng Tin học ứng dụng: Phần 1 gồm nội dung 3 chương đầu tài liệu. Nội dung phần này trình bày tổng quan về cơ sở dữ liệu, mô hình dữ liệu quan hệ, đại số quan hệ. Mời bạn đọc tham khảo nội dung phần 1 tài liệu.


Tự học Word 2010 part 4

Thay đổi khoảng cách trước hoặc sau các đoạn Chọn đoạn văn bản bạn muốn thay đổi khoảng cách trước hoặc sau nó. Trong thẻ Page Layout, nhóm Paragraph, bạn nhấn chuột vào mũi tên cạnh mục Before (trước) hoặc After (sau) để thay đổi bằng giá trị bạn muốn.


Tài liệu mới download

Từ khóa được quan tâm

Có thể bạn quan tâm

Hướng dẫn tạo email
  • 12/04/2011
  • 58.375
  • 641
7 khác biệt của Mac so với PC
  • 14/01/2013
  • 18.006
  • 644

Bộ sưu tập

Danh mục tài liệu