R là một ngôn ngữ đang rất thịnh hành, có rất nhiều lý do để bắt đầu học R và tìm hiểu lợi ích của ngôn ngữ này. Vậy R là ngôn ngữ gì, ưu và nhược điểm thế nào, làm thế nào để cài đặt ngôn ngữ này? Hãy cùng Quantrimang.com tìm hiểu qua các nội dung trong bài viết dưới đây. Mời bạn đọc theo dõi.
Ngôn ngữ lập trình R là gì?
R là một ngôn ngữ lập trình hàm cấp cao, cũng là một môi trường dành cho tính toán thống kê. R hỗ trợ rất nhiều công cụ cho phân tích dữ liệu, khám phá tri thức và khai thác dữ liệu nhưng lại hoàn toàn miễn phí, là phần mềm mã nguồn mở, vì vậy ta có thể dễ dàng cài đặt và sử dụng mà không cần phải mua bản quyền.
R được sáng lập bởi nhóm tác giả "R Development Core Team" tại đại học Auckland, New Zealand, do Ross Ihaka cùng Robert Gentleman khởi xướng và phát triển từ ngôn ngữ lập trình thống kê S. Phần mềm này chạy trên nhiều phần cứng như Intel, PowerPC, Alpha, Sparc và nhiều hệ điều hành khác nhau như Unix, Linux, Windows, Mac, nhưng không thể chạy trên Android hay iOS.
R rất dễ học và có thể phát triển nhanh các ứng dụng tính toán xác suất thống kê, phân tích dữ liệu trong thời gian ngắn nhờ nhiều công cụ tích hợp sẵn dùng, như khả năng lập trình, kiểu dữ liệu phong phú, các hàm thống kê, giải thuật học tự động và các giao diện truy vấn dữ liệu, hiển thị dữ liệu. Đồng thời, R có thể tích hợp được với ngôn ngữ khác (C, C++) và tương tác với nhiều nguồn dữ liệu và các gói thống kê (SAS, SPSS).
Ưu điểm của ngôn ngữ R
- Có những package thống kê toàn diện với công nghệ mới nhất.
- Có thể được dùng mọi lúc mọi nơi cho bất cứ việc gì, kể cả bán các sản phẩm từ R theo điều kiện của giấy phép do là mã nguồn mở.
- Có thể chạy trên bất kỳ hệ điều hành nào.
- Có một cộng đồng người dùng vô cùng lớn mạnh, bất kỳ ai cũng được hỗ trợ để đưa ra ý tưởng phát triển, sửa lỗi, phát triển package mới.
- R có một kho package phong phú, mạnh mẽ với hơn 15000+ packages trong mọi lĩnh vực nghiên cứu.
Ngôn ngữ R được biết đến là một công cụ rất mạnh cho machine learning, thống kê và phân tích dữ liệu. R có thể chạy code mà không cần đến bất cứ compiler nào, cũng có thể thực hiện bất kỳ một phép tính, sơ đồ và công thức nào trên vectors… khi cần thiết.
Cài đặt ngôn ngữ R
Nếu bạn đã sẵn sàng cho việc phát triển R thì hãy dành cho ngôn ngữ một môi trường để hoạt động. Bắt đầu nhé.
Cài đặt R trên Windows
Bạn có thể tải xuống phiên bản cài đặt của R từ R-3.2.2 cho Windows (32/64 bit). Như bản hiện tại Quantrimang chạy là 3.6.0.
File tải xuống ở dạng cài đặt (.exe) với tên R-version-win.exe. Bạn chỉ cần click đúp chuột và chạy chương trình cài đặt.
Nếu Windows của bạn là phiên bản 32 bit, chương trình sẽ tự động cài đặt phiên bản 32 bit. Nhưng nếu Windows của bạn là 64 bit, thì nó sẽ cài đặt cả phiên bản 32 bit và 64 bit.
Sau khi cài đặt, bạn có thể tìm chương trình trong R\R3.6.0\bin\i386\Rgui.exe ở Windows Program Files. Nhấp vào biểu tượng này để hiển thị R-GUI và bắt đầu lập trình ngôn ngữ R thôi.
Cài đặt trên Linux
R có sẵn dưới dạng nhị phân cho nhiều phiên bản Linux tại R Binaries.
Việc chuyển đổi cài đặt Linux từ phiên bản này sang phiên bản khác được mô tả dưới mỗi loại phiên bản trong liên kết trên. Tuy nhiên để nhanh hơn thì bạn có thể sử dụng lệnh yum như sau:
$ yum install R
Lệnh trên sẽ cài đặt các hàm cốt lõi của lập trình R cùng với các package tiêu chuẩn, có thể bổ sung các package khác sau. Sau đó, bạn khởi chạy R prompt như sau:
$ R
R version 3.6.0 (2019-04-26) -- "Full of Ingredients"
Copyright (C) 2019 The R Foundation for Statistical Computing
Platform: x86_64-redhat-linux-gnu (64-bit)
R is free software and comes with ABSOLUTELY NO WARRANTY.
You are welcome to redistribute it under certain conditions.
Type 'license()' or 'licence()' for distribution details.
R is a collaborative project with many contributors.
Type 'contributors()' for more information and
'citation()' on how to cite R or R packages in publications.
Type 'demo()' for some demos, 'help()' for on-line help, or
'help.start()' for an HTML browser interface to help.
Type 'q()' to quit R.
>
Bây giờ bạn có thể sử dụng lệnh tại prompt R để cài đặt các package mong muốn. Ví dụ: lệnh sau sẽ cài đặt gói plotrix sử dụng cho biểu đồ 3D.
> install.packages("plotrix")
Kết luận lại, R là ngôn ngữ lập trình thống kê được sử dụng rộng rãi nhất trên thế giới. Đây là lựa chọn số 1 của các nhà khoa học dữ liệu và được hỗ trợ bởi một cộng đồng những người đóng góp sôi nổi và tài năng. Ngôn ngữ R được dạy trong các trường đại học và triển khai trong các ứng dụng kinh doanh quan trọng.