這是一個以著重於實作,一個動態的R 語言在地化中文教材。和其他R 教材相比,這份教材具有以下的特色:
- 完整。由於教材是參考CRAN上介紹R 的官方文件:An Introduction to R所撰寫的,同學即使只有使用這份教材學R ,即可獲得所有用R 所需要的所有知識。
- 在地化的中文資料處理。教材是特別針對處理台灣的Open Data所設計,所以會涵蓋所有要載入中文資料所需要的知識。網路上雖然已經有很多很棒的R 教材,但是他們通常沒有描述如何處理中文資料。
- 新。在2012年以後,R 的成長是非常快速的,所以教材會納入許多近年來被R 社群證實很棒的套件們。
- 套件的使用與探索。R 的一大優勢就是蓬勃的套件系統。雖然教材中無法介紹所有的套件,但是會教同學如何探索一個第一次接觸的R 套件。
- 互動。我們基於R Community貢獻的R 語言套件swirl 所撰寫的互動式學習環境,可以讓同學以最貼近實際使用R 的狀況來學R
- 教材設計。每個單元的開始,我們設計大量的操作讓同學是透過用肌肉來記憶R 的指令。並且在單元的最後都擁有來自實務且具有挑戰性的關卡。
- 自由。老師們可以很方便與自由地將本教材整合至您的教案之中。您可以將本教材當成同學學習R語言的補充教材,讓同學透過本教材學習如何處理政府的開放資料集。本教材不會涉獵過多的專業分析技術,而是把這些內容留給專業的老師們。有興趣合作的老師歡迎來信:[email protected]
請有參加實體課程的同學打開: http://server.datascienceandr.org:28787
並依照課堂上給的帳號密碼登入。
有興趣的同學也歡迎聯繫我們(無論是在聊天室或是來信:[email protected]),取得線上體驗的帳號密碼。
同學可以參考以下的上手影片:
<iframe width="560" height="315" src="https://www.youtube.com/embed/fcd6zSk0yd8" frameborder="0" allowfullscreen></iframe>或是依照以下的動作快速設定學習環境:
- 安裝R
- 安裝Rstudio(Windows 使用者請安裝Rstudio或自備能夠編輯UTF-8 編碼的編輯器,OS X 與Linux使用者可依據自己喜好決定是否使用Rstudio)
- 打開R ,執行:
source("http://wush978.github.io/R/init-swirl.R")
- 輸入
library(swirl);swirl()
後即進入教學環境。 - 進入00-Hello-DataScienceAndR課程檢查你的電腦能不能執行本教材的所有功能,並瞭解本教材所提供的功能。
有興趣了解安裝細節的同學,請操考:
安裝上有問題,或是在執行00-Hello-DataScienceAndR不順利的同學請到求助專區取得協助
在輸入swirl()
之後,同學即進入R 的互動式學習環境(swirl環境)。請參考以下動作做操作:
ps. 如果你之前有進行過swirl的課程,swirl會出現下圖的選項詢問你是否要接關。請根據你的需求作答:
如不接關,請選取:No. Let me start something new.
目前主要課程分成以下三塊:
- 01-RBasic區:講解R 語言的基礎知識與使用方法。所有以下的課程都需要知道RBasic的知識。
- 02-RDataEngineer區:講解載入資料至R 語言,以及清理、整理資料的所需知識。
- 03-RVisualization區:介紹R的視覺化功能
其他的課程,同學可以視自己的興趣決定要不要完成
- Optional-RProgramming區:介紹R 語言的程式功能。
- Optional-RDataMining區:介紹R 語言在Data Mining中常用的套件。
- Optional-RStatistic區:搭配實體課程所使用的swirl課程,不建議同學自行使用
有問題的朋友,麻煩先註冊一個Github帳號後,可以到以下地方討論:
- Issue回報區
- Gitter聊天室:
這個Repository主要是為了準備我在臺大的資料科學課程,幫陳老師講的兩堂R 的課程。課程素材主要就是投影片和swirl。內容則是參考CRAN上介紹R 的官方文件:An Introduction to R。 另外也要感謝社群中所有有參與籌備資料科學愛好者年會2015的同伴。
以下連結記載swirl中的課程內容(sha-hash: a2ffbd1b 版本)
- 00-Hello-DataScienceAndR
- 01-RBasic-01-Introduction
- 01-RBasic-02-Data-Structure-Vectors
- 01-RBasic-03-Data-Structure-Object
- 01-RBasic-04-Factors
- 01-RBasic-05-Arrays-Matrices
- 01-RBasic-06-List-DataFrame
- 01-RBasic-07-Loading-Dataset
- 02-RDataEngineer-01-Parsing
- 02-RDataEngineer-02-XML
- 02-RDataEngineer-03-JSON
- 02-RDataEngineer-04-Database
- 02-RDataEngineer-05-Data-Manipulation
- 02-RDataEngineer-06-Join
- 03-RVisualization-01-One-Variable-Visualization
- 03-RVisualization-02-Multiple-Variables-Visualization
- 03-RVisualization-03-ggplot2
- 03-RVisualization-04-Javascript-And-Maps
- Optional-RProgramming-01-Loop-And-Condition
- Optional-RProgramming-02-Function
- Project-ROpenData-DataTaipei
- Project-ROpenData-Power-GDP
以下連結是課程中使用的投影片
Data Science and R由Wush Wu、Chih Cheng Liang和Johnson Hsieh製作,以創用CC 姓名標示-相同方式分享 3.0 台灣 授權條款釋出。