原創|行業資訊|編輯:陳俊吉|2017-02-16 10:31:11.000|閱讀 850 次
概述:最近在網上到處了解和爬一些R的資料,看著看著就入迷了,這就是個大寶庫了,以前怎么沒發現,看來還是太狹隘了。直到前幾天我看到這個Awesome R文檔,我就靜不下來了,對比了目前自己的工作和以后的方向,非常適合我。所以毫不猶豫的把這個文檔漢化了,所以大家一起享受吧。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關鏈接:
雖然很早就知道R被微軟收購,也很早知道R在統計分析處理方面很強大,開始一直沒有行動過。。。直到
直到12月初在微軟技術大會,看到我軟的工程師演示R的使用,我就震驚了,然后最近在網上到處了解和爬一些R的資料,看著看著就入迷了,這就是個大寶庫了,以前怎么沒發現,看來還是太狹隘了。直到前幾天我看到這個Awesome R文檔,我就靜不下來了,對比了目前自己的工作和以后的方向,非常適合我。所以毫不猶豫的把這個文檔漢化了,所以大家一起享受吧。
這里有很多非常不錯的R包和工具. 該想法來自于.
這里是包的導航清單,看起來更方便
通過這些翻譯了解這些工具包,以后干活也就方便多了。不過翻譯這個東西的確要靠耐心,翻譯,編輯花費了至少一周的空余時間。
在編輯本文的過程中,驚喜的發現Awesome系列的其他資源:地址在github:
1.
2.
3.
RStudio – 一個非常強大高效的圖形界面開發環境,可以在Windows, Mac, 和Linux運行.
Emacs + ESS – ESS是一個emacs文本編輯器的一個統計分析的插件.
Sublime Text + R-Box – 一個在Sublime 2/3中使用R語言編程的插件.
TextMate + r.tmblundle – TextMate 1/2的插件.
StatET – 一個基于Eclipse的R語言IDE.
Revolution R Enterprise – 專注于大數據,大規模多處理器的功能,可以對學術用戶免費提供和商業使用.
R Commander – 一個包括基本圖形用戶界面的R包.
IRkernel – Jupyter的R語言內核.
Deducer – 一個菜單驅動的數據分析的GUI工具,類似電子表格數據編輯器.
Radiant – 一個使用R語言,獨立的基于瀏覽器接口的業務分析平臺,基于Shiny.
Vim-R – Vim中R語言插件.
Nvim-R – Neovim中R語言插件.
JASP – 一個完整的貝葉斯和概念論相關方法的R包,和使用SPSS非常相似。
Bio7 – 一個包括創建,科學圖像分析和統計分析的IDE.
RTVS – Visual Studio中R開發工具.
magrittr – 一個R語言高效的管道操作包.
pipeR – 多泛型管道的實現.
lambda.r – R語言中函數式編程和簡單的模式匹配.
purrr – 一個高級函數編程語言包.
dplyr – 快速數據操作和數據庫查詢.
data.table – 使用短小靈活的語法操作數據.
reshape2 – 靈活的數據排列,聚合處理.
readr – 一個快速簡單的讀取表格數據到R中的包.
haven – 對導入SPSS,STATA和SAS的文件進行改進.
tidyr – 方便對數據進行整理、傳播和收集.
broom – 將統計分析對象轉換成整齊的數據框(一種數據組織和呈現的方式).
rlist – 一個操作非規范化數據的工具箱.
jsonlite – 一個快速解析JSON文件的包.
ff – 設計用來存儲大型數據集的數據結構.
lubridate – 一組日期和時間函數.
stringi – 基于ICU的字符串處理方案.
stringr – 基于stringi之上的對字符串處理API.
bigmemory – 提供共享內存和內存映射矩陣,同時也包提供額外的工具,包括線性模型.(biglm) 和隨機森林 (bigrf).
fuzzyjoin – 使用不精確匹配的方式連接表數據.
tidyverse – 簡單從tidyverse下載和安裝包.
ggplot2 – 強大的繪圖統計和計算圖形系統的實現.強烈推薦.
ggfortify -一個ggplot2(流行的統計軟件包)統一的接口(使用一行代碼即可).
ggrepel – 排除重疊的文本標簽.
ggalt – ggplot2額外的坐標系統,幾何和統計.
ggtree – 可視化和注釋的系統樹.
ggplot2 Extensions – ggplot2擴展顯示例子.
lattice – 一個強大優雅的高級數據可視化系統.
corrplot – 圖形顯示相關矩陣或一般矩陣。它還包含一些矩陣重新排序算法.
rgl – R中3D可視化系統.
Cairo – 一個使用cairo組件創建高質量顯示輸出的R圖形包.
extrafont – 在R中圖像中使用字體的工具.
showtext – 讓R圖形設備顯示文本的時候使用系統字體.
animation – 一個使用 ImageMagick在R中產生動畫圖形的工具.
gganimate – 用ggplot2創建簡單的動畫. >>>官網
misc3d – 強大的3D繪圖工具.
xkcd – 在圖表中使用xkcd風格.
imager – 一個基于CImg庫的圖像處理包.
d3heatmap – 使用D3繪制互動的熱圖.
DataTables – 將R矩陣或數據框作為交互的HTML表.
DiagrammeR – 在R中創建JS圖表和流程圖.
dygraphs – 在R中繪制時間序列數據圖形.
formattable – 可格式化的數據結構.
ggvis – R中交互式的圖形處理語法.
Leaflet – 一個非常流行的交互式地圖JavaScript組件.
MetricsGraphics – 可以輕松創建D3散點圖、折線圖和直方圖.
networkD3 – D3 JavaScriptR網絡圖.
scatterD3 – D3 互動散點圖.
plotly – 使用plot.ly進行交互式ggplot2和Shiny繪圖.
rCharts – 交互式JS繪圖.
rbokeh – Bokeh的R接口.
threejs – 交互式3D散點圖和地球儀.
timevis – 創建完全交互式的時間軸可視化圖形.
visNetwork – 使用vis.js類庫進行網絡可視化.
knitr – R中簡單的動態報表生成工具.
xtable – 將表格導出到LaTeX或者HTML.
rapport – 一個R模版系統.
rmarkdown – R動態文檔工具.
slidify – 創建和發布漂亮的html5展示效果.
Sweave – 使用R創建LaTeX報表的R包.
texreg – 在LaTex和HTML中格式化統計模型.
checkpoint – 從檢查點快照服務器安裝包.
brew – 報告模板的生成框架.可以和knitr合并.
ReporteRs – 一個生成微軟Word, PowerPoint和HTML報表的R包.
bookdown – 使用R Markdown編寫書籍.
ezknitr – 避免使用’knitr’帶來的工作目錄的痛苦.
Web Technologies List – 關于如何使用R和網絡的相關信息.
shiny – 使用R創建簡單的Web交互應用.
RCurl – 常規的網絡客戶端接口 (HTTP/FTP/…) .
httr – 使用更加友好的RCurl封裝.
httpuv – HTTP和WebSocket服務程序.
XML – R中生成和解析XML的工具.
rvest – 簡單的web信息抓取,使用CSSSelect 和 XPath 語法.
OpenCPU – HTTP API.
Rfacebook – Facebook API.
RSiteCatalyst – Adobe 分析服務的R語言客戶端.
plumber – 一個將現有的R代碼轉換為API的包.
parallel – R語言高性能的并行計算平臺. multicore and snow.
Rmpi – Rmpi對MPI APIS提供了一個包裝過的接口,它也提供一個交互式的R環境.
foreach – 使用并行來執行循環.
SparkR – R for Spark.
DistributedR – 一個來自惠普Vertica Analytics團隊的可伸縮的高性能平臺.
ddR – 提供分布式數據結構,簡化了R中的分布式計算.
sparklyr – 來自RStudio的Spark接口.
Rcpp – Rcpp在R中提供了一個高效的API,使得函數更快執行.
Rcpp11 – Rcpp11完全重新設計,以C++11為目標.
compiler – 使用JIT提高R代碼的速度.
APIrJava – R語言對JAVE接口.
jvmr – 集成了R, Java, and Scala.
rJython – R語言對Python/Jython的接口.
rPython – 允許R調用Python.
runr – 在R中運行Julia和Bash.
RJulia – R中調用Julia.
RinRuby – 一個Ruby庫,整合了R用Ruby解釋器.
R.matlab – 讀寫mat文件,將R和Matlab連接到一起.
RcppOctave -Octave and Matlab的接口.
RSPerl – 雙向接口,R中調用Perl和在Perl中調用R.
V8 – 嵌入JavaScript引擎.
htmlwidgets – R中把JavaScript數據可視化的最好方法.
rpy2 – Python對R的接口.
RODBC – R中ODBC數據庫范圍.
DBI – 在R和數據庫管理系統之間定義一個公共的接口.
elastic – Elasticsearch HTTP API的包裝器.
mongolite – R中Mongo客戶端.
RMySQL – R語言的MySQL數據庫接口.
ROracle – R中Oracle數據庫的接口.
RPostgreSQL – R語言的PostgreSQL數據庫系統接口.
RSQLite – R語言SQLite數據庫接口.
RJDBC – 通過JDBC接口訪問數據庫.
rmongodb – R中MongoDB驅動.
rredis – R中Redis驅動.
RCassandra -Apache Cassanda直接接口(不是JAVA),提供了最多的基本功能.
RHive – 通過Apache Hive的R擴展促進分布式計算.
RNeo4j – Neo4j圖形數據庫驅動.
AnomalyDetection – 來自Twitter的AnomalyDetection R包.
ahaz – 半參數添加風險回歸的正則化.
arules – 挖掘關聯規則和頻繁項集.
bigrf – 大隨機森林:大型數據集的分類和回歸森林.
bigRR – 廣義回歸(特殊是在p >> n情況下).
bmrm – 風險最小化方案的正規化方法.
Boruta – 所有相關的特征選擇算法的一個封裝 .
BreakoutDetection – Breakout Detection via Robust E-Statistics from Twitter.
bst – 梯度增加.
CausalImpact – 利用貝葉斯時間序列結構模型進行因果推斷.
C50 – C5.0決策樹和基于規則的模型.
caret – 分類和回歸訓練.
CORElearn – 分類、回歸、特征評價和排序.
CoxBoost – Cox models by likelihood based boosting for a single survival endpoint or competing risks.
Cubist – 規則和基于實例的回歸建模.
e1071 – Misc統計函數 (e1071),主要功能有類別分析、傅里葉變換,模糊聚類,支持向量機,最短路徑計算,樸素貝葉斯分類器等等.
earth – 多元自適應回歸模型.
elasticnet – 稀疏估計和稀疏主成分分析.
ElemStatLearn – 書籍”The Elements of Statistical Learning, Data Mining, Inference, and Prediction”中的數據集,函數和例子.
evtree – 全局最優樹的進化學習.
forecast – 使用ARIMA, ETS, STLM, TBATS,和神經網絡進行時間序列預測.
forecastHybrid – 使用”forecast”包對ARIMA, ETS, STLM, TBATS,和神經網絡模型進行交叉檢驗.
FSelector – 一個基于subset-search或特性排名方法的特征選擇框架.
frbs – 使用模糊規則系統處理分類和回歸的任務.
GAMBoost - 基于廣義線性和加法模型.
gamboostLSS – GAMLSS方法的改善.
gbm – 改善廣義線性模型.
glmnet – Lasso 和 elastic-net正規化廣義線性模型.
glmpath – L1 Regularization Path for Generalized Linear Models and Cox Proportional Hazards Model.
GMMBoost – 廣義混合模型.
grplasso – Fitting user specified models with Group Lasso penalty.
grpreg – Regularization paths for regression models with grouped covariates.
h2o – Deeplearning, Random forests, GBM, KMeans, PCA, GLM.
hda – 異方差判別分析.
ipred – 預測器改進.
kernlab – kernlab: 基于內核學習的機器實驗室.
klaR – 分類和可視化.
kohonen – 監督和非監督自組織映射.
lars – Least Angle Regression, Lasso and Forward Stagewise.
lasso2 – L1 constrained estimation aka ‘lasso’.
LiblineaR – 基于C/C++庫的線性預測模型.
lme4 – Mixed-effects models.
LogicReg – 邏輯回歸模型.
maptree – 映射、修剪和圖形樹模型.
mboost – Model-Based Boosting.
Machine Learning For Hackers
mvpart – Multivariate partitioning.
MXNet – MXNet brings flexible and efficient GPU computing and state-of-art deep learning to R.
ncvreg – Regularization paths for SCAD- and MCP-penalized regression models.
nnet – eed-forward Neural Networks and Multinomial Log-Linear Models.
oblique.tree – Oblique Trees for Classification Data.
pamr – Pam: 小矩陣預測分析.
party – A Laboratory for Recursive Partytioning.
partykit – A Toolkit for Recursive Partytioning.
penalized – L1 (lasso and fused lasso) and L2 (ridge) penalized estimation in GLMs and in the Cox model.
penalizedLDA – Penalized classification using Fisher’s linear discriminant.
penalizedSVM – 使用懲罰函數的特征選擇支持向量機.
quantregForest – quantregForest: Quantile Regression Forests.
randomForest – 隨機森林: Breiman and Cutler’s random forests for classification and regression.
randomForestSRC – randomForestSRC: Random Forests for Survival, Regression and Classification (RF-SRC).
rattle – 圖形界面式的數據挖掘工具.
rda – Shrunken Centroids Regularized Discriminant Analysis.
rdetools – Relevant Dimension Estimation (RDE) in Feature Spaces.
REEMtree – Regression Trees with Random Effects for Longitudinal (Panel) Data.
relaxo – Relaxed Lasso.
rgenoud – R version of GENetic Optimization Using Derivatives.
rgp – R基因編程框架.
Rmalschains – 使用本地文化基因算法進行連續問題優化.[這里翻譯不準]. Search Chains (MA-LS-Chains) in R.
rminer – 在分類和回歸問題中簡單的使用數據挖掘方法(如神經網絡和支持向量機).
ROCR – 可視化評分分類器的性能.
RoughSets – 使用粗糙集和模糊粗糙集理論進行數據分析.
rpart – Recursive Partitioning and Regression Trees.
RPMM – Recursively Partitioned Mixture Model.
RSNNS – Neural Networks in R using the Stuttgart Neural Network Simulator (SNNS).
Rsomoclu – Parallel implementation of self-organizing maps.
RWeka – Weka的R接口(Weka是基于JAVA環境下開源的機器學習以及數據挖掘軟件).
RXshrink – RXshrink: Maximum Likelihood Shrinkage via Generalized Ridge or Least Angle Regression.
sda – Shrinkage Discriminant Analysis and CAT Score Variable Selection.
SDDA – Stepwise Diagonal Discriminant Analysis.
SuperLearner and subsemble – Multi-algorithm ensemble learning packages.
svmpath – svmpath: the SVM Path algorithm.
tgp – Bayesian treed Gaussian process models.
tree – 分類和回歸樹.
varSelRF – 使用隨機森林進行變量選擇.
xgboost – eXtreme Gradient Boosting Tree model, well known for its speed and performance.
text2vec – 一個快速文本挖掘框架。 Fast Text Mining Framework for Vectorization and Word Embeddings.
tm – 一個全面的文本挖掘框架.
openNLP – Apache OpenNLP工具接口.
koRpus – 一個文本分析的R包.
zipfR – 詞頻分布統計模型.
NLP – 基本自然語言處理功能.
LDAvis – 主題模型的交互式可視化.
topicmodels – Topic modeling interface to the C code developed by by David M. Blei for Topic Modeling (Latent Dirichlet Allocation (LDA), and Correlated Topics Models (CTM)).
syuzhet – Extracts sentiment from text using three different sentiment dictionaries.
SnowballC – Snowball stemmers based on the C libstemmer UTF-8 library.
quanteda – 文本數據的定量分析.
Topic Models Resources – 主題模型的學習和R相關資源.
NLP for – NLP related resources in R. @Chinese.
coda – 輸出MCMC(馬爾可夫鏈蒙特卡爾理論)的分析和診斷信息.
mcmc – 馬爾可夫鏈蒙特卡爾理論(MCMC).
MCMCpack – 馬爾可夫鏈蒙特卡爾理論 (MCMC).
R2WinBUGS – 在在R/S-PLUS中打開WinBUGS 和 OpenBUGS.
BRugs – OpenBUGS MCMC 軟件的R接口.
rjags – JAGS MCMC組件的R接口.
rstan – Stan MCMC軟件的R接口.
minqa – Derivative-free optimization algorithms by quadratic approximation.
nloptr – 一個免費開源的非線性最優化程序包.
lpSolve – Lp_solve解決線性和整形問題的R接口.
quantmod – 定量金融模型和交易框架.
TTR – 技術交易規相關的數據和功能函數.
PerformanceAnalytics – 計量經濟學性能和風險分析工具.
zoo – S3 Infrastructure for Regular and Irregular Time Series.
xts – 可擴展的時間序列.
tseries – 金融時間序列分析和計算.
fAssets – 金融資產分析和建模.
Bioconductor – 用于分析和理解高通量基因組數據的工具.
genetics – 處理基因數據的R包.
gap – 一個人口家庭遺傳數據分析的綜合工具.
ape – 分子系統學和進化分析.
pheatmap – 一個使用簡單的熱圖工具.
ddpcr – Analysis and visualization of Droplet Digital PCR data.
Network Analysis List – 網絡分析相關資源.
igraph – 一個網絡分析工具集合.
network – 一個操作數據關系的基本工具.
sna – 基本的網絡測量和可視化工具.
netdiffuseR – 網絡擴散的分析工具.
networkDynamic – 支持動態和時序網絡.
ndtv – 構建動畫的可視化動態網絡工具,支持多種數據格式.
statnet – 大量網絡數據的分析,仿真和可視化工具.
ergm – 指數隨機圖模型.
latentnet – Latent position and cluster models for network objects.
tnet – Network measures for weighted, two-mode and longitudinal networks.
rgexf – 從R導出網絡對象到GEXF, for manipulation with network software like Gephi or Sigma.
visNetwork – 使用vis.js類庫進行網絡可視化.
Package Development List – 提高整體開發能力的包.
devtools – 然R開發人員的生活變得更簡單的工具.
testthat – 一個R包測試工具.
R6 – simpler, faster, lighter-weight alternative to R’s built-in classes.
pryr – Make it easier to understand what’s going on in R.
roxygen – 在函數定義中描述說明.
lineprof – R中在線分析結果可視化.
packrat – 讓R項目更加簡單,便攜和可重構的工具.
installr – R中按照軟件的相關函數(Windows平臺).
import – R的導入機制.
modules – 另外一個R模塊系統(Python風格).
Rocker – R configurations for Docker.
RStudio Addins – RStudio插件列表.
drat – Creation and use of R repositories on 使用R在GitHub或其他平臺創建和使用倉儲.
covr – Test coverage for your R package and (optionally) upload the results to coveralls or codecov.
lintr – R靜態代碼分析.
staticdocs – 為一個R包生成靜態html文檔.
futile.logger – R中類似log4j的日志記錄包.
log4r – R中的log4j接口.
logging – 一個在R中實現log4j的日志處理包.
engsoccerdata – 英國和歐洲聯賽結果數據(1871-2016年).
gapminder – 從Gapminder摘錄的數據集.
git2r – 在R中使用git.
CXXR – Refactorising R into C++.
fastR – FastR is an implementation of the R Language in Java atop Truffle and Graal.
incanter – Clojure-based, R-like statistical computing and graphics environment for the JVM with Lisp spirit.
pqR – 一個更快的R實現.
renjin – 一個基于JVM的R編譯器.
rho – Refactor the interpreter of the R language into a fully-compatible, efficient, VM for R.
riposte – 一個R快速編譯和JIT工具.
RRO – R革命性開放平臺(Microsoft R Open).
TERR – R的TIBCO企業運行環境.
swirl – 一個在R控制臺中交互式學習指南.
DataScienceR – 一個數據科學,神經網絡,和機器學習的指南.
R-project – R 項目的官方網站.
R Bloggers – R語言的一個綜合性博客網站.
DataCamp – 在線學習R數據分析.
Quick-R – 一個非常好的快速參考手冊.
Advanced R – 書籍高級R編程的在線版.
Efficient R Programming – 書籍”Efficient R Programming”的在線主頁.
CRAN Task Views – CRAN包的任務列表.
The R Programming Wikibook – 一個R協作手冊
R-users – R語言的求職板塊.
R Cookbook – 一個R問答網站,由[R Graphics Cookbook]進行支持(//shop.oreilly.com/product/0636920023135.do).
tryR – 快速開始使用R.
RDocumentation – 使用RDocumentation搜索所有的CRAN, Bioconductor, Github包和文檔.
R Books List – R相關書籍清單.
The Art of R Programming – 一個很好的資源,可以系統地學習基礎類型的對象,控制語句,變量的范圍,以及調試等.
Free Books – CRAN貢獻的多種語言文檔. Contributed Documentation in many languages.
R Cookbook – 快速簡單的介紹R及相關常見的統計任務.
Johns Hopkins編寫的數據科學專業的一部分教程:
Exploratory Data Analysis with R – 基本的各種數據分析技能. * R Programming for Data Science – 依賴于R的一些高級數據分析. * Report Writing for Data Science in R – R語言的報表生成和可重用組件研究.
R Packages – 一個用R包編寫的書籍 (有論文和網站2鐘格式).
R in Action – 一本旨在幫助所有級別R用戶的書籍.
Use R! – This series of inexpensive and focused books from Springer publish shorter books aimed at practitioners. Books can discuss the use of R in a particular subject area, such as Bayesian networks, ggplot2 and Rcpp.
R for SAS and SPSS users – 一個對已經熟悉SAS和SPASS用戶的資源庫.
An Introduction to R – 一個很好的介紹R的文章,也涵蓋了一些高級主題. >>>//cran.r-project.org/doc/manuals/R-intro.pdf官網
Introduction to Statistical Learning with Application in R – A simplified and “operational” version of The Elements of Statistical Learning. Free softcopy provided by its authors.
The R Inferno – Patrick Burns gives insight into R’s ins and outs along with its quirks!
R for Data Science – Free book from RStudio developers with emphasis on data science workflow. >>>官網
R Reference Card 2.0 – Material from R for Beginners by permission of Emmanuel Paradis (Version 2 by Matt Baggott).
Regression Analysis Refcard – R Reference Card for Regression Analysis.
Reference Card for ESS – Reference Card for ESS.
R Markdown Cheat sheet – Quick reference guide for writing reports with R Markdown.
Shiny Cheat sheet – Quick reference guide for building Shiny apps.
ggplot2 Cheat sheet – Quick reference guide for data visualisation with ggplot2.
devtools Cheat sheet – Quick reference guide to package development in R.
The Analytics Edge – Hands-on introduction to data analysis with R from MITx.
Johns Hopkins University Data Science Specialization – 9 courses including: Introduction to R, literate analysis tools, Shiny and some more.
HarvardX Biomedical Data Science – Introduction to R for the Life Sciences.
Explore Statistics with R – Covers introduction, data handling and statistical analysis in R.
Books – R書籍清單.
DataScienceR – R數據科學、神經網絡和機器學習的指南清單.
ggplot2 Extensions – ggplot2擴展案例.
Natural Language Processing – R. @Chinese中NLP 相關資源.
Network Analysis – 網絡分析相關資源.
Open Data – 使用R獲取,轉換,操作,創建和貢獻數據.
Posts – 創建R博客或者文章.
Package Development – 提高包開發的資源工具.
R Project Conferences – 使用R的相關信息,DSC會議.
RStartHere – 一些非常有用的R包指南.
RStudio Addins – RStudio插件清單.
Topic Models – 主題模型的學習和R相關資源.
Web Technologies – 如何使用R和萬維網的信息.
End.
詳情請咨詢!
客服熱線:023-66090381
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn