天问

R包管理

 
 

install.packages("xlsx")

 
 

下载位置:

https://cran.r-project.org/

 
 

 
 

常用包:

xlsx

excel处理

rJava

Java

xlsxjars

  

RGoogleAnaliyics

  

ggmap

ggmap包含4中地图资源方便进行ggplot,需要联网调用google api,被墙难访问

依赖:'maps', 'sp', 'proto', 'RgoogleMaps', 'png', 'rjson', 'mapproj', 'jpeg', 'geosphere'

Recommender

推荐算法包

Recommendaerlab

推荐算法包

knn

  

kmeans

  

dist

  

pvclust

  

Mclust

  

rmongodb

  

RSQLite

  

RPostgreSQL

  

RODBC

  

Rserve

可以提供web接口调用

 
 

可视化


ggplot2

图表包

ggplot2系统扩展包:ggthemes, ggtech, ggsic,  gganimate, ggradar, ggseas, ggmosiac, ggally, ggimage, ggflags

rcharts

交互式可视化

animation

  

lattice

  

qplot

  

aplpack

  

plotly

  

rwordmap

  

ggmap

  

googleVis

  

ggpubr

  

Wordcloud2

Wordcloud 词云

3D

  

rgl

  

scatterplot3d

  

misc3d

  

plotly

  

recharts

  

 
 

配色及主题包:ggthemes, ggthemer, RColorBrewer

图形控制与字体渲染:Cairo,showtext

 
 

数据地图包

baidumap

  

ggmap

  

GoogleVIS

  

REmap

  

Rworldmap

  

leaflet

  

leafletCN

  

leaflet.minicharts

  

geojsonio

  

rgdal

  

sf

  

maptools

  

maps

  

scatterpie

  

 
 

可视化排版系统

rmarkdown

  

flexdashboard

  

knitr

  

Shiny

实现R与web部署,开发数据分析app

shinythemes

  

shinydashboard

  

htmltools

  

 
 

人工智能:

nnet

  

rpart

  

gbm

  

kernlab

  

mboost

  

  randomForest 

  

tree

  

party

  

lars

  

boost

  

e1071

svm()支持向量机,朴素贝叶斯分类

BayesTree

  

gafit

  

arules

  

 caret

  

DWwR

  

mlr

  

capet

  

  

  

数据处理

  

lubridata

  

dplyr

  

plyr

  

reshape2

  

stringr

  

formatR

  

mcmc

  

data.table

读取大数据集

tidyverse

  

tidyr

  

中文分词

  

Rwordseq 

  

jiebaR

  

chinesemisc

  

tau

  

tm

  

  

  

  

  

 
 

 
 

 
 

聚类分析

基于划分的方法:  kmeans, pam, pamk, clara

基于层次的方法:  hclust, pvclust, agnes, diana

基于模型的方法:  mclust

基于密度的方法:  dbscan

基于画图的方法:  plotcluster, plot.hclust

基于验证的方法:  cluster.stats

 
 

 
 

分类

决策树: rpart, ctree 

随机森林: cforest, randomForest 

回归, Logistic, Poisson,glm, predict,  residuals 

生存分析: survfit, survdiff, coxphGGally

分类购物篮分析:arules

 
 

 
 

金融包

时间序列:zooxtschornitstimeDate, tseries, forecast

金融分析:quantmodRQuantLibportfolioPerformanceAnalyticsTTRsdeYieldCurve

风险管理:parmaevdevdbayesevirextRemesismev

 
 

 
 

统计

方差分析: aov, anova

密度分析: density

假设检验: t.test, prop.test, anova, aov

线性混合模型:lme

主成分分析和因子分析:princomp

 
 

 
 

优化类

最简单的:stat包中的optimize,  optim 函数

非线性优化:BB

线性不等式约束的非线性优化:constrOptimadaptive barrier

非线性box约束优化:nlminb

带约束的非线性优化:Rsolnp包中solnp函数,alabama包中的constrOptim.nl()函数

线性规划:lpSolve 包 中的lp函数,linprog包中的 solveLP函数

 
 

网络:

rvest

可用于网络抓包

RCurl

  

XML

  

httr

  

RSelenium

  

 
 

 
 

htmlwidgets系统包

leaflet

  

dygraphs

  

rbokeh

  

Highcharter

  

visNetwork

  

networkD3

  

d3heatmap

  

DataTables

  

threejs

  

rgwidget

  

DiagrammeR

  

 
 

 
 

 
 

大数据

rJava

R和Hadoop连接,R转为java

Install.packages("rJava")

library(rJava)

Rhipe

R CMD INSTALL Rhipe_0.xx.tar.gz

Rhadoop

install.packages(c("rJava","itertools","httr","devtools","plyr","reshape2","Rcpp","iterators","digest","RJSONIO","functional"))

rmr

rhdfs

rhbase

HadoopStreaming

可以在没有hadoop下处理streaming数据。主要有以下三个函数:

hsTableReader

hsKeyValReader

hsLineReader

 
 

高速并行计算

snow

  

Rmpi

  

Rcpp

  

STAR

  

OpenCL

  

gpuR

  

gmatrix

  

  

  

 
 

计量经济学

ARE

  

car

  

forecast

  

Imtest

  

plm

  

sandwish

  

tseries

  

urca

  

zoo

  

 
 

其他:

Qqmining

qq聊天数据分析,github,070606开发不太完善的包。

依赖包:rJavaRwordsegdplyrwordcloud2ggplot2

library(RTextTools)
library(e1071)

  

博客地址:http://blog.yoqi.me/?p=3698
扫我捐助哦
喜欢 0

这篇文章还没有评论

发表评论