MaterialW1-L1core: how to use data to solve questionsdata deluge 数据泛滥 Big data统计学是毕业生职场的敲门砖We are lucky: explosive data growing利用数据设计算法、分析预报获得结论的比赛 projectWhy R
1. various packages
2. free
3.
Stack Overflow
mining the web
处理技巧-数学和统计知识-专业知识
W1-L2
利用R的IDE RStudio
R script xxx.R
# 注释符号
Rmd R markdown document
portfolio github仓库
W1-L3
use message board
Often the fastest answer is the one you find yourself
R帮助
?function_name
help.search("rnorm")
args("rnorm")
--> fuction (n, mean = 0, sd =1)
NULL
直接输入函数名称,可以得到函数的解释
提问的艺术:
Provide the minimum information
good question:
R 2.15.0 lm() function on Mac OS X 10.6.3 seg fault
W1-L4
数据的分散性决定了Hacking Skills的重要性
Cross Validated
永远学习,永远勇于接受新事物!
采用Stack overflow搜索关于R的内容时,要采用标签 如[r],仅用r作为关键词会搜索到很多无用的东西
用google的时候:
"[data type] data analysis"
"[data type] R package" (better)
W1-L5
subsetting data 抽取数据
readlines function
lapply 很有趣的函数,对一个列表中的所有元素采用某一个函数去执行
W1-L6
clustering 聚类分析
W1-L7
数据科学家最基本的素质:reproducible research
需要用到LaTex
W1-L8
likelihoods 似然估计
common distribution 常用概率分布
confidence interval 置信区间
hypothesis test 假设检验
bootstrapping 自助法 * 自抽样?
power 统计功效
W1-L9
回归分析的调整分析 adjusting analysis
W1-L10
boosting
bagging
W1-L11
Shiny 交互式R共享
W1-L12
Windows下安装R
www.Rseek.org
W2-L2
Command Line Interface:
command flags arguments
cp -r ./ ../test
W2-L3
Introduction to Git
$git config --list
$git config --global user.name ""
$git config --global user.email ""
W2-L7
markdown
readme.md
##hello (## means secondary heading)
* hello
* world (unordered list)
W2-L8
R packages
install.packages("slidify")
library("xxx") #load the function
W3-L4
http://figshare.com
|
Point |