Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

章节写作 or 修改认领 #6

Open
XiangyunHuang opened this issue Sep 8, 2022 · 2 comments
Open

章节写作 or 修改认领 #6

XiangyunHuang opened this issue Sep 8, 2022 · 2 comments

Comments

@XiangyunHuang
Copy link
Owner

XiangyunHuang commented Sep 8, 2022

R 语言数据分析实战 提纲

第一部分 R语言入门

第一章 R 语言初步

1.1 R 语言介绍和安装

  1. R语言介绍
  2. R语言版本和R包
  3. 在Windows系统上安装
  4. 在Mac OS系统上安装
  5. 在Linux系统上安装
  6. R语言运行界面

1.2 Rstudio 的介绍、安装和基本操作

  1. Rstudio介绍
  2. 在Windows系统上安装
  3. 在Mac OS系统上安装
  4. 在Linux系统上安装
  5. 常用的操作界面

1.3 数据集的概念和操作

  1. 数据类型
  2. 变量
  3. 向量
  4. 函数和管道
  5. 数据框
  6. 矩阵
  7. 数组
  8. 列表

1.4 不同形式数据导入

  1. 自行输入数据
  2. 导入Excel数据
  3. 导入XML数据
  4. 导入SPSS数据
  5. 导入Stata数据
  6. 导入数据库数据

第二章 R 语言基本操作

2.1 常见语法

  1. 创建自己的函数
  2. 调用函数
  3. 处理数据对象的常用函数

2.2 图形基本操作

  1. 如何绘制简单图形
  2. 图形参数
  3. 添加图形元素

2.3 基本数据管理

  1. 数据编码
  2. 变量的重编吗和重命名
  3. 缺失值处理
  4. 日期值处理
  5. 异常值处理
  6. 数据类型转换和排序
  7. 数据合并和提取
  8. 长宽数据格式转化

2.4 高级数据管理

  1. 常用数据处理函数
  2. 循环函数处理
  3. 数据整合与重构

第二部分 R 语言基本方法

第三章 R 语言数据处理

3.1 数据清洗步骤

  1. 一个例子
  2. 变量对齐
  3. 数据归一化

3.2 缺失值的数据处理

  1. 验证数据缺失模式
  2. 删除缺失数据
  3. 缺失变量分析

3.3 数据插补

  1. 为什么进行插补
  2. 均值插补
  3. 热卡插补
  4. 多重插补

3.4 异常值数据分析和处理

  1. 识别异常值
  2. 异常值剔除
  3. 异常值转化

第四章 基本统计分析

4.1 描述性统计分析

  1. 一个经典例子
  2. 数据归一化处理
  3. 分组统计

4.2 频数和列联表

  1. 生成频数表
  2. 独立性检验
  3. 列联表检验

4.3 相关和 t 检验

  1. 计算几种不同相关系数
  2. 相关分析可视化
  3. t 检验

4.4 R 语言方差分析

  1. 方差分析
  2. 单因素方差分析
  3. 双因素方差分析
  4. 多元方差分析

第五章 数据可视化

5.1 ggplot2 介绍

5.2 图形基础

  1. 图层
  2. 标签
  3. 标度
  4. 配色
  5. 图例
  6. 主题
  7. 注释
  8. 分面
  9. 字体
  10. 动画
  11. 组合

5.3 描述趋势

  1. 折线图
  2. 曲线图
  3. 蜡烛图
  4. 等高线图
  5. 日历图
  6. 曲面拟合图

5.4 描述关系

  1. 散点图:相关关系
  2. 气泡图:相关关系
  3. 树形图:层次关系
  4. 韦恩图:交叉关系
  5. 甘特图:依赖关系

5.5 描述占比

  1. 简单饼图
  2. 环形饼图
  3. 扇形饼图:南丁格尔风玫瑰图
  4. 马赛克图:多个分类变量占比
  5. 矩阵树图:有层次的占比

5.6 描述对比

  1. 柱形图
  2. 条形图:柱形图横着
  3. 点图:克利夫兰点图,条形图的简版
  4. 雷达图:多元数据,多变量对比
  5. 词云图:

5.7 描述分布

  1. 直方图
  2. 箱线图
  3. 密度图
  4. 提琴图
  5. 热力图

第六章 常用的 R 包

6.1 数据处理

  1. tidyverse
  2. tibble
  3. readr
  4. stringr
  5. dplyr
  6. data.table

6.2 时序数据

  1. ts
  2. lubridate
  3. arima

6.3 文本分析

  1. tm
  2. tidytext
  3. topicmodel
  4. wordcloud

6.4 网络数据

  1. network
  2. igraph
  3. sna

6.5 数据可视化

  1. ggplot2
  2. plotly
  3. lattice

第三部分 R 语言机器学习

第七章 R 语言回归

7.1 R 语言回归分析

  1. 回归分析介绍
  2. 线性回归
  3. 多项式回归
  4. 多元线性回归

7.2 回归诊断

  1. 多重共线性
  2. 异常值
  3. 改进措施

7.3 模型选择

  1. 模型比较
  2. 变量选择
  3. 交叉验证

7.4 广义线性模型

  1. 广义线性模型介绍
  2. 模型拟合和回归诊断
  3. 模型改进

7.5 逻辑 Logistic 回归

7.6 泊松回归

7.7. Cox-Box 比例风险回归

第八章 R 语言分类

8.1 R 语言分类介绍

8.2 Logistic 回归

8.3 决策树

8.4 随机森林

8.5 支持向量机

8.6 集成学习方法

  1. bagging
  2. boosting
  3. xgboost / lightgbm

8.7 朴素贝叶斯方法

第九章 R 语言聚类

9.1 R 语言聚类分析

9.2 聚类分析的步骤

9.3 距离计算

9.4 层次聚类分析

9.5 划分聚类分析

  1. K-Means 聚类
  2. 围绕中心点的划分

9.6 模糊聚类分析

9.7 谱聚类分析

第十章 R 语言统计模拟方法

10.1 统计模拟介绍

10.2 重抽样法

10.3 自助法

10.4 MCMC 方法

第十一章 R 语言降维方法

11.1 线性判别分析

11.2 主成分分析

  1. 判断主成分个数
  2. 提取主成分
  3. 主成分旋转和得分

11.3 因子分析

  1. 判断公共因子数
  2. 提取公共因子
  3. 因子旋转
  4. 因子得分

11.4 奇异值分解

11.5 特征选择

  1. 岭回归
  2. Lasso

第十二章 R 语言时间序列分析

12.1 R 语言时间序列对象

  1. 时序数据预处理
  2. 时序数据的平滑化
  3. 时序数据分解

12.2 指数预测模型

  1. 指数平滑
  2. 自动预测

12.3 ARIMA 预测模型

  1. ARMA 模型
  2. ARIMA 模型
  3. 自动预测

第十三章 R 语言文本数据挖掘

13.1 文本字符串处理

  1. 字符串构造
  2. 字符串提取
  3. 字符串替换和删除
  4. 字符串拼接和拆分

13.2 正则表达式

  1. 通配符
  2. 字符集
  3. 文本匹配

13.3 文本数据预处理

  1. 文本切分
  2. 停用词处理
  3. 词干提取
  4. 词性还原和词性标注

13.4 文本特征提取

  1. 基本特征提取
  2. 基于 TF-IDF 特征提取
  3. 词嵌入
  4. 文档向量化

13.5 文本机器学习

  1. 文本相似度聚类
  2. 文本主题模型
  3. 文本分类

13.6 文本情感分析

  1. 情感词典
  2. 英文情感分析
  3. 中文情感分析

13.7 文本可视化

  1. 条形图
  2. 词云图
  3. 网络图

第十四章 R 语言网络数据挖掘

14.1 网络数据构建

  1. 创建网络图
  2. 网络图表示
  3. 常见的图

14.2 网络数据的描述

  1. 节点和边的特征
  2. 网络的凝聚特征
  3. 图的分割

14.3 网络数据可视化

  1. 图可视化的基本元素
  2. 图的布局
  3. 常见网络图形可视化

14.4 网络图模型

  1. 随机图模型
  2. 广义随机图模型
  3. 小世界模型
  4. B-A 模型
  5. 指数随机图模型
  6. 网络模型评估

14.5 网络流和动态网络数据分析

  1. 引力模型
  2. 流量矩阵估计
  3. 动态网络标识
  4. 动态网络可视化
  5. 动态网络建模

第十五章 R 语言假设检验

15.1 假设检验与检验的 P 值

  1. 假设检验的步骤
  2. 检验的 P 值

15.2 正态总体参数的检验

15.3 单正态总体参数的检验

15.4 两正态总体参数的检验

15.5 配对数据的 t 检验

15.6 比率的检验

  1. 单样本比率的检验
  2. 两样本比率的检验

15.7 单总体位置参数的非参数检验

  1. 中位数的符号检验
  2. Wilcoxon 符号秩检验

15.8 分布的一致性检验 $\chi^2$ 检验

15.9 两总体的比较和非参数检验

15.10 多总体的比较与非参数检验

第十六章 R 语言创建动态报告

16.1 用 R Markdown 生成动态报告

16.2 用 tinytex 生成 LaTeX 报告

16.3 用 rticles 生成期刊文章

16.4 用 Markdown 生成幻灯片

  1. PowerPoint 演示文稿
  2. Beamer 学术型幻灯片
  3. HTML 网页幻灯片

16.5 用 bookdown 生成书籍

16.6 用 blogdown 生成博客

第十七章 R 语言深度学习

17.1 R 连接远程服务器

17.2 用 Spark 进行机器学习

17.3 R 语言深度学习初步

17.4 构建卷积神经网络

17.5 可视化卷积神经网络的学习过程

第十八章 开发 R 包

18.1 如何创建 R 包

第十九章 开发 Shiny 应用

19.1 Shiny 应用介绍

@XiangyunHuang

This comment was marked as outdated.

@XiangyunHuang

This comment was marked as off-topic.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant