段位一 · 表达差异 · 挑

生信学习从游刃有余到炉火纯青。“表达差异”是第五个段位,与上篇第一个段位相对应。本段位聚焦于用R语言完成芯片数据、测序数据的下载与清洗,差异表达相关性分析,涵盖了数据集归一化、去除批次效应、多平台数据集合并、ID转换、基因重注释等高通量处理过程中的重难点问题,突破了在线数据库的有限分析可选项的局限。

模块1

芯片数据下载与清洗

目前生信分析的数据来源的两大宝库一个是芯片数据集,一个是测序数据集。本知识模块将带领大家学习和掌握用R语言对芯片数据进行下载与清洗、数据质量评估与标准化、去除批次效应、芯片注释等内容。

模块2

芯片数据表达差异分析

本知识模块将带领大家学习用R语言进行芯片数据的差异表达分析技能。了解芯片差异分析方法,学会limma包差异分析的步骤,ID转换,差异分析结果的可视化。

模块3

测序数据获取与清洗

目前生信分析的数据来源的两大宝库一个是芯片数据集,一个是测序数据集。本知识模块将带领大家学习RNA-seq数据差异分析流程,掌握用R语言进行测序数据的获取和下载,对TCGA的数据进行预处理,以及数据质量的评估。

模块4

测序数据表达差异分析

本知识模块将带领大家学习用R语言进行RNA-seq数据差异表达分析的具体操作,熟悉表达量数据类型与转换,掌握使用DESeq2、edgeR和limma+voom流程进行差异分析,处理TCGA和GTEx测序数据合并分析的批次效应,并可视化呈现差异分析结果。

段位二 · 功能注释 · 圈

“功能注释”是第六个段位,是对上篇第二个段位“功能聚类”的扩展。本段位基于R语言分析,进一步从分子、细胞功能注释层面增加了分析细节以及可视化效果的“高级感”。介绍到了6种GO/KEGG富集分析方法、7种GSEA富集分析方法、GSVA分析、 6种细胞注释分析、以及20个WGCNA分析展示图的原理介绍、步骤详解与代码复现,紧贴生信高分文章热点。

模块1

GO/KEGG富集分析

本知识模块将带领大家了解GO/KEGG富集分析的R包的简介与安装,以及掌握用clusterProfiler包、GOplot包、pathview包进行GO/KEGG富集分析。

模块2

GSEA/GSVA富集分析

GO, KEGG分析是基于单基因或者多个基因列表的富集分析,GSEA分析检测基因集合的表达变化,GSVA分析检测感兴趣的基因集在不同样品间的差异,或者寻找比较重要的基因集。本知识模块介绍了用clusterProfiler包进行GSEA富集分析,用GSVA包进行GSVA分析,以及GSEA与GSVA的分析比较。

模块3

细胞注释

细胞注释的方法包括:已发布的细胞类型表达谱数据作为参考,预测混合表达谱中不同细胞类型的含量;应用GO,KEGG,MSigDb等数据库或自定义整理的不同细胞类型的标签进行注释。本知识模块主要介绍了 细胞注释在线工具-EPIC, TIMER,以及细胞注释的4大常用R包: estimate,CIBERSORT, MCPcounter,GSVA(ssGSEA)。

模块4

WGCNA分析

WGCNA旨在寻找协同表达的基因模块,并探索基因网络与关注表型之间 的关联关系,探究网络中的关键基因。本知识模块介绍了WGCNA的原理,分析流程,应用实例,以及WGCNA在线分析工具。

段位三 · 分子互作 · 联

“分子互作”是第七个段位,是对上篇第三个段位“交互网络”的扩展。本段位基于R语言分析,进一步介绍了基因与基因、分子之间和分子与表型相关性分析、分子与分子修饰形式(DNA甲基化、SNP结构突变、CNV拷贝数突变、可变剪切)、分子与表型、分子与细胞、分子与药物之间的相关性分析。与此同时,本段位挑选了近期发表的三篇高分纯生信文章(非肿瘤文章套路、可变剪切文章套路、ceRNA文章套路),手把手教你解构R语言分析的课题思路,完整复现文章图表。

模块1

分子之间和分子与表型相关性分析

分子相互作用是基础科研必修技能 。本知识模块将带领大家掌握基因之间相关性、分子与分子修饰相关性、表型相关基因提取、基因与表型相关基因的相关性分析

模块2

分子与细胞和分子与药物相关性分析

从网络和系统的角度探索复杂疾病机制是生信类课题的常见分析方法。本知识模块介绍了基因与细胞间的相关性分析、细胞与细胞之间的相关性分析、通过基因表达预测药物的IC50,以及药物与疾病靶点、中药复方网络的可视化分析。

模块3

ceRNA生信套路解构

ceRNA(competing endogenous RNAs,竞争性内源RNA)假说,提供了RNA之间相互作用的一种新机制。ceRNA研究套路,综合mRNA, lncRNA, circRNA和miRNA,研究其ceRNA调控网络关系。本知识模块介绍了ceRNA的研究套路,从文章解构到图表的完整代码复现。

模块4

可变剪切生信套路解构

可变剪切是基因转录时,通过组合不同的外显子,形成不同转录本的过程,在遗传信息的传递过程中发挥着重要的作用。本知识模块介绍了可变剪切的研究套路,从文章解构到图表的完整代码复现。

模块5

非肿瘤生信套路解构(选学)

本章为彩蛋部分,以一篇3分加非肿瘤生信套路为基础,以R语言文字复现为主,对非肿瘤生信文章的思路进行详细讲解。首先对该生信文章进行解构,概述文章框架,解析文章图表,拆解数据特征,并对文章的亮点和不足之处进行点评,手把手教实操,大家用代码完整复现文章,并将数据分析方式和思路进一步扩展和升华。

段位四 · 临床模型 · 靠

“临床模型”是第八个段位,与上篇第四个段位“临床意义”相对应。本段位介绍了基于R语言的临床三表一图的绘制;同时进一步扩展,介绍了二分类/多分类logistic回归模型构建,诊断模型验证(区分度、校准度、临床决策曲线)、单因素/联合指标ROC绘制、单因素&多因素COX回归分析(原理、实现、Time-ROC、临床亚组分析)、测试集与验证集的构建,预后模型的构建与验证等内容,囊括了临床预测模型的常见统计分析与可视化方法。与此同时,本段位挑选了一篇经典的临床预测模型文章,手把手教你解构R语言分析的课题思

模块1

临床相关性三表一图

本章对临床预测模型的现状和研究思路的进行简介,掌握用R语言进行基线资料表、单因素表和多因素表、生存分析图的分析和可视化展示。

模块2

临床预测模型之诊断模型

本知识模块介绍了临床预测模型中诊断模型中的常见分析的统计学原理、分析流程及实操演示。常见的分析包括二分类logistic回归模型的构建、诊断模型的验证、ROC曲线的绘制。

模块3

临床预测模型之预后模型

本知识模块介绍了临床预测模型之预后模型中常见分析的统计学原理、分析流程及实操演示。常见的分析包括单因素&多因素Cox回归分析、诊断模型的验证、ROC曲线。

模块4

临床预测模型之文章解构

本知识模块以一篇经典的临床预测模型文章为基础,对生信文章的思路进行详解,包括范例文章的思路描述和图表解析,手把手教学员完整复现范例文章,并将思路进一步扩展和升华。

课程预览

© 2020 解螺旋 - 中国临床医生科研成长平台 沪ICP备15007276号-1 沪公网安备 31010402005761号
解螺旋

扫描二维码

关注解螺旋微信公众号

上海市徐汇区番禺路1028号 (上海数娱大厦)301-304室

微信咨询

  • 课程客服
  • 服务客服
课程客服
服务客服

微信扫一扫,咨询客服人员

回到顶部