TCGA是研究肿瘤相关机制的重要资源。在线数据库更新改版都比较快,使用时需要参照最新的线上数据教程。不过癌症相关的数据库操作起来也都比较类似,输入一个或多个关注的目的基因,查看基因的功能注释,基因在哪些样品中存在突变,突变位点的分布,共表达网络,生存分析等。
本系列包括了TCGA本站中数据的浏览、下载,尤其是TCGA改版后的功能介绍(增加了OncoGrid展示),然后是cBioPortal,TCGA数据在线提供的分析类型最多的一个平台,再是FIREBROWSE,比较不错的在线展示和方便的数据下载功能。
TCGA主站
TCGA分析了11,000个病人的33种肿瘤的7个不同层面的数据,共获得2.5 PB数据。
意在解析癌症发生的分子接触、肿瘤的亚型和治疗靶点等。
TCGA网站主要提供的是数据的浏览和下载功能,可以根据项目、个体、数据类型、肿瘤类型等筛选需要的数据,使用TCGA提供的工具下载,进一步分析。
TCGA项目促成了不少的高水平文章,对这些文章的阅读是对癌症知识的学习,也可以很好的扩展研究思路。
如果你需要帮助,WIKI是最好的伙伴。
最新版的TCGA增加了一些分析的功能,主要是展示基因的信息、突变频率、突变位点分布、OncoGrid信息等。
在搜索框搜索基因,癌症类型,个体编号会有不同的结果体验。
查看基因在哪种癌症中突变最频繁
突变位点在基因和功能域的分布,纵轴表示突变个体数目。
基因每个位点的突变频率,为上图纵轴信息的表格展示。
乳腺癌中突变频率最高的基因和病人生存曲线
500个突变最多的个体和50个最高突变的基因,顶部柱状图代表每个个体中这50个基因的突变位点数目,右侧柱状图表示含有每个基因突变位点的个体数目,热图不同颜色代表不同的突变类型,下方2个颜色条代表临床信息和数据类型,右侧的第一个颜色条代表该基因是否是Cancer Gene Census (The Cancer Gene Census is a list of genes with substantial published evidence in Oncology.),第二个颜色条代表突变影响到的个体数。