目标
从 GDC 官网获取结直肠癌相关数据集,主要包括 TCGA-COAD(结肠癌)和 TCGA-READ(直肠癌)。我们将分两部分进行:病理全图(WSI)数据的下载与可视化,以及生存预测所需临床信息的提取。
获取'病理全图 WSI'
1. 进入官网
首先访问 GDC Portal 首页:https://portal.gdc.cancer.gov
2. 创建 Cohort
进入 Project 页面
在顶部导航栏点击 Projects,搜索并选中 TCGA-COAD 和 TCGA-READ。这一步是为了锁定我们要分析的项目范围。

创建 Cohort
点击页面上的 'Create New Cohort',将其命名为 Colorectal。这样可以将两个项目的样本聚合在一起管理。

3. 筛选并下载图像数据
进入 Repository 页面
在 Cohort 页面中,切换到 Repository 标签页查看可用文件。

筛选 Diagnostic Slide 类型
我们需要的是病理切片,所以过滤条件如下:
- Experimental Strategy 选择
Diagnostic Slide - Data Format 选择
.svs








