当前位置: 模型材料 >> 模型材料优势 >> 基于R的生存资料预测模型构建与Nomog
题记:本文成形于年并于年收录于由笔者与胡志德医生共同主编,中南大学出版社出版的《疯狂统计学》,此次属旧文重发,较原文有较大改动。
1.背景介绍
人们对于“算命”这样的事情总是乐此不彼,无论是中国文化中“算命占卜”还是西方文化中的“占星术”,无不说明人们对于此道的热衷。本章讨论的构建预测模型也是一种“算命”,只是这是一种更为科学的“算命”。作为一个肿瘤科医生,临床上可能会遇到这样的情况,一个55岁男性中晚期食管癌患者问道:医生,请问我还能活多久?大多数时候我们会根据患者的临床分期告诉患者,这种情况的中位生存时间是多少……其实这里的临床分期就是我们预测患者期望寿命的依据,或者如本文标题所说的“预测模型”,我们用某一临床分期的所有患者中位生存时间来回答单个患者的问题,可能会存在问题,这里的中位生存时间代表的是患病人群预期寿命的平均值,对于具体的个体来说有时并不准确。
那我们是否有更科学、更准确的方法计算出单个患者的生存概率?答案是肯定的。我们可以通过Cox回归等方法先构建一个数学模型,然后把这个模型可视化为Nomogram,通过图形来计算每个具体患者的生存概率。Nomogram中文常称为诺莫图或者列线图,其本质就是回归方程的可视化。它根据所有自变量标准回归系数的大小来制定评分标准,给每个自变量的每种取值水平一个评分,对每个患者,就可计算得到一个总分,再通过得分与结局发生概率之间的转换函数来计算每个患者的结局时间发生的概率。举例来说,我们治疗了一个40岁的男性胰腺癌手术后的患者,术中进行了放疗,肿瘤位于胰腺头部,有腹膜转移,临床分期在IV期。根据上述条件,通过一定的数学模型判断每个变量的得分,比如年龄40岁,得分是10分,男性得分是4分……依次累计各个变量的得分,计算出总分,不同的总分值就对应3月、6月和1年的生存概率。复杂的Cox回归公式变成了直观的图片,医生可以很方便的计算每个患者的生存概率,从而告知患者一个相对准确的“算命”结果。模型预测是否准确,一致性好不好等概念我们将在后续文章中陆续介绍。
2.案例与操作
本章我们以[案例1]的数据,介绍生存资料预后模型的建立与Nomogram图形绘制。为了便于读者阅读与练习模仿,笔者对数据进行了简化处理。
[案例1]笔者在TheCancerGenomeAtlas(TCGA)数据中下载例浸润性乳腺癌患者的临床资料。下载网址:
转载请注明:http://www.aideyishus.com/lkgx/251.html