最新的癌症发病数据为什么是2012年的？

北京的数据已经延迟了两年。如果是国家数据，最新数据是2010年。如果是全球数据，最新数据是2007年。这是为什么？

[前情回顾]中国癌症地图的“最新版本”是假的

以北京为例，原因如下:

首先，收集数据需要时间。北京每年约有4万名新诊断的癌症患者是注册居民。40，000个数据不会自动输入我们的数据库。北京从2003年开始实施信息平台建设。全市140多家二级及以上医院每月或每季度通过HIS系统向信息平台报告。我们每3个月获取一次汇总信息。

第二:整理数据需要时间。什么？第一件要做的事情是消除从其他地方来北京就医的病例。不要认为区分本地和外国是容易的。事实上，这个过程相当复杂。这里没有太多的解释。如果有人想知道更多，我稍后会写一个解释。此外，我们应该消除重复的医疗案例。只要病人去看医生，医院就会向我们报告一次。肿瘤患者不同于其他疾病。病人经常从一家医院换到另一家医院。然后每个人都会问，既然实名制已经建立，统一识别身份证号码还不够吗？事情仍然没有那么简单。首先，有两个过程来识别重复。首先是确定当年发生的重复。二是与历史数据进行比较，以识别重复。例如，当某人在2008年被诊断患有癌症时，我们收集了他的信息。当时，他没有记录自己的身份证号码。然后在2012年，实名制实施后，他在那一年住了四次医院，所以很容易通过身份证识别那一年的重复。前提是他没有带着爱人的身份证住在医院。但是，由于他在2012年没有记录身份证，与历史数据相比，他不能只凭身份证记录，还需要其他验证条件。此外，用不完整的信息补充案例仍然需要时间。

第三，案例验证需要时间。医院向我们报告病例信息，从100，000多个数据中整理出最后40，000个病例。虽然目前世界上采用统一的编码规则进行报告，但由于各医院数据报告人员水平参差不齐，总会造成一定比例的错误数据或逻辑不一致的数据。这些案件将每年退回重审。检查完成后，信息将更新到原始数据库。

说到这，人们可能会问，做这些工作需要两年时间吗？答案是肯定的。如果我们不每天加班，我们不一定能在两年内完成这项工作。为了让政府和公众尽快看到最新的数据，我们会采用一切可行的方法，缩短收集和整理数据的时间。然而，上述三个原因所描述的工作远远不能满足数据整理的要求。

然后看看第四个原因:死亡需要时间来弥补疾病。死亡补充剂是我们这个领域的专业术语。这是什么意思？也就是说，医院向我们报告的关于该疾病发生的信息报道不足。我们不能保证所有癌症患者都会去医院住院。有些病人在门诊被诊断时已经处于晚期。此外，如果他们年龄较大，他们可能会选择回家接受姑息治疗。因此，我们无法收集一些病人的信息。怎么做？我们不能通过用病人的死亡信息来补充病人的死亡信息来监测病人的死亡信息，但是只要病人死亡，我们就会通过政府的死因监测部门获得病人的死亡数据，然后将其与我们的发病率数据进行比较。相比之下，没有遗漏报告。相比之下，我们将把患者的信息补充到发病率数据库中。我们可以控制上面提到的前三个原因，但我们不能控制第四个原因。假设患者在2012年被诊断患有癌症，但未能同时在医院进行报告，并且他在2014年回家时死亡，那么我们至少要到2015年1月才能获得他的死亡数据来补充我们的发病率数据，因为死亡部门也需要时间来收集死亡数据。正因为如此，在2014年，我们实际上可以得到的2012年的数据并不是最完美的，但这已经是最接近真实情况的可以完成的了。

以上只是关于北京的情况。相对而言，北京信息化程度较高，各单位员工素质水平相对较高。因此，就质量和效率而言，收集的数据相对较高。如果收集国家数据，对数据进行质量控制将需要更长的时间，尤其是对世界而言。此外，外国人的工作更严格，这就是为什么上述数据会出现。他们想要2014年的最新全球数据。好吧，2007年。