1.2 “人工智能+”怎么看上了医疗?
1.2.1 供需矛盾突出
从需求端来看,当前,四十多年的工业化进程也带来了不同程度的环境污染,叠加我国人口老龄化加剧,患慢性疾病(简称慢性病、慢病)人口数量增多,形成大量医疗需求。
第七次全国人口普查结果显示,我国60岁及以上人口为26402万人,占18.70%。未来几十年,老龄化程度还将持续加深,到2035年前后,我国老年人口占总人口的比例将超过四分之一,到2050年前后将超过三分之一。目前,中国已成为全世界老年人口数量最多、老龄化速度最快的大国。其中,东北三省的老龄化现象尤为明显。2020年,东北三省总人口比十年前减少了1101万人,而老龄化程度加深,65岁及以上人口比重为16.39%,提高7.26个百分点,高于全国平均水平。辽宁省65岁及以上人口比重为17.42%,为全国省市中最高。
在人口老龄化背景下,现代生活节奏加快,患慢性疾病人口数量也随之增加。我国已确诊的患慢性疾病人口数量超过3亿,同时患病率以每年5.8%的速度增长。2021年11月初,国际糖尿病联合会(International Diabetes Federation,IDF)在官网上更新了今年IDF全球糖尿病概览的相关数据,在中国,2011—2021年的十年间,糖尿病患病人数从9000万增长到了1.4亿,占全国人口数的十分之一,与世界范围内的发病率持平。在这1.4亿人中,有51.7%的人群未被诊断,属于“隐性”糖尿病群体。根据全国卫生服务调查,65岁以上群体的慢性疾病患病率高达78.4%,是全部人口患病率的3.2倍,即老龄人口越多慢性疾病人群基数越大。如今,慢性疾病已成为健康的头号威胁,占到了中国77%的健康生命年损失和85%的死亡诱因,占全部疾病负担的60%以上。
人口结构的变化还将带来诊疗以外的医疗健康需求的结构性增加,包括疾病预防和治疗、健康监测和管理、养生和保健、临终关怀等。以体检为例,与美、日、德超过70%的覆盖率相比,我国的健康管理市场还有巨大的发展空间。而健康管理借助人工智能可以极大地赋能,让健康管理实时可见、可控。伴随着生活水平的提高,以及国家政策对家庭医生、慢病防治、健康生活等方面的支持,越来越多的人将主动参与健康管理。
然而,从供给端来看,优质医生及医疗资源不足,且医疗资源分布不均,难以承受快速增长的医疗需求。从总量上看,医疗资源供给增长落后于需求增长。我国医生与总人口的比例约为1∶343,而西方国家的这一比例约为1∶280。医生资源缺口问题在影像科医生、病理科医生及全科医生方面尤为严重。目前,我国医学影像数据的年增长率约为30%,而影像科医生数量的年增长率仅为4.1%,病理科医生缺口达到10万人。我国全科医生数量约30万人,占医生总数的7.37%。这一比例还远远达不到建立真正的全科医生制度体系的需求——德国、法国、日本的占比均在20%以上,美国在12%以上。由于医生的培养周期很长,我国独立上岗医生的培养周期长达8年,较长的培养周期带来医疗人力成本提高,难以满足持续增长的医疗需求。
从分布上看,医疗资源集中于三级医院和发达地区,基层医院医疗水平低,医生资源少。从配置上看,据统计,2018年我国医院数量超过3.2万家,三级医院仅占总数量的19%,却承接了全国49.8%的医疗需求。三级医院长期超负荷运转,承担了过多基础诊疗工作,导致核心医疗资源无法发挥最大价值。供需结构不匹配导致了医院运营效率低、误诊率高、医疗体验差等诸多问题。
可以说,供给与需求矛盾突出,是我国医疗行业的根本问题。而这些问题,不论是医生的培养,还是医生医疗技术水平的提升,借助人工智能技术都将有望得到改善。
1.2.2 人工智能技术不断突破
一直以来,算法、算力和数据被认为是人工智能发展的三驾马车,也是推动人工智能发展的重要基础。
1.在算法层面
在算法层面,超大规模预训练模型等成为近两年最受关注的热点之一。自OpenAI于2020年推出GPT-3以来,谷歌、华为、智源研究院、中国科学院、阿里巴巴等企业和研究机构相继推出超大规模预训练模型,包括Switch Transformer、DALL·E、MT-NLG、盘古、悟道2.0、紫东太初和M6等,不断刷新着各榜单纪录。而OpenAI更是一举将大模型的训练之路打开了,让大家看到了基于深度学习的路径方向,基于参数优化一旦正确,机器就能具备类人的智能逻辑。
深度学习是人工智能技术的重要一脉,目前语音识别和计算机视觉都基于深度学习技术来完成。随着图像领域深度学习Resnet网络结构发展,计算机视觉和综合图像处理技术取得长足进步,医学影像分析在诊疗过程中发挥更大作用。例如,应用计算机视觉技术进行结肠镜检查,可以获得更为有效、可靠的数据,以降低结肠癌死亡率;在外科手术中,计算机视觉对脑瘤病人进行三维头骨建模,有利于后续神经外科治疗。
此外,近年来,人工智能对海量数据的分析能力能够让研究者不再局限于常规的“推导定理式”研究,可以基于高维数据发现相关信息,继而加速研究进程。2020年,DeepMind提出的AlphaFold2在国际蛋白质结构预测竞赛(Critical Assessment of protein Structure Prediction,CASP)中拔得头筹,能够精确地预测蛋白质的三维结构,其准确性可以与使用冷冻电子显微镜等实验技术解析的三维结构相媲美。中美研究团队使用人工智能的方法,在保证“从头计算”高精度的同时,将分子动力学极限提升了数个量级,比过去同类工作计算空间尺度增大100倍,计算速度提高1000倍,获得2020年国际计算机协会(Association for Computing Machinery,ACM)戈登贝尔奖。
2.在算力层面
在算力层面,当前,人工智能算力仍在持续突破,面向训练用和推断用的芯片仍在快速演进。这主要源于算力需求的驱动。一方面,体现在模型训练阶段,根据OpenAI数据,模型计算量增长速度远超人工智能硬件算力增长速度,存在万倍差距;另一方面,由于推断的泛在性,使得推断用算力需求持续增长。与此同时,新的算力架构也在不断研究中,类脑芯片、存内计算、量子计算等备受关注,但总体上处于探索阶段。
3.在数据层面
在数据层面,以深度学习为代表的人工智能技术需要大量的标注数据,这也催生出专门的技术乃至服务。随着面向问题的不断具体化和深入,数据服务走向精细化和定制化。此外,随着知识在人工智能的重要性被广泛提及,对知识集的构建和利用不断增多。
人工智能的快速发展推动数据规模不断提升。据互联网数据中心(Internet Data Center,IDC)测算,2025年全球数据规模将达到163 ZB,其中80%~90%是非结构化数据。数据服务进入深度定制化的阶段,百度、阿里巴巴、京东等公司推出根据不同场景和需求进行数据定制的服务。企业需求的数据集从通用简单场景向个性化复杂场景过渡。例如,语音识别数据集从普通话向小语种、方言等场景发展,智能对话数据集从简单问答、控制等场景向应用场景、业务问答等方向发展。各方积极探索建立高质量知识集,支撑未来知识驱动的人工智能应用发展。
数据生成和共享速度迅速增长。在数据方面,我国拥有得天独厚的优势,我国人口众多,数据基数大,同时多样性丰富,为大数据分析提供了丰富的数据来源,也为人工智能不断训练与优化算法模型提供了广泛数据集。
尽管中国有比较庞大的人口数量与相对的数据优势,但医疗信息化与数据化普及程度不足,也制约着人工智能医疗产业的发展。但相比较而言,尽管美国的人口基数与数据样本量没有中国庞大,但美国有着比较健全的医疗数据化系统,或者说医疗的信息化、数据化程度比较高,这就使得美国在人工智能医疗方面的训练上,更容易基于数据化与标准化训练出诊断准确性更高的人工智能医生。
1.2.3 政策引导和支持
近年来,我国出台了一系列全国性政策及医疗人工智能专项政策,鼓励“人工智能+”医疗产业发展。在政策引导下,医疗产业有望迎来真正的变革。
2017年7月,国务院印发《新一代人工智能发展规划》(以下简称《规划》),这也是我国在人工智能领域进行系统部署的第一份文件。《规划》指出,到2030年,我国人工智能理论、技术与应用总体上要达到世界领先水平。在《规划》提出的六大重点任务中,特别提出要在医疗领域发展便捷高效的智能服务,围绕医疗等方面的迫切民生需求,加快人工智能创新应用,使精准化智能服务更加丰富多样,使社会治理智能化水平大幅提升。《规划》提出发展智能医疗:“推广应用人工智能治疗新模式新手段,建立快速精准的智能医疗体系。探索智慧医院建设,开发人机协同的手术机器人、智能诊疗助手,研发柔性可穿戴、生物兼容的生理监测系统,研发人机协同临床智能诊疗方案,实现智能影像识别、病理分型和智能多学科会诊。基于人工智能开展大规模基因组识别、蛋白质组学、代谢组学等研究和新药研发,推进医药监管智能化。加强流行病智能监测和防控”。
2018年,教育部印发《高等学校人工智能创新行动计划》,国务院办公厅印发《关于促进“互联网+医疗健康”发展的意见》。2020年,中共中央政治局常务委员会召开会议时指出,要加大公共卫生服务、应急物资保障领域投入,加快5G网络、数据中心等新型基础设施建设进度。
2020年新冠疫情暴发之时,工信部网站发布了《充分发挥人工智能赋能效用 协力抗击新型冠状病毒感染的肺炎疫情倡议书》,倡议进一步发挥人工智能赋能效用,组织科研和生产力量,把加快有效支撑疫情防控的相关产品攻关和应用作为优先工作,进一步推动了“人工智能+”医疗的发展。
2023年更是着重于电子病历的推行。国家卫健委在4月发布新版国家二级公立医院绩效考核操作手册。对于二级公立医院的电子病历应用功能水平分级、患者满意度等指标,新版手册要求逐步提高。以电子病历为核心的医院信息化建设是深化医改的重要内容之一。电子病历的推行,是数字化医疗的一个重要举措,或者说是人工智能医疗向前发展的一个基础条件。没有数据就很难训练出高质量的人工智能医生,而电子病历的数据化,给人工智能的医疗变革奠定了基础。