医疗大模型:最应该笃定的反而是资本!

贝壳号 | 发布于2023-08-27

编辑按:本文转载至微信公众号“良医财经”,飞鲸投研经授发布 。

沉寂已久的美元医疗组又活泛起来。

过去很长一段时间来,美元基金的投资人销声匿迹,虽然医疗仍然火热,但是过去他们所投资的原创药在一级市场表现不佳,重仓的互联网医疗似乎也没有看到上岸的迹象。

自从ChatGPT火了之后,投资人们再一次兴奋起来。有人戏称:“AI再一次拯救了美元基金。”

回到产业内,不少公司虽迟但到。

京东健康、医联、百度灵医智惠、深睿医疗、科大讯飞、智云健康、上海联通、润达医疗、深圳市大数据研究院、东软、叮当健康、卫宁健康、清华智能产业研究院等互联网医疗、研究院都纷纷祭出自家的产品。

据不完全统计,自2月份以来,已经发布或者即将发布医疗大模型产品的项目达到十余家,纷纷保住了各家科技属性的尊严。

但市场也有拍砖的声音:大模型创业一个关键指标就是公测,但至今为止尚未看到有人拿出公测数据,大多都处在产品研发阶段,何时落地?何时商业化?

更重要的是,医疗大模型能否真的解决医疗问题?

相较于通用大模型,医疗大模型入局有四个特点:进场相对较晚,推进速度更慢,数据技术场景水都很深、对专业性要求最高。

各家究竟做得怎么样,进展如何,良医财经做一次系统梳理盘点,也顺便试图剖析其中的技术和商业难点。

01垂类通用大模型 VS 垂类应用大模型

没有孰优孰劣之分

自今年3月份百度发布大语言模型“文心一言”,成为我国首个类ChatGPT产品后,多家企业发布的大模型争相亮相。截至7月3日,我国10亿级参数规模以上大模型已超80个。

这其中既有互联网巨头发布的产品,也有旷视科技商汤科技、科大讯飞等人工智能公司,还有光年之外、百川智能等初创企业,以及中科院自动化所、上海人工智能实验室等科研院。

日前召开的“2023全球数字经济大会人工智能高峰论坛”上,360公司创始人周鸿祎甚至预测,未来可能不是百模大战,而是万模群舞。

事实上,业内的专家谈到大模型落地时,一个普遍的共识是,垂直领域率先取得突破。

周鸿祎指出:“有人认为,大模型是不是像之前流行的概念一样,就是一个风口和泡沫?我认为应该不是,而是一场新的工业革命。大模型可以提高每个人、每个组织的劳动生产力,实现通用人工智能对产业的赋能。”

不必刻画群魔乱舞的诋毁,也无须过分的概念吹捧,良医财经的理解是:

第一,积极参与应予鼓励,毕竟全球公认的客观事实,这一定代表未来,既然都认为自己是医疗科技公司,无论从哪个角度来看,是没有理由缺席的,打磨完善团队的技能树,强化对AI价值的理解,都需要时间和过程,这是一次组织能力的演练;

第二,过程一定是烧钱的、漫长的、坎坷的,那么多烧了千亿级的互联网公司,其通用大模型的能力也还在及格线之外,所以不能低估这里面的技术难度,量力而为,保证公司活着是第一前提,弹药要准备充足,也甭指望真的有资本进场输血,押宝在这上面风险系数太大;

第三,医疗产业太特殊了,每一个环节都是坑,安全的坑、验证的坑、实用的坑、多元性的坑、政策的坑,这些都是从业者十多年趟过来的血淋淋教训,不会因为大模型的特殊性,就会好过多少。

看全是问题,干才是办法。

垂类大模型一般有两类:一类是垂类通用大模型,一类是垂类场景大模型。参与者基本上都是有产业背景的大玩家,各有各的诉求和构思,并没有孰优孰劣的标准答案。

02垂类通用大模型:

各有各的背景优势,各有各的非份欲望

垂类通用代表:京东健康、医联、百度灵医智惠、科大讯飞、上海人工智能实验室等。

构成能力:背靠大树、有钱、有数据、场景丰富。

从医疗产业看,目前拥有垂类通用大模型能力的主要是大厂,他们账面资本实力雄厚,野心和欲望也更大。

京东健康:

有着京东的大树背景,财力雄厚,且在健康领域,京东健康已经成为当前最赚钱的互联网医疗项目之一。而过去多年,京东健康建设了行业内首个实物与服务相联通、知识与数据相融合的百万级大规模健康知识图谱,沉淀了超过亿级的覆盖线上、线下医患场景的高质量健康档案,并拥有海量的医药全域流通大数据;也正是基于此,京东健康具备行业内领先的医疗大模型 " 基础性 " 资源。

有钱、有数据的京东健康在上个月,推出了大模型产品京医千询。京医千询大模型是建立在京东言犀通用大模型基础之上,能快速完成在医疗健康领域各个场景的迁移和学习,从而实现产品和解决方案的全面AI化部署,能为远程医疗服务提供坚实的技术底座。

医联:

MedGPT是由医联自主研发的一款基于Transformer架构的国内首款医疗大语言模型。与通用型的大语言模型产品不同,MedGPT主要致⼒于在真实医疗场景中发挥实际诊疗价值,实现从疾病预防、诊断、治疗、康复的全流程智能化诊疗能力。MedGPT可以整合多种医学检验检测模态能力,首次实现线上问诊到医学检查的⽆缝衔接。

值得一提的是,医联MedGPT首次突破了AI医生无法与真实患者连续自由对话的难点,并在医疗问诊场景中支持多模态的输入和输出,在疾病的预防、诊断、治疗、康复四个重要环节全面实现智能化。

为确保MedGPT的准确性和安全性,医联在预训练阶段使用了超过20亿的医学文本数据,微调训练阶段使⽤了800万条的高质量结构化临床诊疗数据,并投入超过1000名医生参与人工反馈监督微调训练。

业内人士表示,医联MedGPT目前的参数规模已经处于业内领先地位。

百度灵医智惠:

百度旗下AI医疗品牌灵医智惠,独有的医疗数据以及医疗服务经验,构建了百度灵医智惠医疗大模型的壁垒。

投入上,百度是AI最坚定的拥抱者,十年累计上千亿的投入规模和超过20%的投入强度,处于国内前列。在医疗领域,百度智慧医疗持续深耕医疗产业,根据其数据显示,AI应用落地31省份、800余医院、4000余基层诊疗机构,通过智慧诊疗、智慧管理、智慧服务面向医疗全生命周期。通过建立数据认知-知识沉淀-模型循证闭环构建AI应用驱动新范式。

定义期基本已过,内部共识基本达成,各家都有自己的背景优势,也都有自己的小欲望。

03垂类场景大模型:

深挖场景价值,先小跑起来,辅助已有业务

垂类场景代表:叮当健康、微脉、东软、智云健康、华为等。

构成能力:有医疗数据、有服务能力、直接能面向C端或者B端的消费者。

相较于垂类通用大模型,对全病程管理、多场景应用、多功能覆盖的热衷,场景类的大模型更聚焦,主打应用级的服务。

智云健康:

智云健康旗下的智云医疗大脑业内率先推出了两个医疗行业模型——ClouD GPT、ClouD DTx。ClouD GPT主要应用于医院、互联网医院等场景下的AI辅助诊疗,大幅度提升诊疗效率与体验。ClouD DTx则主要用于药械研发、数字疗法等AI辅助研发场景。

鹰瞳科技:

通过自研AIGC大模型算法,基于视网膜图像模拟疾病的演进,生成图像并进行风险评估。目前已在心血管疾病风险、痴呆风险、近视进展预测等方面取得重要进展。例如,在基于视网膜图像的心血管疾病风险预测模型上,已经经过北大临床研究所、同仁医院团队验证结果——模型在筛查临界/中等及以上(5%/7.5%)ICVD风险人群的受试者AUC分别为0.971 和0.9761。该模型对于早期发现心血管病高危人群,指导积极干预,监测和评价干预效果等起到积极的作用。

零氪科技

作为深耕大数据治理和人工智能研发应用的创新医疗科技公司,零氪科技基于对开源大模型的发展和应用,不断强化深度学习算法和核心技术壁垒,同时结合由海量临床研究数据等积累的零氪知识库和辅助工具进行定制训练,目前成功实现LLM在医疗场景的技术落地和应用,为“医疗数据结构化”和“患者私域管理”赋能,并不断探索应用新的业务场景。

微脉:

全病程管理平台微脉发布国内首款健康管理领域大语言模型应用——CareGPT。据微脉技术中心总经理海马(花名)介绍,CareGPT将语言大模型AI技术与一系列工程调优技术以及全病程管理相结合,目前参数规模为70亿,可支持医疗健康场景下的多模态输入和输出。CareGPT可以接入医院公众号、呼叫中心、企业微信、微脉APP等多应用场景。根据患者的有效交互和内容分析,为其提供文字、图片、视频等多形态的健康管理建议,覆盖诊前、诊中、诊后全流程。

东软:

面向医疗领域,东软推出了多款AI+医疗行业应用,包括添翼医疗领域大模型、飞标医学影像标注平台4.0、基于WEB的虚拟内窥镜等。这是东软凭借深厚的技术积累、海量的数据资源、丰富的行业应用场景。

深睿医疗:

Deepwise MetAI是国内首个融合计算机视觉、NLP、深度学习等人工智能前沿技术构建的智慧影像&大数据通用平台,它将影像科日常应用产生的数据结构化、形成数据资产,可以在技师、医生、科室的管理者之间自由流通、实现重建、打印、诊断、会诊、教学、科研的一站式影像数智化,为多学科专家会诊、科研的提质增效、影像科室的日常教学等方向提供创新的AI动力。

有意思的是华为,也有相关的布局。

华为:

以华为推出的盘古药物分子大模型为例。2021年4月,华为发布盘古NLP(中文语言)大模型、盘古视觉大模型、盘古科学计算大模型,同年9月,华为推出用于药物研发细分场景的大模型,盘古药物分子大模型。

据介绍,该模型是由华为云联合中国科学院上海药物研究所共同训练而成。依托华为云一站式医疗研发平台 EIHealth,盘古药物分子大模型学习了 17 亿个药物分子的化学结构。

除此之外,还有深圳市大数据研究院推出的华佗GPT、上海联通推出的Uni-talk等等入局玩家。

04医疗行业的特殊性:

安全、技术、商业、落地、政策都有现实的难题

其实怎么划分都不太重要。

长期来看,二者会走向混合模式,因为用户往往同时需要通用和垂类的特点。但短期内在具体做法上,仍然有两个选择:

一是基于第三方的通用大模型做场景化微调,基础模型与垂类场景属于弱耦合式。灵活性和通用性更好;二是从下到上做全栈式的,基础模型与垂类场景属于弱耦合式,性价比和专业性更好。

无论综合通用大模型,还是垂类通用大模型,还是垂类场景大模型,它的第一内禀属性一定是医疗,最终还是要回到现实场景来创造价值。

实打实的五个难题是不可回避的:

其一,成本难题。

大模型需要海量的数据、庞大的算力以及大量的人才,门槛属于极高的创新类别,人贵、显卡贵、训练贵、周期长。

其二,安全难题。

由于行业的特殊性,除了代码安全、数据安全、隐私保护、公平性、非歧视等基础原则外,医疗对大模型的安全敏感度极高,毕竟人命关天,这也可能导致长期无法落地。

其三,算法和技术难题。

事实上,人工智能的能力大部分都体现在算法上,针对深度学习、深度神经网络,学术界一直在探索第三代人工智能的新范式,希望能够将数据和知识有机融合在一起,发展更加安全可靠的人工智能框架。曾有人戏称:中国大模型创业的问题就是自主研发速度赶不上国外开源速度。从这一角度看,自主研发的技术难点是每一个参与者共同的问题。

其四、应用落地难题。

事实上,到目前为止,还没有一家医疗大模型进入实质公测(有一些家接近了),可见在实际场景中的应用有多难。

其五、政策难题。

其实当前已经算是一种无形鼓励了,不多赘述。

最简单的类比,参考AI在医疗中的落地应用,AI落地有多难多慢,大模型也不必过分乐观。

这最起码是一个以年为单位的周期。

05最应该笃定的反而应该是资本

难题都是留给企业家去解决的。

这个周期下,反而最应该笃定的是资本,有几个理由:

大模型是一种医疗生产力,不是生产关系,这是真正的价值内核,有别于互联网医疗的资源分配逻辑;

互联网医疗十年的储备,在资本回报上也许是不容乐观的,但恰恰是一整个年代的铺垫,团队技术数据都刚刚好,对于老股东投入略微有点残酷,但是新入局的资本,确实是个“摘果期”;

更有吸引力的是,大模型最有机会创造一个赢家通吃的马太效应,在医疗这个传统产业里,属于百年变革级的机遇;

这确实非常难以决策,要对抗很多「潜意识」和「反常识」,此刻的1亿、10亿现金,也许能撬动大到无法想象的杠杆。

说了这么多,最后只有一个寄托,大模型周期下的企业家们,能不能比互联网医疗周期的自己,再成熟那么一点点。

活下去,都还有机会,创造奇迹。

飞鲸投研从多维度分析,整理了一份《成长50》的名单,可以关注同名公众号:"飞鲸投研":feijingtouyan,进行领取(点击复制)

该文观点仅代表作者本人,飞鲸投研系信息发布平台

/阅读下一篇/

未来10年确定性最高的公司,堪称永续增长之王,正迎来最佳击球区

热门推荐