黄民烈博士 2000 年毕业于清华大学工程物理系,2006 年获清华大学计算机科学与技术博士学位,研究方向主要集中在人工智能、自然语言处理、对话系统等领域。研究期间,黄民烈博士有超过 100 篇论文发表在国际顶级会议或期刊上,多次获得国际顶级会议最佳论文或提名奖。他先后获得了国家杰出青年项目、国家自然科学基金重点项目资助,获得中国人工智能学会吴文俊人工智能科技进步奖一等奖、汉王青年创新奖。他带领研究团队独创性地提出情感对话生成技术、情绪支持对话框架等国际领先的技术,开发了中文对话系统领域的大模型 EVA 和共情聊天机器人 Emohaa,被参考消息、新华社、英国卫报、麻省理工技术评论广泛报道。
科技赋能已成为当下精神心理行业最具话题性的创新方向之一。AI 心理机器人、数字疗法(Digital Therapeutics,即 DTx,是由软件程序驱动,以循证医学为基础的干预方案,用以治疗、管理或预防疾病)等产品频繁走进大众视野,并且获得了越来越多市场和大众认可。根据公开信息显示,截至 2020 年底,全国仅有精神科执业(助理)医师 5 万余人。此外,目前我国持证的心理咨询师全国有上百万人,然而仅有不到十万人从事心理咨询行业的专兼职工作。
成立于 2021 年 11 月的北京聆心智能科技有限公司(以下简称'聆心智能')由国内人工智能 - 自然语言对话系统领域专家、清华大学计算机科学与技术系长聘副教授黄民烈创立。自成立以来致力于将最先进的人工智能技术应用到精神健康的数字诊疗服务上,通过建立先进的 AI 数字疗法体系,为临床患者和广大心理亚健康人群提供高质量、低成本、个性化、全天候的情绪支持、心理治疗和干预方案。聆心智能已开发了心理咨询及朋辈支持服务线上平台聆心悠然、AI 数字疗法软件聆忧,可为不同需求层次的用户提供服务。
以下为关于从科研工作者到市场创新者、AI 探索破局之路及数字疗法发展的访谈内容整理:
**问:**实际上您在科研方面您已经取得了众多优秀成果,那为何现在又会选择迈向创业道路?是什么契机推动了您做出这一选择? **答:**一般来说,科研更为强调前沿性,因此很多研究成果离应用其实很遥远。我们想的是能不能将科研成果应用落地,去解决实际问题并创造价值,让科研成果真正的实现转化。
**问:**从科研工作者到市场创新者,您是如何适应这一身份转变的? **答:**在我看来,科研工作和市场创新之间的区别的确比较明显。相对来说,科研工作所面临的环境比较简单,一般来说知道问题的重要性后我们就可以开始进行研究。市场创新面临的环境则比较复杂,我们首先要做的就是要充分了解市场上同领域企业正在做的事情,解决了哪些问题。其次,我们要充分的意识到自身的优势在哪些方面。比方说在精神心理健康行业,我们的 AI 能力、技术能力优势很明显。我们团队有数十位清华大学的研究人员,专注于在 NLP 对话系统 + 精神心理上的研究十年以上,还拥有国际领先的自然语言处理技术。比如世界上最大的中文对话预训练模型是我们研发的,并且中文对话能力国际领先。同时,我们也需要了解自身作为行业后来者所存在的不足并加以解决。第三,要了解什么样的技术能够真正满足用户需求和市场需求。科研上我们可能会比较'随性',但对于市场来说,用户只会为能满足真实需求的产品买单。因此如何把我们的自然语言处理相关技术落地在最合适的场景,如何更精准地满足用户需求,是我们一直在探索和解决的问题。此外,我们也需要考虑市场变现周期。在科研活动中,10 年甚至 20 年都是有可能会面临的研发周期,但这显然很难适应市场竞争。
**问:**从市场应用的角度来看,人工智能和机器学习方法的应用场景其实非常广泛,那您为何会最终选择将其应用至精神心理健康领域? **答:**选择这个领域最大一个原因还是出于我们的社会责任感和情怀。一个企业的发展,不能把盈利作为唯一的目标,还需要看能给社会带来多少价值。最早期的时候,我们不是没有想过把技术用在其他商业化路径更明显、盈利更快速的领域。但最终出于社会责任和价值考虑,我们还是选择了精神心理健康赛道。在西安抗疫和冬奥会期间,我们的线上心理咨询服务平台'聆心悠然'也上线有公益心理援助服务。期间有上万人访问,来访者包括高校大学生、家长、青少年等群体。在反馈中我们发现,文字咨询和自助干预方案尤其受到青少年们的欢迎。如今越来越多的群体都面临着各式各样的心理问题,但受限于社会偏见、信任度低以及服务获取成本高等问题,用户实际上很难获得即时性、普惠性的专业心理健康服务。所以帮助用户更便捷地获得专业、安全的心理健康服务,正是聆心的价值和使命所在。从另外一个大的角度来看,任何一个行业要想从传统走向智能化,其势必会历经'信息化 - 数字化 - 智能化'三个阶段,然而精神心理健康行业目前在这个过程中还面临着很多的问题,有着大量可探索的方向和机遇。
**问:**近两年 AI 与精神心理健康的融合,实际上也是业内众多创新企业都在讨论的一个点,对此您是如何看待的? **答:**从整体上看,这说明了行业的新发展趋势。不过不同的团队有着不同的基因,在科技赋能的方向上也会有着各自的差异,但总体而言依旧是要基于团队对于需求和落地场景的理解。
**问:**您如何看待 AI 和深度学习中经常提到的算法偏见和黑匣子等问题? **答:**关于这些问题,学术界也有很多相关的研究工作。算法偏见,其实根源在于人类的本身的偏见。人类对于某一事物的看法会通过一定的社交网络和活动对外展示,而通过这些对外展示信息所获得的数据又会应用到训练模型中,从而产生算法偏见。为尽量避免这一问题,聆心智能所使用的数据来源不仅仅是心理咨询,还包括很多其他非心理咨询的数据来源,尽可能地确保数据能够覆盖所有人群样本和大部分群体可能遇到的议题,在进行数据标注时,我们会对所有可能的维度进行一个更精细的标注。关于黑匣子,现在很多人都会认为深度学习是黑匣子,是洪水猛兽,但实际上它是可以通过算法创新和工程创新加以解决的。比如说我们在用基于神经网络的大模型去做对话系统,相对而言我们是比较激进的,因为现在来讲这种生成式的大模型很多系统其实都不敢用。我们通过这个对话模型研发了 emohaa 对话机器人,这款机器人在用户满意度判断、风险动态评估等方面的性能都有着很明显的突破。这也使得我们的大模型可以实现落地使用,并拥有产品化的能力。同时,这也说明其实我们可以创新性地应用工具解决问题,关键是需要有着清醒的认知,并要有相应的机制去规避和控制潜在的问题。
**问:**目前聆心团队的构成情况是怎样的?又是如何在技术研发与商业现实之间平衡? **答:**我们团队实际上是一个跨专业和跨领域的交叉团队,基本上团队中有一半的成员进行 AI 技术研究,另外一半成员则是拥有心理学、医学专业背景的临床医生、心理咨询师和心理学专家等。通过团队在科技、医学、心理等领域的交叉融合,我们能够在各个方面都能进行产品的创新。同时在研发过程中,我们一直是以市场需求和用户需求为牵引,持续探索技术和算法在心理健康行业的落地。

