文 | 追问nextquestion
我们可以用三棱镜分辨光线,用音调分辨声音,但气味的世界过于复杂私密,肯定很难用技术或特征来进行区分吧?出人意料,并非如此。
玫瑰花香和樟脑气味之间相距几何?花香与烟味是否相互垂直?“气味空间”的几何形状是否符合欧几里得原理,是否遵循数学老师在无数高中黑板上写下的线条、形状和角度规则?对许多人来说,这些问题是毫无意义的无稽之谈。毕竟,几何学是一种看得见摸得着的逻辑科学;是从明确的公理中得出无可辩驳的结论。而气味却是那样模糊不清、虚无缥缈。公众普遍认为,嗅觉是一种迟钝而无形的感官,这种观点最早可追溯到柏拉图。即使作为一名嗅觉研究者,我也不得不承认,有时也会觉得自己是在研究感官系统中的冥王星——一个在诡异轨道上运行的朦胧又奇怪的冰球。
然而近年来,情况发生了巨大的变化。“气味的几何学”已成为一门新兴学科,而要理解这门学科则需要神经科学家、精通数学的理论家和人工智能专家的共同努力。虽然我们不善于通过直觉厘清大脑是如何执行辨色和识味等功能的,但机器提供了一条外在分析大脑内部功能的潜在途径,并且具备一定的严谨性。我们可以训练机器模仿人类在感知任务上的表现,并可以获取机器在此过程中使用的内部表征——即抽象空间和坐标系,其中承载着难以言喻的思想。
最近,《科学》期刊发表了一份前所未有的全面而准确的“气味地图”[1],宣告了这新的嗅觉范式的诞生。就像美国地图会告诉你布法罗离底特律比离波士顿近一些一样,气味地图也能告诉你百合花的气味更接近于葡萄而不是卷心菜。此类信息看似显而易见,但真正的神奇之处在于,所有化学物质在气味地图上的精确位置都可以计算出来。举例来说,根据对某种化学物质的客观了解,我们可以计算出它的气味与百合之间的距离比与葡萄的近13%。这就好比有这样一个公式,我们可以输入一个未知城市的人口数量和土壤成分等信息,然后它就能正确地计算出费城的精确经纬度。
▷Lee, Brian K., et al. “A principal odor map unifies diverse tasks in olfactory perception.” Science 381.6661 (2023): 999-1006.
这样的地图不仅仅是一个费尽心思、精确记录了各种相对位置和感知相似性的目录。它的功能要强大得多:它是一套用于计算气味去向的推导规则。掌握了这些规则,你就不仅能将它们应用于一小撮化学物质,还能将它们应用于整个有气味的化学物质世界。你可以知道哪里是人口最稠密的地区,哪里是气味世界的“州界”。这项科学突破令世界各地的香水师和美食家惊叹不已,也令任何对化学物质究竟会散发出什么样气味感兴趣的人为之振奋,因为此前要预测某种物质的气味是一项十分艰难且难以把控的任务。
不仅如此,它还衍生了一些耐人寻味的哲学问题:我们的鼻子究竟认为化学物质闻起来是什么样的,以及测量它们的相似性意味着什么。换句话说,当我们的鼻子判断出百合和葡萄的气味相似时,对世界形成了什么样的“映射”?我们的鼻子是在捕捉某种单一的分子特性,比如化学物质的重量或大小吗?它们是在计算各种分子特性的共同特征吗?又或是在做一些与上述完全不同的事情,比如在常见的新陈代谢反应空间中定位分子?
有趣的是,最后一种情况似乎更能说明问题。我们的大脑用来衡量、组织和比较气味的感知标尺,最终可能与化学家从样本中发现的东西关系不大,而与我们与这个世界的深层关系连接地更紧密。我们的鼻子测量的可能并不是世界固定不变的属性,而是其不断演化的世俗过程。
感官“几何化”
为了破解这一最原始、在科学上最难解的“远古感官”,我们不得不等待机器智能的出现,这种想法颇具诗意。这与其他感官模式形成了鲜明对比。早在17世纪,人类就已经开始通过棱镜和音叉等奇妙手段揭开了视觉与听觉的神秘面纱。
将感官“几何化”的基本研究模板是艾萨克·牛顿在17年代末开发的。牛顿在剑桥大学进行了他标志性的光学实验,从而发现了光的颜色与折射率(即光被棱镜弯曲的程度)之间的关系。仅仅是这项客观事实本身就足以跻身史上最重要的科学发现之列,但牛顿进一步将他的观察结果与几何模型相结合,将可见光谱中的七种原色沿圆周排列(见下图),绘制出了第一张“色度图”——也就是我们用来研究颜色相加混合的色轮的前身。
对牛顿来说,这个圆圈并不只是徒有其表,而是对一种编码色彩属性的特殊方式的承诺。牛顿号召研究者们拿出量角器和直尺,计算色彩之间的关系,并将这些色彩混合起来。例如,完全饱和的红、黄、绿三原色混合色的组分可以用三角形的三个顶点来表示,每个顶点都固定在圆周上适当标记的点上。这个三角形的质心是圆内部的一个单一点,它决定了混合色的色调和饱和度。如果将七种原色全部按相同饱和度进行混合,则七点图形的质心将精确落于牛顿指定为白色的圆心处。
▷图1:艾萨克·牛顿的绘制的圆形色度图。图片来自维基百科。
当然,牛顿在他的《光学》(Opticks,1704 年)一书中描述的色彩视觉并非尽善尽美,甚至与他同时代的人也注意到了他的模型中存在的缺陷和不足。尽管如此,他的成就体现了利用传统范式视觉化呈现感官映射的雄心壮志。他寻求建立自然界可测量的内在属性(如光的折射率,我们现在将其归结为波长)与大脑的现象学特质(如颜色、音高和气味)之间的数学对应关系。这种追求有点像毕达哥拉斯的“世界即数学”的神秘主义思想。
人类以同样的方式破解了音高知觉的基本逻辑。我们利用音叉和球形“共鸣器”等简单工具来产生单一频率的纯音,并从中推导出辅音音高组合的规则。音高知觉整体而言非常复杂,但概括地说,我们的整个听觉系统,从内耳微小卷曲的耳蜗到感觉皮层的听觉部分,都建立在像钢琴琴键一样组织低、中、高音的基本原理之上。敲击钢琴上相邻的音符也会对应地在大脑中激活相邻的神经元。
追寻原气味
嗅觉永远不可能用音叉这样的基本工具来解析,该领域也从未出现像牛顿这样的人物,但并不是因为没有人尝试追随牛顿的步伐,成为一名嗅觉领域的几何学家。相反,有许多人都想到可能存在少量的“原气味(odour primaries)”,它们就好像棱镜折射出的七原色一样,构建了气味世界。这种想法一直持续到了20世纪。
著名的植物学家和分类学家卡尔·林奈(Carl Linnaeus)于1756年提出了一个早期的、颇具影响力的气味分类方案,他将气味分为了七种类型:芳香味(aromatic)、芬芳味(fragrant)、麝香味(ambrosial/musky)、葱蒜味(alliaceous/garlic)、山羊似的腥臊味(hircine/goaty)、令人厌恶的气味(repulsive)和令人作呕的气味(nauseous)。
与林奈同时代的阿尔布雷希特·冯·哈勒(Albrecht von Haller)在形容词的使用上更为吝啬,他提出了一个更为严谨的方案,即三种基本气味类型:甜香味/麝香味(sweet/ambrosiac)、恶臭味(stench)和中间气味(intermediate)。人们会觉得“中间气味”扮演了很重要的角色,但也许哈勒提出这种分类是基于一个深信不疑的观念,即所有气味都可以被归类到一条线上,其组织围绕单一轴展开。如果这些早期的气味分类法听起来有一种东拼西凑的感觉,那是因为它们是人类自省的结果,而并非基于仔细的数据收集和测量。这种归类基本上都是靠直觉。
▷图2.亚伯拉罕.米尼翁(Abraham Mignon)绘制的石台上的腐烂水果和坚果静物图。图源:英国剑桥菲茨威廉博物馆
不过平心而论,当时(现在也是)很难做到完全不依靠直觉。恕我直言,牛顿虽然是历史上一位不可多得的天才,但他的发明很简单。他可以通过在狭小的阳光缝隙中旋转几块磨光玻璃,随心所欲地创造出任何可见的颜色。当太阳升起时,光线刺激就会不请自来,而且其形式几乎是现成可供科学检验的。而同样的范式就没那么适用于气味了。如果牛顿想研究气味,他得先获取一些植物,或是一些变质的食物、一块面包,如果他足够大胆,还可以从自己的夜壶里采集样本。这些做法不太符合牛顿的研究习惯。作为嗅觉的基本属性标志,此类研究距离“化合物”这一关键的抽象概念相距甚远,合成用于实验的纯化学物质的技术也仍然遥不可及。
但是,即使这些科研上的阻碍可以奇迹般地得到解决,还有更多更深层次的复杂因素使得嗅觉问题比颜色问题更为棘手。归根结底,化学物质并不像光那样,是单一基本现象的流畅延续性分级变化。相反,它们是世界上微粒物质的集合。世界上存在着大量的微粒物质和微粒种类,因此很难用某种单一的化学特性来捕捉变幻莫测的化学世界中所有有意义的变体,类似光折射率的分子特性。如果有一张包含化学特征和气味特质的地图,那么它一定比色轮更复杂,它需要更多空间或者说维度来排列化学物质的分布。
气味棱镜
也许类似三棱镜的工具可以帮助我们绘制出这样一张地图?从几何隐喻的角度来说,它似乎比色轮的优点更多,而且方向正确。棱镜在不同的平面上有不同的面和切面,可以根据原子类型或化学组等不同的标准来组织分子。棱镜的尖角可用来代表化学空间中聚集和分离的区域,相较光线的延续性,它强调了气味分类的离散性*。
译者注:这段话的意思是,气味的分类可以通过棱镜的尖角这种几何形状的象征来更好地理解和划分。每个尖角代表一个特定的气味类别,这些类别在化学成分上有明显的区分,类似于如何在几何形状中通过顶点和边界来区分不同的面。
而对德国嗅觉学者汉斯·亨宁(Hans Henning)来说,这不仅仅是一个隐喻。在他的著作《嗅觉》(Der Geruch,1916年)中,他提出了一个抽象的气味棱镜概念,用来组织气味世界,其六个棱尖分别对应他认为的嗅觉“原味”:花香味(flowery)、果香味(fruity)、树脂味(resinous)、辛辣味(spicy)、焦味(burnt)和臭味(foul)。尽管在量化人类如何感知气味以及气味刺激的物理描述方面已经取得了长足的发展,但该领域还没有准备好接受亨宁提出的概念。用美国神经生物学家戈登·谢泼德(Gordon Shepherd)话来说,他是那种“无法抗拒将不够严谨的理论拼凑起来”的科学家。
更为雪上加霜的是,亨宁在大力宣传自己的研究成果时,还抨击了荷兰科学家亨德里克·茨瓦德梅克(Hendrik Zwaardemaker)等该领域有影响力的代表人物,而茨瓦德梅克是使用嗅觉计的先驱——这是一种由阀门和管道组成的蒸汽朋克式仪器,可以输送可控剂量的气味。一位早期的评论家对亨宁的书给予了非常积极的评价,但他也同样称之为一个“冷酷无情,甚至是粗野无礼的离经叛道者”。亨宁十分强势地在有关气味的讨论中引入了一种高度几何化的概念,尽管这种概念很有启发性和影响力,但却经不起琢磨。
▷图3.汉斯·亨宁的气味棱镜:臭味(faulig);果香味(fruchtig);花香味(blumig);焦味(brenzlich);花香味(würzig);树脂味(harzig)。图源:论文。
值得称道的是,尽管亨宁的理论摇摇欲坠,但它足够具体,可以进行实验验证,包括心理学家马尔科姆·麦克唐纳(Malcolm Macdonald)在内的研究者都进行了实践。麦克唐纳于1922年发表了一篇全面而尖锐的批评文章[2],以题为“亨宁理论的逻辑和事实不足”的长篇章节结尾。为了验证在气味世界中是否真的存在亨宁所说的棱镜,他利用气味相对相似度来代表距离(“气味相似”=“距离接近”),进行了关键的感知事实验证,比如探讨来自棱镜长对角线两端的化学物质是否气味相似度最低。当你说气味是一个棱镜时,你就要做好同行会拿出计算器来核查的准备。
那么,亨宁究竟错在何处呢?这个问题有点调侃的意味,因为我们都不清楚他到底做对了什么。不过,如果对亨宁宽容一点,我们可以说他是被有机化学家当时正在探索的乐高式分子观所迷惑了。当时的有机化学家将分子组合视为一个模块化系统,其中的有机分子由一个小型的所谓官能团库组合而成,从而形成了以固定方式排列的原子序列。除了让世界各地满怀憧憬的医学预科生魂牵梦绕之外,这些官能团还被认为赋予了分子特殊属性,并定义了分子的基本反应。
在亨宁看来,同样的官能团也应该催生了他提出的“原气味”,这是完全合理的。确实,将化学家的有机分子表原封不动地挪用到气味领域是个颇具吸引力的研究方向。然而,大自然却没有应声附和这种观点。虽然很少有嗅觉神经科学家会说,官能团对决定气味的特质来说毫不重要,但气味的特质显然不是仅由官能团决定的。
用现代机器学习的术语来说,我们可以说亨宁没有足够丰富的特征集来表征气味。在采用官能团作为基本气味元素时,他其实对分子的本质形成了既定的观点,同时放弃了其他可能对气味预测有用的特征。毕竟,分子不仅仅是像乐高积木那样搭建而成的。它像是一个会旋转和振动的小弹簧,化学家可以不断刺激它,让它做出反应,从而分析其结构;它也包含一系列描述性属性,如“强酸性”或“非极性”(具有对称分布的电荷)。同时,它还像是一个由许多元素组成的块状物,也许一部分更粗壮些,而别的部分则更细长一些。
气味地图
与其像亨宁那样预先抓住一个特征,最好的办法显然是采用不可知论的思维方式,让数据说话。与其天马行空地猜测是哪些化学特征决定了气味的特质,为什么不从大量可信的特征中进行筛选呢?
这是美国学者苏珊·希夫曼(Susan Schiffman)等人在20世纪70年代和80年代开创的研究方法[3]。研究的基本思路是将一组几十种气味分子绘制成地图,总结它们在感知上的相对相似性。这像人们可以根据城市间距的表格绘制出一张粗略的美国地图一样,这些“气味地图”让我们对人类的鼻子是如何组织化学分子的世界有了整体认知。
有了这个感知地图,接下来要解决的是一个化学问题:是什么让分子被分配到了这个地图的某个特定位置?为了弄清这个问题,希夫曼等人使用了一系列“降维(dimensionality reduction)”技术,以研究在数百种可能存在的化学特征中,哪些能最有效地再现感知地图。此类研究方法一度引起了人们的极大兴趣,但它们也无法实际解决这个化学问题,所以沉寂了几十年,直到人工智能时代的到来。
2017年,数据集终于民主化到足以让机器学习帮助科学家扩大搜索范围。这一年的一个重要里程碑是“DREAM”挑战赛[4],当时的比赛主题是利用人工智能破解气味地图。获胜模型相关论文发表在了《科学》期刊上[5],得到了该领域的普遍认可,被认为是潜在的研究突破口——这表明,利用机器生成的模型进行科研是明智之举。
这其中最优秀的模型叫做“随机森林”(random forests)。该模型利用人工智能技术汇总了大量模型。它可能生成执行预测任务的结构复杂且难以捉摸的规则系统。它们可以得到正确的答案,但往往是通过寻找冗长而复杂的规则来实现的,例如:如果分子量大于X,碳原子数大于Y,莫罗·布罗托自相关性(Moreau-Broto autocorrelation)的7阶滞后小于Z,……,然后经过其他计算,最终得出结论该分子将闻起来像玫瑰。
▷图4.随机森林示意图。图源:lizhen
当然,气味分类也有可能是通过大脑中类似的粗略计算来实现的,但人们不禁要问:大自然真的是这样解决问题的吗?不是基于奥卡姆剃刀的简单性原则,而是在于其复杂性?其深层原理是什么?是基本的组织轴?还是几何洞察力?关于这类“数据驱动”模型的一个重要且经常被问及的问题是,它们在预测方面的能力是否表明它们具备真正的理解能力,或者至少表明了它们具备科学历来推崇的“牛顿和棱镜”式的发现所带来的理解能力。
未来的研究方向之一是放弃认为气味空间是组织性结构的想法,它有棱有角,可以帮助我们追溯一些尚未被发现的化学属性。毕竟,如果“臭脚”和“美味奶酪”可以成为对同一物理对象的两种有效描述,那么气味的特质也许就太不稳定、太个性化了,无法真正成为预测的目标。也许它们更多反映的是我们从纷乱的世界中学到的东西,而不是世界的本质,它们仅是编码了我们对脚和奶酪的独特体验和偏好。也许,在大规模数字化时代已发展了几十年的今天,这种感官体验仍然像幽灵一样留存世间,飘忽不定,无法测量,从根本上说也无法用几何概念来捕捉,甚至有某种浪漫的、值得捍卫的理念存在。
利用Osmo模型探索气味空间
或者我们反其道而行之,用更多的数据和更强的计算能力来解决问题。位于马萨诸塞州剑桥市的初创公司Osmo便决定采取这种方法来搏一搏。该公司于几年前成立,脱胎自谷歌大脑(Google Brain)的数字嗅觉小组,现在有几十名员工,包括神经科学家、化学家和计算机科学家。
Osmo是亚历克斯·威尔奇科(Alex Wiltschko)的心血结晶,他是一位毕业于哈佛大学的神经生物学家,在研究生阶段就开发了用于分析动物行为的开创性计算机视觉系统。他在德克萨斯州的小镇长大,他曾这样调侃自己的故乡:“电脑和香水在那儿都不流行”。但他对香气和算法的热情最终让他成为了一家旨在“让电脑拥有嗅觉”的公司的掌舵人。
这与牛顿独自研究感官、用羽毛笔在牛皮纸上勾勒模型的做法相去甚远。相反,这些科学家正在合作开发信息量密集的代码库,用以训练和调整百万参数模型。这些模型在“这个闻起来像玫瑰,那个闻起来像青草,请分析其背后的原因”等指令下,摄入一个又一个数字化分子。这些化学物质并不是作为预先确定的分子特性列表提供给模型的,而是以骨架式的精简图形被喂给了模型,这些图形只包含有关原子特性及其连接性的基本信息。该模型并不是要找出已知化学物质的哪些方面对嗅觉很重要,而是试图发现我们尚未想到的化学原理是否可能是解决嗅觉问题的关键。
Osmo模型是一种图形化“深层网络”,其灵感来源于大脑感官系统的连续处理阶段。这种类比并不精确,但它类似于你的大脑如何从世界中捕捉原始信息,并将其传递给下游单元,这些单元最终会基于输入信息做出有用或可操作的输出,比如“这是一只猫!”或“真难闻!”。输出单元是执行者和决定者,它们的表现可以被评估(“不,这其实是一只狗”或“是的,这种化学物质闻起来确实很糟糕”),但许多重要的见解也可以在中间层或“隐藏”网络层中找到。这些层级可以被视为一个转换空间,它将原始的感官输入挤压变形成感官判断。人工智能系统会根据对人类判断的模仿程度不断迭代和自我调整,从而逐步学习定义这些转换单元之间的连接。通过深入探究这些中间层,我们对嗅觉的研究就仿佛当年的牛顿得到了人工智能的助力一般。它们能告诉我们如何看待化学物质所处的空间,或者说,我们鼻子所能嗅探到的化学空间。
那么,我们如何从Osmo模型内部的转换中获得实际的几何图形呢?气味的几何图形不是圆圈、棱镜或任何一种简单的传统形状。相反,它更像是一个由崎岖的化学大陆组成的世界,每块大陆都划分出人类生态的一个显著方面,每块大陆似乎都会引发一系列的行动或欲望,比如,这个世界有“发酵”大陆,“绿色”大陆,还有“美味可口”大陆。核心概念是,在这个空间中,两种化学物质被描述为距离相近和气味相似,并不是因为它们必然具有相同的内在结构特征,而是因为它们具有相同的生态作用,在大自然中具有密切又偶然的关系。
▷图5.在这张主要气味地图(POM)中,50万种以前未被描述的可能气味物质的颜色对应于它们预测的气味标签。图源:osmo.a
牛顿色彩空间的故事讲述的是人类的感知如何捕捉世界普遍和非个人的属性(比如光的波长和折射度)。但是,嗅觉的发展故事是关于我们的鼻子是如何解码世界的故事,因为它在我们的星球上表现出局部性、关系性和特异性。换句话说,气味空间是以人为中心的坐标框架,反映了我们作为觅食者和狩猎者在这个盛衰相代、物质荣枯交替的世界中不断演化的历史。它是一个几何体系,赋予了物质于我们而言的意义和可能性。
气味空间不仅仅是一个充满诗意的空间。利用 Osmo模型,我们可以计算出各个大陆之间的距离和角度,预测哪种化学物质的气味会恰好介于麝香和香芹酮之间,研究化学物质的集合在气味感知空间中会形成一条平滑或是蜿蜒的道路。此外,Osmo模型在这方面的表现明显优于其他研究方法,这表明它测量化学物质之间距离的方式可能触及气味处理的深层原理。
有趣的是,气味地图上计算出的距离与所谓的“新陈代谢距离”密切相关,即通过共同的新陈代谢途径,一种化学物质到另外一种化学物质之间有多远。比如说,如果自然界可以通过少量发酵反应轻松地将化学物质A转化为化学物质B,那么即使A和B在结构上没有明显的相似之处,你的鼻子也有可能会闻到相似的气味。一个重要的推论是,具有显著结构相似性的分子不一定会散发出相同的气味(当然,它们通常气味相似)。假设A和B可能只有一个双键不同,但如果这个双键的形成或断裂非常复杂,需要大量的合成步骤和化学反应,那么我们闻到的化合物气味自然就会不同。鼻子所了解的似乎不是静态的化学世界,而是大自然在其中的动态变化。
▷图6.Osmo气味图的抽象渲染显示了分子间的嗅觉关系。图源:osmo
哲学家会说,鼻子似乎是一个经验主义者,因为它必须基于通过客观演化或主观经历从世界中获得的化学关系才能对化学物质进行分类和归类。数学家会接着说,我们所学习到的是抽象的、高维的流形,它能够追踪世间各种化学关系,它会分化为穿梭于世界碳元素之间的分支、循环和路径。嗅到某种东西的气味,就是在确定它在这个流形上的位置,了解它所处的环境。
现在对气味空间结构的理论研究还为时尚早,但一些研究者已经提出了这样的观点:气味空间是非欧几里得空间[6-7],这意味着它与我们在中学时代所学的三角形的角度相加总是180度的“直观”几何相去甚远。相反,气味空间可能具有内在曲率(据一位理论家所言,就像薯片一样),这是因为气味空间中的距离定义不像两个人之间的物理距离,而更像他们之间的社交距离。
令人惊讶的是,上文提到的曾批评过亨宁理论的麦克唐纳早在1922年就已经提出过类似的观点。当时,他建议对气味棱镜进行修改,将其替换为“以实心四面体为边的空心超固体”。尽管我们很难想象出这个超固体到底是什么样的,但它本质其实就是一个更高维的棱镜,为气味提供了更多的分布空间。他指出:“没有理由说精神连续性必须受到欧几里得定理的限制。”也许嗅觉是最后的感官之谜,而其数学原理与证明也是最为艰深晦涩的。
参考文献:
[1] https://www.science.org/doi/10.1126/science.ade4401
[2] https://psycnet.apa.org/record/1926-06207-001
[3] https://www.science.org/doi/10.1126/science.185.4146.112
[4] https://dream-olfaction.github.io/
[5] https://www.science.org/doi/full/10.1126/science.aal2014
[6] https://www.science.org/doi/10.1126/sciadv.aaq1458
[7] https://www.frontiersin.org/articles/10.3389/fnsys.2011.00065/full