2024-10-18 12:53

那吠叫是什么意思?

我对我的狗说的第一句话是:“你想和我一起回家吗?”他重6磅,10周大。他探出头来,嗅了嗅我的嘴。

从那以后的四年里,我不断地向他提出一些他无法回答的问题。我问他在忙什么,是否想出去散步,是否觉得困。当他生病时,我问他怎么了;当另一只狗朝它咆哮时,我把它拉到一边,问它是否还好。它尽其所能把自己的想法传递给我:它吠叫;他叹了口气;他抓门。

当然,我们从来没有说过话,真的没有。大约15000年前,人类首次驯养了狼,科学家们已经了解到不同的吠叫意味着不同的事情——例如,狗对陌生人使用更低、更长的吠叫——但我们对狗的交流的理解仍然相当有限。(研究人员谨慎地称其为交流,而不是语言,因为没有任何动物被证明拥有与人类一样复杂的语言系统。)

虽然松鼠的吠叫很容易理解(我要吃了你!),但人类很难知道它的呜咽是一只狗在周二随机产生的感觉,还是更严重的事情。养狗的人经常开玩笑说,他们愿意放弃多年的生活,只为了有机会和他们的宠物说话一个小时或一天。与此同时,一些小贩假扮成狗语者和宠物通灵者,声称能够帮助他们翻译狗狗的内心想法,很高兴地收了钱。

现在,在人们对人工智能应用产生更广泛兴趣的浪潮中,一些狗研究人员希望人工智能可以提供答案。理论上,这项技术非常适合这样的目的。人工智能的核心是模式识别机器。ChatGPT能够用看似人类的语言做出回应,因为它已经接受了大量写作数据集的训练,然后在回应中模仿这些数据集。类似的前提也适用于其他生成型人工智能程序;大型语言模型识别它们所提供的数据中的模式,映射它们之间的关系,并相应地产生输出。

研究人员在狗身上也采用了同样的理论。他们将狗的音频或视频提供给模特,并附上狗正在做什么的文字描述。然后,他们看看这个模型是否能识别出动物观察到的行为和它们发出的声音之间的统计模式。实际上,它们是在试图“翻译”狗叫。

至少从2006年开始,研究人员就使用了类似的方法来研究狗的交流,但人工智能最近在处理大量数据方面做得更好。然而,不要指望很快就能和菲多边喝咖啡边讨论伊曼努尔·康德的哲学。现在还处于早期阶段,研究人员不知道人工智能会带来什么样的突破——如果有的话。杜克大学(Duke University)的狗认知专家瓦妮莎·伍兹(Vanessa Woods)告诉我:“它有巨大的潜力——但潜力和现实之间的差距还没有完全显现出来。”

现在,研究人员有一个大问题:数据。现代聊天机器人是在海量文本(数万亿字)的基础上进行训练的,这给了它们语言流利的错觉。为了创建一个能够将狗叫声翻译成英语的模型(如果可能的话),研究人员将需要数百万甚至数十亿个整齐编目的片段。这些叫声需要根据年龄,品种和情况进行彻底的标记-将一只10岁的雄性拉布拉多犬与一只6周大的比雄卷毛小狗与它的同伴玩耍分开。

目前不存在这样的目录。这是这个项目最大的讽刺之一:狗就在我们身边,不断被电话、门铃摄像头和闭路电视捕捉到。你不需要看《地球脉动》就能看到生活在自然栖息地的狗;互联网上关于狗的视频比任何人一辈子看的都多。然而,所有这些媒体从未以严肃的方式进行过分类,至少没有达到我们更好地理解它们的叫声所必需的规模。

也许现存的最好的目录是来自墨西哥的研究人员,他们系统地记录了狗在特定情况下在家里的情况,让它们吠叫,比如敲门或吱吱叫最喜欢的玩具。密歇根大学(University of Michigan)的一个研究小组从数据集中的2万段录音中提取了一部分,并将其输入一个训练有素的模型,以识别人类语言。他们给模型播放狗叫,然后让它根据声音预测它们在叫什么。该模型可以以60%的准确率预测吠叫之前的情况。这离完美还差得远,但仍然比运气好,特别是考虑到该模型有十多个树皮上下文可供选择。

使用人工智能来破译狗叫声的同样方法也发生在其他动物身上。也许最有希望的工作是鲸鱼的喋喋不休,正如我的同事罗斯·安德森所写的那样。其他研究人员正在研究猪、蝙蝠、黑猩猩和海豚。一家基金会提供高达1000万美元的奖金,奖励任何能够“破解密码”,并使用生成式人工智能与动物进行双向对话的人。

狗可能不会是帮助科学家赢得诺贝尔奖的动物。“我认为他们不一定会使用单词、句子和段落,”密歇根大学研究报告的合著者拉达·米哈尔恰(Rada Mihalcea)通过Zoom告诉我。(很自然地,在我们通话的过程中,一个陌生人敲了我的门,我养的狗叫了起来。)虽然像我这样的狗主人可能希望为狗狗提供类似谷歌翻译的服务,但Mihalcea的野心要小得多。她希望这一系列的研究可以“帮助我们理解语言系统是什么——如果有这样一个系统的话。”

德克萨斯大学阿灵顿分校的Kenny Zhu领导的另一个研究小组采用了不同的方法。他的团队正在从YouTube上抓取大量的狗视频。但这些数据确实非常嘈杂。研究人员必须将狗叫与视频背景中的所有其他声音隔离开来,这使得研究过程非常繁重。朱的团队确实有初步的发现:他们用算法处理了六个不同品种(哈士奇、西巴犬、比特犬、德国牧羊犬、拉布拉多犬和吉娃娃)的声音,并相信他们已经发现了105个独特的音素,或声音单位,涵盖了所有品种。

即使研究人员最终能够得到一个完美的数据集,他们也会遇到另一个问题:没有办法确定人工智能的观察结果是正确的。当用人类语言训练其他人工智能模型时,母语使用者可以验证输出是否正确,并帮助微调模型。没有狗能够验证人工智能的结果。(想象一下,一只狗坐在学术研究实验室里,严肃地点头:对,没错。“Ruff-ruff-ruff”的意思是“给我鸡。”)把人工智能作为人类和狗之间的中介的梦想面临着一个根本性的偏见:是人类研究人员在使用人造的人工智能模型和人类的语言观念来更好地理解狗。无论技术有多好,总会有未知数。

专注于更好地理解狗的语言噪音可能会掩盖我们对它们的了解。狗已经进化到能够更好地与人类交流:它们的叫声变了,它们的眼睛变得更具表现力。野狗和狼比宠物吠得少,这表明人类是我们的小狗发出噪音的一个重要原因。伍兹对我说:“狗的天才之处在于,它们可以不用说话就和我们交流。”“我们也能很清楚地读懂它们,这就是为什么我们如此喜欢它们。”

我明白她的意思。在今年夏天的热浪中,我决定买一双耐热的狗靴,以保护我的小狗免受灼热的人行道的伤害。你把它们套在狗的爪子上,然后把它们扣到位。我第一次给我的狗戴上眼镜时,它盯着我看。那周晚些时候,当我试着穿着它们遛它时,它在草地上乱窜乱窜。他不想穿靴子。我不需要人工智能来知道这些。