根据最新的研究,想要了解自己的狗的人可能会得到人工智能的帮助.
密歇根大学的研究人员正在开发一种工具,可以识别狗的叫声是否传达了顽皮或攻击性,这对许多REG读者来说应该已经很明显了.
同时,他们希望从动物的发声中理解其他信息,如动物的年龄、品种和性别.
与墨西哥国家天体物理研究所、光学和电子研究所合作,密歇根大学的团队发现,最初针对人类语音训练的人工智能模型可以作为训练针对动物交流的新系统的起点.
研究结果在计算语言学、语言资源和评估国际联合会议上公布.
计算机科学与工程学院教授拉达·米哈尔查和贾尼斯·M·詹金斯表示:“通过使用最初针对人类语音训练的语音处理模型,我们的研究打开了一扇新的窗口,让我们能够利用迄今在语音处理方面建立的知识来开始理解狗叫的细微差别.
”开展这项工作的密歇根大学人工智能实验室主任说:“关于与我们共享这个世界的动物,我们还知道很多事情.
人工智能的进步可以用来彻底改变我们对动物交流的理解,我们的发现表明,我们可能不必从头开始.
但尽管人类语言人工智能模型是在巨大的书面文本语料库上训练的,但狗不太擅长打字,它们的声音被记录下来的频率也低于人类.
为了克服这个问题,研究人员正在重新调整现有模型的用途,该模型最初是为分析人类语音而设计的.
各种语音技术的基础已经被训练来识别人类语音的重要特征,如语调、音调和口音.
研究人员利用人类语音模型Wav2Vec2建立了一个数据集,记录了74只不同品种、年龄和性别的狗在不同环境中的发声.
他们发现,Wav2Vec2模型比其他专门针对狗叫声数据训练的模型有所改进,准确率高达70%,并成功地完成了四项分类任务.
你会问,狗叫声数据是如何收集的?研究人员记录了几种情况下的狗叫声:玩耍、攻击性等.
然后他们测试了模型识别狗叫声的能力:对陌生人非常咄咄逼人的叫声.
对陌生人的正常叫声.
消极的尖叫声.
消极的咕噜声(在陌生人面前).
所以研究人员知道哪种是哪种是哪种,因为他们已经知道了这种叫声的背景.
Mihalcea说:“这是第一次建立针对人类语音进行优化的技术来帮助解码动物交流.
我们的结果表明,从人类语音中获得的声音和模式可以作为分析和理解其他声音的声学模式的基础,比如动物发声.”®.