当音乐遇上科技: 格鲁吉亚民间音乐如何助力复杂算法的发展
唯有强大的基础技术才能将大胆巧妙的构思变成现实。在本期系列报道中,我们采访了Meinard Müller的团队,他们是音乐信号分析的构建者,主要从事音频信号处理的基础研究。该团队测试信号分析和模式识别等现代技术,并使其应用到具有挑战性的音乐场景。
自 2012 年 9 月以来,语义音频信号处理(Semantic Audio Signal Processing)领域的教授兼主席Müller一直是音频实验室的一员。他的研究重点是声学信号分析和基于计算机的音乐处理方法(Music Information Retrieval – MIR),即分析音乐中的音频信号。这些信号具有特定的特征,包括旋律、音色和节奏。而该研究已经被广泛使用,例如按流派对数字音乐库进行分类或检索旋律类似的歌曲。
Müller是一位数学和计算机科学家,对跨学科研究尤为感兴趣,音乐可谓是他工作的动力和背景,但他重点关注的领域是信号处理、模式识别和算法。在多年的工作中,Müller一次又一次地发现跨学科场景,例如对著名歌剧和格鲁吉亚民歌的计算机分析,而这些研究也成为了联合国教科文组织世界文化遗产的一部分。在后者场景中,Müller和Frank Scherbaum携手格鲁吉亚民族音乐学家共同研究这些复调歌曲的音调。 “当然,这包括许多乍一看令人惊讶的项目。这些场景与标准相去甚远,因此才变得特别有趣。” Müller解释到。这些非常规案例用于研究如何将理论转化为实践并测试算法的边界。 “尽管如此,我们在这里做的是复杂的算法。”研究人员强调说,他们的研究结果常被用来从多个角度考虑问题。
对音乐的热爱与对知识的强烈渴望共同激励着Müller在学术界的不断探索与创新。早在毕业之前,他就在波恩获得了一些编程的基本知识,并在数学学科之外阅读了计算机科学。尽管他在攻读博士学位期间已经将研究重心转移到计算机科学,但他的工作一直受益于数学知识。 Müller 表示:“基础知识是日常工作中必不可少的,所以这些研究是完美的培训。”在日本庆应义塾大学做了一段时间博士后研究后,在前博士生导师的启发下,他走向了信号和音乐处理领域的研究,尤其针对数字音乐库。在波恩完成博士后学业并在马克斯普朗克计算机科学研究所结束研究职位后,他终于来到埃尔朗根国际音频实验室,目前他的团队正在研究深度学习方法。对他们来说,找出问题的原因尤为重要。深度学习通常会在大量注释良好的训练数据的支撑下产生优异的结果。但是,这通常不适用于特殊应用场景,例如格鲁吉亚圣歌。尽管如此,我们还是采用经典方法和深度学习进行研究,以开发出可靠的分析方法。在此基础上,对工作方法的结果进行比较,分析不同方法的差异,并对每种方法进行了优缺点分析。Müller表示:“我们还想了解不同流程如何相互受益。例如,数据驱动方法的灵活性通常可以很好地融入基于模型的流程中,而传统方法则可提供所需的知识。”
Müller对于培养年轻科学家的热情也有助于其在研究领域的不断发展。 “我希望让年轻人掌握基础技术,并学习方法的转移或者了解算法不可行的原因。”与此同时,他也持续地从博士生那里获得全新的动力:“工具一直在变化,现在的年轻人主要使用 Python 编程语言。就像深度学习一样,这也是我必须去学习的知识。”Müller补充道。这也是 Müller 在音频实验室和 Fraunhofer IIS 的互动中观察到的优势:他对哪些方法与行业相关有着一手见解,可以授予学生和博士候选人数学与技术的基础,并与他们一起推进研究项目的应用与实施。这对Fraunhofer来说也是有利的,因为它给了员工额外的机会来扩展他们的技能,完成博士学位并尝试新的方法。反过来,他们在音频实验室学到的基础知识和不同视角帮助他们以灵活的方式处理Fraunhofer的项目。总体而言,研究人员将音频实验室视为“连接行业与研究的桥梁”。他热衷于与同事保持交流,与他们分享自己对音频和信号处理相关话题的见解。他的优势在于基础研究和对下一代研究人员的培训,而他的同事则更多地专注于面向行业的研究,例如音频在物联网中的应用。在他看来,两者相得益彰。 Müller 表示:“作为一个团队,我们涵盖了整个行业,我们彼此信任。在这里合作变得非常高效,因为我们欣赏彼此间的差异。”
在音频实验室和 Fraunhofer IIS工作之余,Müller还致力于知识交流。 2020年至2021年,他曾担任国际音乐信息检索学会 (ISMIR) 主席,2020 年, IEEE因其在音乐信号处理领域的工作成果而授予他为 IEEE会士(IEEE最高等级会员也是授予成员的最高荣誉)。Müller总是把与专业界的交流工作的优先级排列的很高,因为在这里他总会有新的发现。
Header image: © AudioLabs; Meinard Müller, Christian Dittmar