谷歌推出自动识别音的扒谱软件：只要听一遍歌曲，钢琴小提琴的乐谱全有了

如题所述

推荐答案 2024-03-31

听一遍曲子，就能知道乐谱，还能马上演奏，而且还掌握“十八般乐器”，钢琴、小提琴、吉他等都不在话下。
这就不是人类音乐大师，而是
谷歌
推出的“多任务多音轨”音乐转音符模型
MT3
。
首先需要解释一下什么是多任务多音轨。
通常一首曲子是有多种乐器合奏而来，每个乐曲就是一个音轨，而多任务就是同时将不同音轨的乐谱同时还原出来。
谷歌已将该论文投给ICLR 2022。
还原多音轨乐谱
相比于自动语音识别 (ASR) ，自动音乐转录 (AMT) 的难度要大得多，因为后者既要同时转录多个乐器，还要保留精细的音高和时间信息。
多音轨的自动音乐转录数据集更是“低资源”的。现有的开源音乐转录数据集一般只包含一到几百小时的音频，相比语音数据集动辄几千上万小时的市场，算是很少了。
先前的音乐转录主要集中在特定于任务的架构上，针对每个任务的各种乐器量身定制。
因此，作者受到低资源NLP任务迁移学习的启发，证明了通用Transformer模型可以执行多任务 AMT，并显著提高了低资源乐器的性能。
作者使用单一的通用Transformer架构T5，而且是T5“小”模型，其中包含大约6000万个参数。
该模型在编码器和解码器中使用了一系列标准的Transformer自注意力“块”。为了产生输出标记序列，该模型使用贪婪自回归解码：输入一个输入序列，将预测出下一个出现概率最高的输出标记附加到该序列中，并重复该过程直到结束。
MT3使用梅尔频谱图作为输入。对于输出，作者构建了一个受MIDI规范启发的token词汇，称为“类MIDI”。
生成的乐谱通过开源软件FluidSynth渲染成音频。
此外，还要解决不同乐曲数据集不平衡和架构不同问题。
作者定义的通用输出token还允许模型同时在多个数据集的混合上进行训练，类似于用多语言翻译模型同时训练几种语言。
这种方法不仅简化了模型设计和训练，而且增加了模型可用训练数据的数量和多样性。
实际效果
在所有指标和所有数据集上，MT3始终优于基线。
训练期间的数据集混合，相比单个数据集训练有很大的性能提升，特别是对于 GuitarSet、MusicNet 和 URMP 等“低资源”数据集。
最近，谷歌团队也放出了MT3的源代码，并在Hugging Face上放出了试玩Demo。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://00.wendadaohang.com/zd/ZBnInDTZnTZTrTjeTj.html

相似回答

自动识别音的扒谱软件答：自动识别音的扒谱软件目前市面上有很多自动识别音的扒谱软件，其中比较知名的有MuseScore、Aegisub、SonicStage等。这些软件可以通过音频文件自动识别音符、和弦、节奏等信息，并将其转换为乐谱格式，方便音乐爱好者学习和演奏。其中，MuseScore是一款功能强大的音乐制作软件，支持多种乐器的演奏和多种音乐风格...

听音识谱的软件有哪些?答：有很多听音识谱的软件，以下是一些值得推荐的软件：1.乐理通：这是一款免费的音乐学习软件，可以帮助你学习乐理、视唱练耳、和声等知识。它支持多种乐器的练习，包括钢琴、吉他、小提琴等。此外，它还提供了一些听音识谱的功能，可以帮助你快速识别歌曲中的旋律和和弦。2.虫虫钢琴：这是一款专门为钢琴爱...

什么软件可以听钢琴识别音答：以听钢琴识别音的软件有很多，以下是一些常用的软件：1、PerfectPiano。PerfectPiano是一款流行的钢琴应用，它可以通过麦克风检测您弹奏的音符，并在屏幕上显示出来。该应用还提供了各种乐器，包括钢琴、小提琴、吉他、鼓等等。2、PianoPartner2。PianoPartner2是一款适用于罗兰数字钢琴的应用程序，可以用于听钢...

有没有什么软件可以教孩子识音乐谱?答：来音钢琴，会教孩子弹钢琴，里面还有乐谱，还有专门的老师教，怎么样，但是就是要花点点小费。

大家正在搜

听音乐识别简谱的软件有没有自动识别音乐的应用自动识别音的扒谱app 自动识别音乐生成乐谱识别音谱的软件听音识谱软件简谱听音扒谱的软件哪个好有谱子的音乐软件输入简谱出音乐的软件