矿石收音机论坛

 找回密码
 加入会员

QQ登录

只需一步,快速开始

搜索
查看: 4276|回复: 18

如何在电脑里获得某种乐器的波形有办法吗?

[复制链接]
     
发表于 2019-3-13 16:19:10 | 显示全部楼层 |阅读模式
提示: 作者被禁止或删除 内容自动屏蔽
     
发表于 2019-3-13 18:49:17 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 1 反对 0

使用道具 举报

     
发表于 2019-3-13 17:02:05 | 显示全部楼层
你是要频域还是时域啊,时域的“波形”其实就是乐谱。
回复 支持 反对

使用道具 举报

     
发表于 2019-3-13 18:15:53 | 显示全部楼层
有复杂的配器和和声,这个就很不容易了,就是有,也是相当高级的算法了
回复 支持 反对

使用道具 举报

     
发表于 2019-3-13 18:17:23 | 显示全部楼层
基于对现实声音录制的波形文件,比如 .wav,.mp3 之类,楼主的要求很难实现,但也有做这种事情的软件,效果嘛,如果“有复杂的配器和和声”的话只能说效果很糟糕,简单的话可以。

如果是乐器演奏指令序列,比如 .mid 格式则可以,它里面记录的就是和乐器对应的乐谱。
回复 支持 反对

使用道具 举报

     
发表于 2019-3-13 19:13:17 | 显示全部楼层
想象中,估计只有用软件,能把单一乐器的频率特征分离出来。
回复 支持 反对

使用道具 举报

     
发表于 2019-3-13 19:15:03 | 显示全部楼层
人耳可以从众多声音里分辨出其中一种声音,而机器却不能
回复 支持 反对

使用道具 举报

     
 楼主| 发表于 2019-3-13 20:45:37 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

     
发表于 2019-3-13 20:54:35 | 显示全部楼层
本帖最后由 yjmwxwx 于 2019-3-13 21:46 编辑



搞这个是不是要学信号与系统,我没学过不懂。
截图_2019-03-13_20-49-21.png

SpectraLab v.4.32.17 [rutracker-1650796].torrent.zip

2.33 KB, 下载次数: 49

回复 支持 反对

使用道具 举报

     
发表于 2019-3-14 15:08:43 | 显示全部楼层
楼主对这个话题感兴趣的话,转一篇文章一起学习一下,这样思路会逐渐清晰一些。
https://mp.weixin.qq.com/s/fwbxA0ZWJPuOKolouQea3Q
回复 支持 反对

使用道具 举报

     
发表于 2019-3-14 19:05:17 来自手机 | 显示全部楼层
单独乐器分离不了。声音出来的音频是多种乐器合成一起第五波形,难。有个思路:首先a声道是要分离的,a声道有5种乐器。首先第一种乐器单独演奏这个声音,要速率完美同步。作为b声道。用a和b比较,把b频谱去掉。接着同样方法在去掉3种,总共去掉四种后,第五种就是你要分离的。
回复 支持 反对

使用道具 举报

     
发表于 2019-3-14 19:06:17 来自手机 | 显示全部楼层
特么的,不如直接演奏第五种乐器了。演奏出来的就是你需要的。呵呵呵
回复 支持 反对

使用道具 举报

     
发表于 2019-3-15 13:47:22 | 显示全部楼层
首先,用拟音软件或素材库生成对应乐器的音频,内录成文件;
然后用音频编辑分析软件打开,查看波形、频谱;
然后截图,做成JPG图片文件;
这个波形就是乐器音频的时域波形图,频谱图,轮廓图
回复 支持 反对

使用道具 举报

     
发表于 2019-3-15 14:03:55 | 显示全部楼层
jiachangchun 发表于 2019-3-13 19:15
人耳可以从众多声音里分辨出其中一种声音,而机器却不能

机器可以的,只是目前还没有很好掌握算法。
目前音源分离采用的是基于特征的提取方法,也就是根据声纹去匹配,求相关,然后按特征参数恢复,这个有点作用,但不理想,跟人没法比,即使采用了深度神经网络的自学习,学习过程也很漫长,样本跨度不足时经常出错。
人区分音源首先不是基于特征的,而是根据音源的空间能力场分布,去划分出各个音源的大概空间范围,然后对这个范围内的能谱进行特征匹配,这样正对性就很强(因为音源无论频谱和阻尼特性如何,大多具有共源的特点,就是声音是从大致相同的区域发出来的)。使用机器方法实现这个算法,核心是先要生成空间能量分布场,我们的供应商(也算是语言领域的标杆,想必大家都知道就不说了)采用多麦克风平面阵列来拾音,我很鄙视,所以这个思路就没有告诉他们了,况且我也有点私心,这个思路要留着,到时候作为心理学学位论文的题目挺好!!!
要知道视频和图像发展这么好,还得感谢中科院心理所的荆其诚老先生,把视感和视觉的模型建得那么好,还出版了《色度学》,这才有了余斯乐的《电视原理》,成为我国视频和显示领域的葵花宝典。
而音频呢,因为基础的心理学理论研究还很不成熟,所以算法上是出不来什么成果的,所以号召一下:有兴趣的,不妨先从听觉心理入手,推动类似于《色度学》这样的学科诞生!
回复 支持 反对

使用道具 举报

     
发表于 2019-4-10 13:48:23 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

小黑屋|手机版|矿石收音机 ( 蒙ICP备05000029号-1 )

蒙公网安备 15040402000005号

GMT+8, 2025-4-29 23:19

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表