Page 1 of 1

AI音频挑战:基于专家示例的78rpm唱片音频修复

Posted: Sat Jul 05, 2025 6:55 am
by shukla7789
希望我们能拥有一个数据集,让人工智能研究人员能够做一些真正有用且有趣的事情——如何去除数字化 78rpm 唱片中的噪音。

互联网档案馆 (Internet Archive) 拥有1600 个高质量的 78rpm 唱片人工修复样本,这些样本使用了最优秀的工具对音频文件进行了“轻微修复”。这种方法可以去除唱片表面的粗糙噪音,同时尽量不影响音乐或语音的品质。这些文件中包含的文件是之前使用的未经修复的原版唱片。

但互联网档案馆有超过400,000 个未恢复的文件,这些文件相当粗糙且难以收听。

我们的目标是,或者更确切地说,我们希望能够开发一个程序,将全部或大部分未修复的 40 万份记录进行优化。这项工作的难度尚不清楚,但希望这是一个有趣的项目。

很多录音都很棒,值得一听。如果你有兴趣深入了解,请在这篇文章下留言。

发布于新闻| 标签:人工智能与研究| 12 条回复
文章导航← 2023 年国家图书馆周:查尔斯,元数据2023 年全国图书馆周:Liz,捐赠→
关于“ AI 音频挑战:基于专家示 海外数据 例的 78rpm 唱片音频修复” 的 12 条思考

达斯汀·维特曼
2023年4月24日下午7:46
这个项目目前的形式听起来不太适合用人工智能,原因有很多——咔嗒声和噪音消除并非一刀切,每个录音都需要根据自身情况进行处理。即使是最好的咔嗒声消除算法,仍然会把响亮的铜管音符误认为咔嗒声,因为它们与频谱图上的咔嗒声非常相似。任何超过适度咔嗒声清理的操作都会不可避免地破坏音乐,除非对其进行严密监控并分成可控的片段进行。使用当前的算法和某种形式的批处理会更好。你或许更适合购买一台或多台带有服务器包的 CEDAR Cambridge 计算机,并对档案进行批处理。使用稍微保守的设置会比大多数“清理”后的示例效果好得多。坦率地说,其中大多数都不是很好的范例。

虽然批量处理可能很好,但让一位经验丰富的工程师单独处理所有工作总是更好得多。没有捷径。