用户
 找回密码
 立即注册
搜索

鲍勃谈话:MQA的创建者鲍勃·斯图亚特详细介绍了这项革命性的英国技术,该技术为数字音频的捕获、交付和复制树立了...

[复制链接]
发表于 2021-5-5 21:23:28
本帖最后由 HIFI践行者 于 2021-5-5 21:28 编辑 & s  Y7 f6 \8 t0 x; H% f" b* S# q% [
8 x$ T. C! O3 N& u) d7 C6 C- t
什么是MQA?介绍
MQA 是一种用于录制、存档、存档恢复和高效分发高质量音频的分层方法和规范集。它由长期合作者鲍勃·斯图亚特和彼得·克雷文设计,由MQA有限公司开发。
一个公理是,在音频中,高分辨率可以在模拟域中更准确地定义时间精细结构和缺乏调制噪声,而不是通过数字域中的描述,特别是如果该描述依赖于样本速率或位深度数字。
另一个观察是,由于没有回到第一原则,最近寻求数字音频更高分辨率的趋势涉及一种非结构化和有点不科学的方法:"稀释"而不是解决问题;导致数据速率过快增长,导致最终用户缺乏便利性。
MQA的一个假设是,通过将音乐信号的统计与现代采样理论和人类神经科学见解的方法相结合,我们可以更有效地将模拟音乐转换为数字音乐,并回到模拟音乐。
一个关键的实现点是如何使这些见解与当前设备相关,以便在现有设备上享受分配文件,同时不接受在处理或网关(A/D 和 D/A) 或将来创新方面可能克服关键问题的妥协。
因为它有不同的概念参照系,MQA 是一种哲学,而不是"只是一个编译器"。
背景
现在人们普遍认为,"Hi-res"数字音频具有更高的采样率或位深度,可提高音质。但是,这样做对编码效率的成本很大。24 位/88.2 kHz 记录需要 16 位/44.1 kHz 替代数据速率的三倍,并且该比率进一步增加两个因素,因为采样率再次翻倍至 176.4 kHz,然后达到 352.8 kHz,即 DXD 的采样速率。虽然声音质量的逐步提高是值得欢迎的,但它对数据速率和存储容量造成了不成比例的损害。仅仅提高抽样率也不能正面解释为什么44.1 kHz和48 kHz的抽样率会施加主观限制。相反,采样率已成为分辨率的代名值。
最近的听力研究支持了长期以来的观点,即反别名和重建过滤器(尤其是陡峭的数字线相滤波器)的时域性能是导致音质明显下降的原因。最近,数字音频中使用的低通滤镜的可听性直接证据已经公布。
至少自1946年以来,人们就知道,传统信号分析中固有的傅立更长时间频率不确定性可以被人类听众"击败",而且有相当大的差距。事实上,最近的实验研究表明,时间歧视至少高出5倍。
这些发现符合这样一种观点,即人类听觉能力是由进化要求决定的,特别是需要在尽可能短的时间内将声音识别为"潜在威胁"或"无威胁",从而提供最大的战斗或逃跑机会。当然,虽然视觉也参与其中,但我们无法看穿360度、拐角处或像某些掠食者一样低的光照水平。
特别是在这些情况下,我们的听力是我们检测危险的主要意义,检测速度和快速估计方向和范围至关重要。直接声音与短延迟或紧密间隔反射分离的能力也是如此,这自然需要解决与源的频率或带宽无关的短时间间隔。
我们对自然声景、混响、动物发声和语音的理解需要可调的时间/频率平衡,到目前为止,这些平衡在音频系统设计中尚未得到充分考虑。
所有这些都表明,人类听觉系统的时间域敏锐性可能比频域敏锐性更重要,并解释了为什么其时间频率不确定性比FT分析器(及其近亲,数字采样中的中核)要优越得多。因果信号是我们实现这一壮举的关键:如果自然信号波形是时间反转的,我们就不能再胜过富尔分析的时间频率不确定性。
时间敏锐性表现出一种生存特征,其起源必须追溯到哺乳动物时间线中比智人出现要早得多。
如果我们非凡的时域敏锐性与音乐的感知无关, 那确实会很奇怪。事实上,有说服力的证据表明情况并非如此:那些最善于解决时间频率不确定性的实验对象是音乐家,这表明,通过成为音乐家的过程,时间域敏锐度得到了增强——训练有素。因此,传统的音频系统性能频域观与我们对音乐的看法有着根本的矛盾。因此,早就应该采用一种新的方法来规范和设计高保真音频编码和设备,从而更贴近系统时域性能。
/ q' L, S! k: A. o, z

. d2 s/ `, h' W3 }& `4 [# I" m) o4 w' t) W0 ^. y+ x
使用道具 举报 回复

MQA CD:

MQA CD:#2一些例子
当传输限制为 16 位时,例如在 MQA CD 中,解码器将保持输出分辨率为 24b,首先是为了保持编码器的增强量化,还因为解码的 MQA CD 中的信息比在普通矩形 44.4 kHz/16b PCM 通道中表示的信息更多。
* `: ~9 l+ x" Q: H7 eMQA 解码器保持 24 位精度,但 16b 限制意味着底层通道噪声(但不一定是记录噪声)可能更高,如下示例所示。

+ s' B+ D5 w( m: C, Q
图中描绘了皮亚佐拉的曲目由字符串和奥博,从奥塔瓦的MQA CD。该图向我们显示,解码 24 位 MQA 文件可提供与原始文件无法区分的信号和噪声级别。在此 CD 上,编码允许在 16 位重播中访问波段"B1"。我们可以看到,MQA-CD 将信号输出保持在 36 kHz 左右,并将通道噪音保持在录制的噪声楼层以下。一个很大的好处是,播放的好处是大大改善了时间响应比正常的CD。
该图显示了丽贝卡·皮吉翁对MQA-CD中"乌鸦"解码的分析。此编码还允许在 16 位重播中访问频段"B1"。我们再次看到信息保存在 34 kHz 以上,带内噪声远低于录制,低于传统 CD 噪声。
接下来的两张图表(下图)显示了对DSD128录音的分析。在这两个灰色阴影矩形中,等效的光盘编码空间。
左图显示录音中的噪声地板,用于:(红色)原始 DSD/DXD 源:(葡萄酒)红皮书CD版本:(绿色)用于没有解码器播放的MQA-CD:(橙色)用于带解码器的MQA-CD。最后(蓝色)显示解码的MQA 24b下载文件的噪声地板。
我们可以在上面看到,MQA 过程没有影响录制的噪音池 我们还可以看到,MQA-CD的噪音比红皮书CD低,而且其复制量高于35 kHz。
此图侧重于音乐中最响亮的部分(请注意此处,频率范围从 1kHz 开始,以获得清晰度。(蓝色)显示了已解码的MQA 24b下载文件的原始和(橄榄)的峰值水平-这两个曲线叠加。(葡萄酒)是红皮书CD的峰值水平-我们可以清楚地看到"砖墙"下降在22 kHz。(绿色)是解码 MQA-CD 的峰值级别,也表明它正在复制高达 35 kHz,这是此录制的一个重要区域。此编码允许在 16 位重播中访问带"B1"。

4 P+ x! h( N' N0 X( \5 q) t( u

1 k& J  a& Z( Q6 O
2 W# t; d" T- u+ d8 u: u
使用道具 举报 回复 支持 1 反对 0
MQA 播放
MQA 借鉴了最近在听觉神经科学、数字编码和高质量声音感知方面的研究。[1]1 I8 w* a8 c0 x! ]
我们的"折纸"折叠技术创建一个单一的,紧凑的,高效的,可流式传输的MQA分发文件,没有播放限制,可用于下载或流式处理,并在许多不同的情况下享受,包括移动,车内,在PC上,与Hi-Fi等。% `3 E/ G9 v8 I
MQA 文件可以完全展开,使用完整解码器恢复工作室预览的确切声音。为了增加便利性,展开可以一步一步地进行,从而启用多个中级质量步骤,每个步骤都可以在演播室中预览和验证。
通常,MQA 解码器会根据硬件允许自动"展开"。
展开
每个播放选项都可以在 Studio 中预览并进行身份验证。
  • 没有解码器?您不需要解码器来享受我们的"标准"音质-这是现在广泛同意掌握社区优于CD。
  • 已验证: 如果硬件仅限于单速播放 (44.1 或 48 kHz), 解码器准备信号,以提供来自通用 D/A 转换器的最大音质。
    / v- W7 F9 J* v5 X0 h( N# z
  • MQA 核心: 折纸的第一次展开可恢复所有与音乐相关的直接信息,并可在 88.2 或 96 kHz 下用于模拟或数字输出。
    / D# w8 V( w) D0 ]7 y音质高于"否"或"身份验证"解码器,但低于"完整"解码器。包含 MQA 解码器的产品可以提供未解码流或核心输出的数字输出 - 只要它们以位精度传递。MQA 核心信号也是通用 DAC 的前提条件。
    7 j9 _' x$ n& ^% a$ C
  • 全解码器: 完整的解码器包括: 流身份验证, 折纸展开到核心, 然后进一步展开与精确的文件和平台特定的 DAC 补偿和管理根据等级目标.这是尽可能高的音质。
      \8 M! s" W8 d: D: j* ^) N2 R
  • MQA 渲染器:这种新型设备可以从核心解码器接收一个有点准确的信号(包含有关如何继续的埋藏信息),并在模拟上下文中完成最终展开。* T! `5 V3 C, ]0 b- v
    MQA 渲染器将指示"流锁",但无法解码 MQA 流或验证它。
    ! c& a1 o# H9 F$ ^1 o这种类型的设备可用于便携式应用程序(如活动耳机或便携式放大器)和硅集成。
    % ]! c% s/ v7 {7 R6 b2 tMQA 渲染器仅通过其托管的 D/A 转换提供模拟输出。
    ( t- A9 @" _7 A; n
第 1 季度。与 DAC 的完整解码器有什么实际优势?
  • MQA 流并不总是通过核心解码器到达。虽然某些应用程序和服务可能包括软件 MQA 酷睿解码器,但 MQA 文件和流预计将从许多不同的路线(包括音乐服务器、文件流、直播、WiFi、机顶盒甚至光盘)到达。
  • MQA 解码器应接受所有数字接口上的信号。
  • 正确执行,硬件解码器 +DAC 始终具有卓越的性能。
  • 完整的解码器为用户提供了最大的未来灵活性。
  • 完整的解码器能够指示 MQA 来源和其他信息,如其 UI 上的原始样本率。: z& @# b3 h  V; m
第 2 季度。软件解码的实际优势是什么?
  • 流媒体服务的优势在于在平台上提供 MQA Core 解码,这些平台不具有本地的高样本速率播放能力,或者具有其他音频限制(如笔记本电脑、平板电脑或智能手机)。MQA 折纸工艺可以利用这些上下文获得尽可能高的音质。5 n* f* R# l% _( p
第 3 季度。MQA 核心输出的主要功能是什么?
  • 解码器的 MQA 核心输出携带信息,使下游 MQA 渲染器能够完成折纸展开并提供完整的输出。
  • 核心信号可以通过"闪电"或 USB 等接口传递到耳机等低功耗便携式设备,并保留下游高质量声音的可能性。
  • 由于 MQA 核心信号的速率较高(一般为 88.2 kHz 或 96 kHz),具有适当 DAC 的听众可以享受更好(但未完全优化)的声音。) w! I8 Q1 e1 \- F8 ?, \
第 4 季度。MQA 渲染器的优点是什么?
  • MQA 渲染器可以提供低成本或轻量级的升级,用于播放在 MQA 中编码的音乐。
  • 某些 I 类 USB 设备只能接收 96 kHz 音频。在这些情况下,渲染器能够接收 MQA 核心,并在内部完成高达 384 甚至 768 kHz 的展开。. r$ O& Y$ g' B, a- r
第 5 季度。为什么不做一个MQA DAC,这只是一个渲染器?
  • 当可能的时候,有一个MQA解码器,使解码访问几个信号源是有意义的。请参阅上面的Q1。
  • MQA 渲染器无法显示来源信息。
    - N$ N8 b7 `6 a$ f0 `8 P1 r
5 o+ q5 [" d; `$ s8 z/ u& e4 b( B

, o. p% I' k9 u: l' }, |0 F5 M; \+ p9 ~8 f
使用道具 举报 回复 支持 反对
MQA 认证高分辨率
MQA 是分发高质量录音的绝佳技术。我们的目标是为听众带来录音室的声音和来自档案馆的旧录音。MQA 拥有复杂的工具和方法,可从所有时代恢复录音,包括圆柱形或壳体、模拟胶带或数字磁带,直至现代 768 kHz PCM 或四台 DSD。
/ R; k. H5 }4 L3 _我们的观点是,"分辨率"是感知的概念,最好在模拟领域进行解释。这种开创性的洞察力更符合倾听体验,而不是质量的数字域定义。因此,我们不会根据数字文件格式或示例速率或位深度等参数包括或排除记录的材料。相反,我们专注于时间分辨率、噪声稳定性和模拟模糊。[1]
种源
起源和技术标准是完全不同的东西。无论使用的技术如何,音乐文件都可以在艺术家发布后更改。当MQA被播放时,指示来源。
  • MQA"工作室"(蓝光)直接从掌握工程师、制作人或艺术家的角度向听众提供确认。MQA Studio验证您听到的声音与音乐完成时在录音室播放的声音完全相同,这意味着,这也是当时录制的最终版本。
  • 第二个级别,"MQA"(绿灯)可以指示,虽然流是真实的,但来源可能不确定,或者它尚未最终发布。/ Q% p" P0 ]& q6 r
关于起源的问题
第 1 季度。MQA编码在哪里进行?0 f5 g. `# ^% ]7 N
A1.音乐可以在录音室、标签供应链中或特定情况下代表零售商或服务提供商编码为 MQA。
第 2 季度。什么应该编码为MQA工作室?" I1 ]2 |. M' A- Y
A2.MQA 工作室身份验证应保留给在工作室预览后准备的新录音或重新制作的录音,或者保留权利持有人能够明确断言源是原始版本的录音。
  H% T1 K4 Y$ O! p6 X  x言下之意是,供应链编码发生得越远,就越难以确定来源,因此只有在内容所有者明确支持和提供来源时,录制才能编码为MQA Studio。如果对监管链存在疑问,音乐应编码为MQA
第 3 季度。原始版本是什么?( \8 c. k7 E0 K$ T! o. {
A3.一般来说,在制作过程中,艺术家、制作人和掌握工程师之间会达成最终的组合/掌握协议。此版本通常先于分发版本-其中一些版本可能包括进一步处理,例如:LP的EQ:掌握音调 (MFIT) 或 CD;或格式转换,以提供选择在高Res下载等。这可能意味着原始项目可能使用不同(较低或更高)的采样率或位深度,而不是分布链中的版本。相反,乙烯基或 MFIT 版本可能是唯一批准的版本。
第 4 季度。MQA 是否对文件进行技术分析?
  h: g1 T* C' WA4.我们的摄入和编码过程对传入的音频进行多次检查,以帮助避免分发错误(如文件变形或不一致)。编码器还执行深入的技术分析,并正在寻找某些故事特征。
第 5 季度。你拒绝放大吗?( m- ?& d: O+ s2 S7 N$ j
A5.我们确实寻找令人震惊的或偶然的上升采样,并提出了一个查询,但这不是一个简单的问题:
  • 几乎不可能使用光谱分析来绝对确定音乐文件是否在供应链中被简单地放大了——有几个复杂的放大器试图混淆它们的使用,尽管我们尽了最大的努力。
  • 现代录音或重制器可以在某些(但不是全部)茎或仪器中以较高的样品速率使用处理或效果,将录音从数字到模拟,然后(有时以较高速率)返回以访问特定工具是标准做法。
  • 一些插件效果引入所谓的"砖墙",甚至别名效果。这些文件可能会给人一种被放大的印象,即使它们实际上包含真正的高速率数据。
    # {- G) n+ T# H% b
MQA只关注一件事:"这是艺术家、制作人还是掌握团队签署的最终版本?"
第 6 季度。重新发布怎么样?
* G5 Y& A" J* Z9 j- AA6.偶尔,艺术家会重新访问专辑,并在工作室中使用更多最新的工具。这是他们的特权,我们的工作是确保最终结果被忠实地交付。
第 7 季度。下载标准7 h) e& J8 d# E2 M9 t9 v, Z/ X
A7怎么样?一些零售商根据技术数字(如样品率或位深度)应用标准。但是,这些标准与原产地没有紧密相关,也没有指示文件与原始记录之间的代数。例如,24 位的文件并不意味着它是原始主。
第 8 季度。MQA的来源与DEG或JAS规格有何不同?+ a% a4 {& M4 w
A8.JAS规范和徽标程序适用于播放硬件。要携带徽标,设备必须能够处理高达 96 kHz 24bit 的数字输入,并且具有至少 40 kHz 的模拟带宽。
9 ?' h+ J" ~# ~- h( \/ F% F高分辨率数字音乐的DEG徽标程序要求原始版本在 DSD 或 PCM 中,最少为 48 kHz 和 20 位。( Y- O3 `' L4 Z. U7 c2 \( G! ?* b
MQA 技术侧重于模拟域中的时间分辨率、通道噪声稳定性和端到端模糊。MQA 系统编码器和解码器不会影响录制的动态范围。
MQA 来源认识到,伟大的音乐可能仅以早期模拟或早期数字或红皮书 CD 格式提供;此类录音,如果由权利人担保,可以标记MQA工作室,并享受MQA链的深刻声波好处。
, o# y4 [. r/ G$ o) J: u

- d8 p2 o7 ~( K7 e0 R) E5 [+ l

) L/ c2 u& |4 V! a' H8 I1 A
- v/ Y9 b) z6 r6 X7 n
使用道具 举报 回复 支持 反对

MQA CD :

#1折纸和最后一英里
一旦录制被"去模糊化",MQA 将使用我们称为"音乐折纸"的过程,该过程侧重于维护橙色三角形中的信息(外加大量安全边际),从而使这个大型高分辨率文件既可管理,又可与任何服务或播放设备兼容。本节审查用于制作单速 (1s MQL) 传输文件的"折纸"。作为第一步,非常高频的含量 (C) 被"封装"并隐藏在 B 的噪声地板下方。
此香农信息图的大小显示总频谱容量为 192kHz 24 位 PCM。灰色矩形显示 CD 的容量。黄金曲线是在整个音乐示例中随时达到的峰值水平。红色和棕色的线条显示最大和平均的背景噪音 - 我们在音乐家开始演奏之前听到的声音。) i- q+ n; I9 f. W  H1 G# l/ ]
所有突出的音乐相关信息都存在于橙色三角形内,MQA 非常严格地保护这些信息。
区域 A 是传统音频信息的频段。区域 B,频率较高,在声音中表现为时间微观结构。区域 C 对传输采样率有噪音影响。
  下一步是无损地将 B 和 C 埋在 A 下方的噪音中。B 使用自定义无损波段拆分和无损处理和编码作为两个波段处理。在此阶段,添加 MQA 信号以及包含有关录制、解码器说明以及 B 和 C 的小型噪声形状信息流(绿线)。
3 F0 J1 w: D5 `  u( a- |" p5 ^1 x; F- F
绿色信号由 MQA解码器完全删除:但它在那里,这样我们就可以听到更多的音乐时,播放仅限于16位流。B 的编码器使用近似(预测)+润色信号使其无损。B1'和B2'的估计可以埋在绿线内或下方(由掌握工程师选择)。
下一步是将此信息折叠成一个小型 48kHz 24 位 PCM 文件,无论您今天在何处播放音乐,都能听到这些文件。如果我们没有解码器,这听起来仍然比CD好。此MQA文件数据速率低-流式传输方便,下载量小。此编码的 MQA 文件也可以在演播室中预览。我们可以在 Hi-Fi、智能手机、便携式播放器、汽车、PC、Wi-Fi 扬声器或蓝牙耳机上播放。
此信号可以通过数字输出传递到下游解码器。解码器可以拆解音乐,为我们提供尽可能多的质量播放平台可以支持。同一个文件支持工作室质量播放和智能手机!
有时,我们可能想要在不支持24位的设备上收听MQA音乐——也许只有16位?MQA 不放弃所有隐藏的信息,而是携带一个小数据通道(以绿色显示),该通道可以包含"B"估计值,从而显著提高播放质量,例如 CD、"Airplay"、车载、某些 WiFi 扬声器和类似场景。
如果目标是 CD,则使用特定编码来优化时间频率平衡并最大限度地减少通道噪声的可听性。 当然,如果您的系统处理 24 位,则可以解码完整的文件和动态范围。
MQA"核心"包含并保护三角形中的所有音乐信息-以及更多内容。它还包含区域 C 和其他信息 - 埋在噪音中, 在噪音中, 远远低于可读性。
"核心"解码器可以拆解包装回此阶段。如果后续的转换器没有走得更快,MQA 解码器已准备此音乐进行模拟重播。我们可以享受我们的音乐在96 kHz 24位的质量。然而,这里有一些特别的东西。我们可以通过 USB、闪电、S/PDIF 等将这个 24 位 MQA 核心信号传递到另一个 MQA 设备上,下游 MQA 解码器或 MQA 渲染器可以完全理解它。
MQA 解码器将继续展开,如图所示。C 区使用埋藏指令进行重建,这些指令可能是由工作室掌握工程师预先确定的在此步骤中,MQA 解码器还处理以下 D/A 转换器的补偿和过滤,根据模型,该转换器可能包含一系列信号处理、放大器或其他形式的转换和过滤。
解码过程中的这一步骤对于每个产品都不同,以便使生成的模拟与分层目标紧密一致,并最准确地复制工作室中批准的内容。渲染阶段可以在某些平台上使用跨系列速率转换来最大化质量并最大限度地减少模拟模糊。
显示前两张图像中显示的不同解码选项的完整系统(模拟到模拟)平均传输内核。橄榄是完整的解码结果。当传输通道限制为 16 位时,解码器保持良好的时间性能,如橄榄曲线和黑色曲线之间的比较所示。低于 20 kHz 的音频以全分辨率保持,而下一个八度音阶会丢失一些精度
如果最终转换为模拟不使用 MQA 转换器,则信号为典型的芯片转换器提供前提条件。如果没有解码器("旧模式"),橙色曲线会显示对最终转换器的输入。蓝色以 2 倍的速度显示"首次展开"核心解码器的输出。橙色和蓝色曲线显示对 DAC 的输入,而不是模拟输出。
显示上一张图像中内核响应的傅立
% p% ^# {  x' K' w
& Z+ D3 f6 |# C

( u0 n, e- f/ }
使用道具 举报 回复 支持 反对
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则