題 什麼是最大的聲音可以存儲在.wav文件中?


音頻文件的聲音大小是否有限制?可能有限制阻止人們摔斷耳朵,但我不知道它是什麼。


4
2018-05-11 15:01


起源


不幸的是,對於人們來說,計算機上的文件無法阻止某人將放大器機械地轉到11 ... - grawity
不可以。就此而言,數字上“大聲”的內容實際上取決於播放設備。如果您有一個基本系統揚聲器輸出音頻,最響亮的聲音可能聽起來與任何其他聲音相同。也許這會讓演講者劈啪作響。但是通過真正的立體聲或音響系統輸出相同的音頻文件然後你可能會把你的耳朵吹出來。就此而言,許多個人音頻設備內置聲音限制器可以 - 有時可以激活/停用,以保護人的耳朵免受太大聲的音頻。 - JakeGould
@JakeGould是的,有一個限制。看到我的回答。 - LPChip


答案:


鑑於我們談論.wav文件,是的,有一個限制。

當您在編輯器中查看波形時,您將看到編輯器有一個用於繪製波形的屏幕,您可以看到大多數波形的曲線的頂部和底部。

如果你可以在窗口中完全看到曲線,那麼聲音就不會扭曲。對波形進行歸一化將使其拉伸,使其盡可能大,同時仍適合此窗口。

這樣可以產生高質量的聲音,聲音相當大。它可能與其他聲音的響度相同,就像其他人一樣。您必須記住,波形具有不同的動態,並且確實會影響音量。

如果您將播放完全適合窗口的正常正弦波形,則會獲得一定的音量。如果您現在假裝窗口較大,並且增加正弦波形的音量,則聲音實際上會變大。您將看到在頂部曲線的左側和右側,波形是圓形的,但在中間頂部,而不是形成一個漂亮的半圓,它現在被您正在查看的窗口切斷。波形本身已經改變了形狀。這會導致聲音略微扭曲,但作為回報,音量會更高。

如果繼續提高音量,那麼正弦將超出窗口,這會使波形變形更大。

這就是它的樣子: enter image description here 圖像來源

當您增加波形時,頂部和底部的寬度會增加,這會使聲音更響亮,但在某些時候,您會將正弦波形轉換為方形波形,這是它的極限。此時,波形不會再變形,並且您已達到音頻可能的最大放大倍數。因為這是一個動態過程,假設波形具有不同的形狀(例如,您不能像正弦波形那樣放大方波,但在本質上,方波波形已經遠遠大於正弦波形),這很容易回答說你實際可以增加多少音量。雖然有數學公式,但超出了SuperUser的範圍。


3
2018-05-11 16:44



該圖像實際上顯示的是DC偏移而不是純水平增益。這不僅會扭曲它的削波位置,而且還會將揚聲器始終保持在非零的“靜止點”,從而迅速建立熱量。 (我完全同意,這也會聽起來很血腥'可怕;) - Tetsujin
這個答案是對的。我可以錄製某人竊竊私語,另一個人大喊大叫。我可以很容易地調整錄音電平,這樣你在確定哪個錄音是低語而不是喊叫時,你看波形的方法是沒用的。 - sawdust
“我是一名音頻工程師”  - 你似乎只熟悉播放,完全沒有提到它的概念 錄音水平。 - sawdust
@Damon哦,你肯定會剪輯成一個數字音頻文件。打開一個Wave文件,首先將其標準化,這樣它最適合音頻編輯器,並且沒有剪輯就可以大聲調整。現在將放大效果應用於波形,以便剪輯並保存波形文件,將其打開,然後降低音量。 Tada,剪輯仍在那裡。 - LPChip
此限制適用於記錄和再現(如果您正在討論這些過程中的任何一個,則是正確的),但與存儲在.wav文件中的內容無關(這是問題所在)。 .wav文件中的最大值可以與處理期間的任何響度或幅度相關聯。答案在技術上對於它所陳述的內容是正確的,但並沒有真正回答問題中的問題。 - fixer1234


什麼是最大的聲音可以存儲在.wav文件中?

盡可能大聲(假設你的麥克風和電子設備沒有扭曲),因為正確的錄音技術要求調整輸入電平以防止輸入過載/削波。
我愛你 錄音水平 應調整以匹配正在錄製的信號源的響度。

每個記錄介質都具有有限的動態範圍,即可以保存的最響亮和最安靜的聲音之間的差異。音樂和語音的典型錄音需要捕捉低級聲音以進行逼真的再現,因此 錄音水平適當調整。
對於給定的 錄音水平 有一個可以錄製的最大聲級。
但是,如果你需要錄製響亮的聲音, 錄音水平 可以增加,以便可以錄製更響亮的聲級,但由於動態範圍有限,相應的低級聲音會丟失。

如果 錄音水平 無法調整以匹配信號源,然後錄製非常柔和的聲音或非常響亮的聲音(例如土星V火箭發射)是不可能的。幸好 錄音水平 可以調整,所以有非常響亮的事件的錄音,如 火箭發射

音頻文件的聲音大小是否有限制?

技術上沒有,因為錄音不保持音源的絕對聲級。
相反,無論是模擬還是數字記錄,都可以捕獲信號源的相對聲級,例如:是否有一種樂器比其他樂器響亮,或有人在高聲嘀咕著某人。
“響度” 音頻片段的確實在播放時確定,並且具有用於聲音再現的功率和揚聲器效率。

記錄中的聲級均相對於通常指定為0dB(即零分貝)的最大輸入電平 錄音水平
可以記錄的最大聲學響度將由所使用的麥克風和電子設備決定。
錄音工程師將/應該對輸入信號應用必要的衰減(或增益),以便錄音期間的最大信號將記錄為0dB。

如果將0dB電平設置為高於必要值,則不使用採樣字大小提供的全動態範圍,並且較軟的聲音將失去分辨率。
如果將0dB電平設置為低於要求,則一旦響亮的聲音消耗任何可用的餘量,錄製的信號將被剪輯。

因此,對於可以記錄的最大聲音沒有“限制”,因為“最大”聲音預計會調整到0dB水平。
為了防止任何比0dB水平更高的意外輸入,現代錄音技術使用壓縮器和限幅器,通常不利於音頻質量。


7
2018-05-11 22:45



就錄音而言,這是正確的,但需要補充以完全回答這個問題:聲音最大的聲音是什麼? 存儲 在一個.wav(無論它如何到達那裡)。為此,您需要查看另一個極端,即可以與背景噪聲區分開的最小聲音。位數定義了可能的信噪比。每位給你大約6分貝。因此,每個通道16位,使您最大聲音的聲音比最柔和的聲音大96 cm。 (續) - fixer1234
.wav格式限制為4 GB文件大小,16位深度足以滿足大多數用途。但是你可以使用更高的位深度。 24位將使您最大聲音大於144 dB(這超過了錄製設備的功能,因此必須合成創建)。但這只是你送到你的複制設備的信號,它必須能夠再現電平。進一步閱讀: en.wikipedia.org/wiki/WAV, en.wikipedia.org/wiki/Audio_bit_depth。 - fixer1234
技術上沒有錯誤。無論你如何看待它,波形文件中都會有一個點,你根本無法響亮,這意味著,技術上是的,有一個限制。看到我的回答。是的,我確實在那裡使用了錯誤的圖像,因為我找不到另一個更適合的圖像。我是一名音頻工程師,我已經做了大量測試,看看有什麼限制。一旦你在技術上盡可能地吹出聲音,就會有一個讓聲音響亮的點,根本不會改變聲音。 - LPChip
沒錯,如果你在揚聲器上以正常音量播放它會非常響亮。但是,如果你將揚聲器的音量降低到一個低水平,這樣你就可以收聽音量,你會發現,雖然非常扭曲,可能超出識別,但根據你的開始,會有一個點,聲音不會變大。實際上,越接近最大值,就越需要增加響度來注意任何變化。 - LPChip
@sawdust,我試圖讓它與問題保持一致。是的,響度真的與錄音和復制有關,這就是為什麼我看到你的答案是正確的。問題中的“響度”是錯誤的術語,因為.wav文件不編碼或存儲響度,它存儲動態範圍。 Re:土星啟動,你可以錄製一個150dBA的聲音,將它存儲在一個16位的文件中,並可能在150dBA下重現它,但16位文件不能保持150dBA的動態範圍。我會發布另一個答案,試著更準確地覆蓋它。 - fixer1234


什麼是最大的聲音可以存儲在.wav文件中?

沒有“最響亮”的聲音可以存儲在.wav文件中,因為.wav文件不存儲“響度”。我將在下面詳細說明。

音頻文件的聲音大小是否有限制?

不是響度限制,但動態範圍有限,這與響度有關。

響度

響度是你所聽到的,它可以作為基於聲壓的絕對值來測量。對於上下文,聲壓標度從0dB開始作為正常人類聽覺的閾值; 120-130分貝的響度會導致疼痛。

只有原始聲音和再現輸出才有響度。再現輸出的響度僅受設備能力的限制;無論原始聲音的聲音大小或存儲方式如何,您都可以像設備一樣大聲處理。

振幅

在記錄和再現過程中,聲音由電波形表示。波形的幅度表示響度。無論處理何種設備,信號都有一些可以處理的最大振幅。

如果波形的幅度大於設備可以處理的幅度,則多餘的部分不能被處理,因此它在極限處基本上被切斷。那是@LPChip描述的剪輯。所以 表示響度 在這些過程中,限制在特定於設備的上限。

在錄製過程中,幅度限制用於確保准確記錄最大聲源(未剪輯)。振幅參考設備的上限,標記為零,下面的所有內容都是負相對值。那是@sawdust指的0 dB。 (請注意,這與前面提到的0 dB聽力閾值無關。)  因此,通過設計,原始聲音的最大響度無論對應於特定.wav文件中表示的最大值,但該最大值可以是任何響度。

在再現期間,設備的幅度限制決定了它可以輸出的最大響度;即,您可以輸出.wav文件中表示的“最響亮”聲音的最響亮的聲音;輸出響度限制是再現設備的一個功能,而不是存儲在.wav文件中的功能。

動態範圍

為了確保最準確地捕獲和再現最響亮的聲音,並且在背景噪聲中不會丟失最安靜的聲音,錄音和再現需要解決兩個極端問題。將要再現的最安靜的聲音與最響亮的聲音之間的關係稱為動態範圍。

.wav文件

.wav文件對動態範圍進行編碼;即,相對響度而不是實際響度。它使用可用的位深度編碼為數值(更多位可以存儲更大的數字);位數定義了可以存儲的動態範圍。每個位提供6 dB的動態範圍。典型的16位深度允許動態範圍為96 dB,足以滿足大多數錄音要求。

您可以使用更多位並存儲更大的動態範圍,但給定的位深度定義了限制。那是, 與最安靜的聲音相比,最響亮的聲音可以響起多大,但聲音的最大聲音不會多大。


4
2018-05-12 23:04





在波形文件中,聲音的“響度”是波形幅度的函數,波形由樣本組成。文件的比特率確定每個樣本的最大/最小值。

8位音頻:-128到127

16位音頻:-32760到32760

32位音頻:-1.0f至1.0f(浮點)。

“最響亮”的聲音是在給定比特率下樣本的最大值和最小值之間振蕩的任何波。 (E.G. -1.0f和1.0f用於32位音頻)

進一步閱讀: https://blogs.msdn.microsoft.com/dawate/2009/06/23/intro-to-audio-programming-part-2-demystifying-the-wav-format/


1
2018-05-11 17:13



在正確的軌道,但不完全在那裡。看到 en.wikipedia.org/wiki/Audio_bit_depth 為了更好地理解比特與音量的關係。 - fixer1234