Was Integer-Typ ist für MP3-Datenrahmen verwendet?

stimmen
0

Ich bin eine universelle Parser - Bibliothek für verschiedene Binärformaten in Rust als Teil eines persönlichen Projekt zu schreiben. Ich habe angefangen , die Dateistruktur von MP3 - Dateien zu erforschen. Wie ich es verstehe, besteht eine MP3 - Datei - Struktur von Kopf- und Datenrahmen. Jeder Header - Frame bietet Meta - Informationen über die Vorgehensdatenrahmen. Hier ist ein Diagramm und eine Auflistung der erlaubten Werte für MP3 - Header - Frames , dass ich verweisen.

Ich verstehe das Format des MP3 - Header. Meine Verwirrung oder Mangel an Informationen, umgibt MP3 - Datenrahmen. Ich kann nicht scheinen , eine Quelle zu finden , die angibt , welche Integer - Typ Proben wie in dem Datenrahmenteil einer MP3 - Datei kodiert werden. Sind sie 8 Bit, 16 Bit, 32 Bit, signiert, nicht signiert, etc?

Das Beste, was ich von ist denken kann, eine Kombination aus Abtastrate Frequenz zu verwenden und was jede Probengröße sollte berechnen Bitrate. Jedoch, dass nicht bestimmt, ob jede Probe eine oder ohne Vorzeichen ganze Zahl ist.

Ich versuche nicht dekodieren diese Dateien, ich bin nur um sie zu analysieren versucht. Ich habe eine überraschend harte Zeit daran, diese Informationen hat. Alle Informationen oder hilfreich jemand bieten würde sehr geschätzt werden.

Veröffentlicht am 14/01/2020 um 00:00
quelle vom benutzer
In anderen Sprachen...                            


1 antworten

stimmen
2

Obwohl dies nicht verwandt ist .mp3 per se, könnte es möglicherweise einige hilfreiche Informationen in Will C. Pirkle- Buch sein, Plugins Designing Audio Effect in C ++ .

Er beschreibt die Art und Weise , in der das .wav - Audioformat seine Informationen speichert. Es verwendet ganze Zahlen von 32.768 bis 32.767 beginnend unterzeichnet. Dies stellt einen Bereich von 2 ^ 16 in ein bipolares Format, wobei der Exponent entspricht der Bittiefe (meist 16 oder 24).

Eine weitere wichtige Sache zu beachten ist, dass während der Phaseninversion eine gemeinsame Sache in vielen Audioanwendungen ist, gibt es keine entsprechende ganze Zahl ist -32.768 zum Umkehren. Um dies zu kompensieren, ist es üblich, den Wert zu behandeln -32.768 -32.767 wie. Dies ist nur wichtig, obwohl, wenn Sie den Wert 0 in der Verarbeitung verwenden, die am häufigsten der Fall ist. Ansonsten könnte man die obere Grenze 32.768 erstrecken.

Er tut Zustand , dass es häufiger für die Audioverarbeitungsanwendungen , um mit Fließkommazahlen entweder zwischen 0.0f und 1.0f oder -1.0f und 1.0f. Der Grund dafür ist , dass aufgrund der Addition und Multiplikation gemeinsam sind Operationen in DSP, wir diesen Bereich vermeiden überfüllt , wenn wir diese Gleitpunkte verwenden. Bei der bipolaren Integer - Format, es ist zu einfach zwei Nummern zu finden , die dieser Bereich in einem Produkt oder einer Summe außerhalb führen. Im Bereich von -1.0f bis 1.0f, werden alle zwei Zahlen immer führen zu einem Produkt , das in diesem Bereich nach wie vor ist. Leider erfordert zusätzlich noch Vorsicht, aber eh ...

Es tut mir leid ich habe nicht mehr Informationen über mp3-Dateien speziell, aber vielleicht noch einsichtig sein könnte.

Viel Glück!

Beantwortet am 14/01/2020 um 20:02
quelle vom benutzer

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more