Mierniki LUFS, RMS i Peak – Pytania od Czytelników

Kolega ‘pajczur’ pytaniami o tajemniczy LUFS mnie jakiś czas temu męczył i… w końcu wymęczył. Czym jest i co oznacza skrót LUFS? Jak go rozumieć i wdrożyć wiedzę o nim w życie? Jak ma się on do znanego nam poziomu RMS i Peak? O tym i o kilku innych kwestiach związanych z tym określeniem opowiem w dzisiejszym artykule.

‘Pajczurowi’ dziękuję za pytanie, nota bene bardzo potrzebne i gratuluję uporu, a ja przepraszam, że tak późno się za to zabrałem. Mam nadzieję, że artykuł rozwieje Twoje (i innych) wątpliwości, a jeśli nadal coś pozostanie w tej kwestii niejasne, to śmiało pytajcie w komentarzach.

Czym jest LUFS?

Skrót oznacza Loudness Unit (referenced to/relative to) Full Scale czyli “jednostka głośności w odniesieniu do pełnej skali (cyfrowej)”. Dla ułatwienia używa się też krótszej wersji – LU (Loudness Unit). Spotkamy się czasem także z określeniem LKFS (Loudness K-Weighted Full Scale), ale one tak naprawdę teraz już oznaczają dokładnie to samo (1 LU równy jest 1 dB). Obie te wartości oznaczają kolejny, po RMS, sposób określania z jak głośnym materiałem mamy do czynienia. Aczkolwiek z niewielkimi odstępstwami…

LUFS został stworzony przez ITU (International Telecommunication Union) i po raz pierwszy przyjęty przez EBU (Europejską Unię NadawcówEuropean Broadcasting Union) w sierpniu 2010 r. w publikacji pod nazwą EBU R-128 o zaleceniach głośności emitowanych programów. W tym materiale opisane są wytyczne co do tego jak mierzyć i ustalać poziom głośności publikowanego materiału za pomocą nowych jednostek (LU) zamiast dotychczasowych mierników szczytów (PPM, Peak Meters, etc), których użycie powodowało znaczne rozbieżności w postrzeganej przez odbiorców głośności.

Miejcie tylko na uwadze, że chodzi tu głównie o telewizję i radio w kontekście ujednolicenia poziomów emitowanych materiałów (miejmy nadzieję, że świat audio też to w końcu przyjmie na stałe), a konkretniej o rozdźwięk między poszczególnymi utworami puszczanymi w odbiornikach czy wręcz ogromny rozrzut między poziomem reklam a materiałem właściwym, jak filmy czy audycje radiowe.

Któż z nas nie kocha tego momentu, kiedy w przerwie filmu wchodzi reklama, a my musimy wykonać szybki skok na pilota od telewizora, żeby nam szyby nie popękały? Choć w przypadku niektórych stacji telewizyjnych można śmiało powiedzieć, że to bloki reklamowe są przerywane filmem… Liczne skargi i kampanie doprowadziły w końcu do tego, że EBU wzięło się poważnie za ten temat i tam, gdzie standard ten jest przestrzegany, ludzie w końcu odetchnęli z ulgą. Trudno się dziwić, bo można uznać to za swego rodzaju rewolucję, której nie było w świecie udźwiękowienia od dziesięcioleci…

Tak na chłopski rozum – skoro do tej pory przy określaniu głośności standardem było mierzenie szczytów (co by dotykały cyfrowego zera), to poziomy średnie (RMS) różnych materiałów mocno od siebie odstawały, bo zależy jak ktoś bardzo sprasował je kompresorami, limiterami i innymi “czołgami” emisyjnymi wyciskając z nich ostatnie poty przy niezmiennym poziomie Peak. Teraz wprowadza się te zalecenia jako standard (a w niektórych krajach, jak np. USA czy UK działają już jako prawo), dzięki czemu mierzenie głośności odbywa się w nowy sposób i w nowych jednostkach, czyli rzeczywiście na podstawie postrzeganej głośności, a nie pod względem najgłośniejszych, bardzo krótkich szczytów, które w zasadzie nic o ogólnej głośności nam nie mówiły.

Zalecany standard dla emitowanych programów wynosi obecnie -23dB LUFS (w wariancie amerykańskim, znanym jako ATSC’s A/85, wartość ta wynosi -24dB LUFS). Dodatkowo poleca się nie przekraczać poziomu szczytów ustalonego na –1dBTP (dB True Peak). True Peak, dla jasności, to bardziej zaawansowany algorytm od firmy TC Electronic, który mierzy nie tylko szczyty próbek, ale także bierze pod uwagę szczyty między-próbkowe (inter-sample peaks), które czasem potrafią poszybować powyżej cyfrowego zera.

Jeśli chodzi o wymogi co do konkretnych rodzajów transmitowanych nagrań, to jest ich oczywiście więcej (po szczegółowe wytyczne zapraszam zainteresowanych na stronę EBU – tam wszystko jest dokładnie opisane łącznie z rozpisaniem wymogów do różnego typu materiału). Nam wystarczy w sumie wiedzieć, że dzięki zachowaniu takiego ujednolicenia, mamy teraz pewność, że nie będzie potrzeby regulowania poziomu odsłuchu między różnymi segmentami audycji czy programów. Tylko się cieszyć, choć szkoda, że tak późno…

Co w takim razie z RMS-em?

Możecie spytać (i całkiem słusznie, z resztą) jak ma się ten nowy standard mierzenia poziomu średniego do starego, bo zarówno RMS jak i LUFS służą przecież do oceny postrzeganej głośności (tej rzeczywistej, uśrednionej). Otóż, różnice między nimi będą bardzo minimalne, aczkolwiek algorytmy w standardzie R-128 są nieco inteligentniejsze i bardziej wszechstronne. W wielkim skrócie można powiedzieć, że RMS wskaże nam poziom sygnału (na podstawie średnich wartości amplitudy w sygnale, niezależnie od długości trwania materiału), a LUFS zmierzy głośność w różnych wymiarach czasowych oraz bliżej temu, jak postrzega ją ludzkie ucho. LUFS zawdzięcza bycie nieco precyzyjniejszym również temu, że w odróżnieniu od RMS, bierze w swoich obliczeniach pod uwagę także krzywe izofoniczne.

Ale mimo tej różnicy, jeśli zestawilibyście ze sobą wartości pokazywane przez miernik RMS i miernik LUFS (w trybie Integrated), to rozbieżności będą bardzo nieznaczne. Badaczom nie chodziło bowiem o wynalezienie koła od nowa, co o delikatne zacieśnienie norm, ale przede wszystkim – o przywrócenie zdrowego rozsądku w głośności publikowanych materiałów. Nowa jednostka do jej mierzenia była tylko pobocznym efektem prac.

Gdzie znajdziemy mierniki LUFS?

Producenci pluginów co raz częściej zaczynają dokładać w swoich produktach możliwość mierzenia sygnału według standardu EBU R-128, a niektórzy tworzą specjalnie do tego celu przeznaczone, osobne wtyczki. LUFS zmierzymy chociażby w:

  • iZotope Ozone
  • Waves WLM Plus
  • Toneboosters EBULoudness
  • Melda Production MLoudnessAnalyzer
  • Klangfreund LUFS Meter
  • HOFA Meter, Fader & MS Pan
  • Meterplugs LCast

Jak rozumieć tryby LUFS?

Zazwyczaj spotkamy się z trzema wariantami czy trybami w miernikach LUFS i odnoszą się one do długości trwania materiału (czy też do długości dokonywania pomiaru), a konkretnie:

Momentary Loudness (głośność chwilowa – pomiar sygnału z trwających po 400ms fragmentów)

Rzadziej używany tryb (nie we wszystkich wtyczkach go spotkamy), bo daje nam wyłącznie pomiary odtwarzanych w danej chwili bardzo krótkich fragmentów przez co bywa dość zmienny i nie mówiący nam za wiele o poziomie średnim. Można przyjąć, że zachowuje się podobnie do miernika VU, który generalnie jest tańczącą do rytmu igłą – taki miernik poziomu “tu i teraz”.

Short-Term Loudness (głośność krótkoterminowa)

To jest uśredniony wynik z trwających po 3 sekundy pomiarów, czyli już całkiem sensowna wartość, która mówi nam sporo o postrzeganej głośności. Ona będzie się uaktualniać co 3 sekundy, więc jest bardzo przydatna nie tylko podczas dłuższych momentów odtwarzania, ale także w sytuacjach, gdy gramy jakieś krótkie sekcje.

Integrated Loudness (głośność całokształtu – od startu do zatrzymania)

Ta jest najbliższa pomiarom RMS i oznacza po prostu najbardziej uśrednioną wartość głośności na dłuższym odcinku. I to nią powinniśmy się sugerować określając ogólny poziom średni dla całego utworu, kilku utworów względem siebie czy nawet całego albumu. Obowiązuje tu prosta zasada – im dłuższy fragment odtworzymy, tym bardziej uśredniony odczyt głośności otrzymamy. I to tę wartość bierze się pod uwagę oceniając czy dany utwór trzyma się w ryzach standardu i nadaje się do emisji.

W tym trybie do gry wchodzi również algorytm nazywany bramką (gate), ale nie mylcie tego z bramką/ekspanderem. Zadaniem tego algorytmu jest wyłączenie z pomiarów cichszych momentów, które rejestrują się poniżej konkretnego progu (o 10 LU poniżej obecnego pomiaru bez bramki), co zapobiega zakłamaniu rezultatów i ewentualnemu zepsuciu rzeczywistych pomiarów głośności.

Jak to wszystko interpretować i z tego korzystać?

Wyobraźmy sobie utwór, który zaczyna się od spokojnego wstępu, powoli się rozkręca i rozbudowuje w zwrotce aż nadchodzi głośny refren, potem odrobinę spokojniejsza druga zwrotka i znowu głośny refren. Następnie moment wyciszenia i kolosalny refren kończący. Pomiary wyglądałyby następująco:

Short Term by nam pokazywał cichszy wykres (lub mniejsze numerki) przez wstęp i powolne wyskoki wraz z rozkręcaniem się utworu, żeby dokonać znaczącego wybicia w refrenie, po czym znowu by spadł w drugiej zwrotce, ponownie podskoczył w refrenie, ogromnie spadł w ściszeniu i wystrzelił do góry w kończącym refrenie. W tym samym czasie wartość trybu Integrated by gładko rosła od wstępu, przez zwrotkę, aż po refren, bardzo stopniowo i delikatnie by opadła na drugiej zwrotce i powoli zaczęła narastać w drugim refrenie, po czym w ściszeniu też by nieznacznie spadła i na ostatnim refrenie zaczęła by powoli rosnąć – i to wszystko ze sporym opóźnieniem, dlatego, że wszystko jest kalkulowane tutaj w oparciu o minione już fragmenty. Łapiecie koncepcję?

Można więc przyjąć, że mielibyśmy po prostu znaczne zmiany rejestrowane przez Short-Term i powolne reagowanie z wartościami uśredniającymi (biorącymi pod uwagę wszystko, co się pod względem głośności już w utworze wydarzyło) w przypadku Integrated. Hipotetycznie, moglibyśmy mieć wahania w Short-Term (aktualizowane co 3 sekundy) od powiedzmy najcichszych rzędu -18dB LUFS i najgłośniejszych rzędu -9dB LUFS, a wartość średnia (Integrated) dla całego kawałka wynosiłaby powiedzmy -12dB LUFS. I tak to należałoby interpretować.

I teraz, gdyby nasz utwór z Integrated Loudness rzędu -12 dB LUFS miał zostać wyemitowany w radiu lub telewizji, to zostałby do emisji ściszony o 11dB, żeby sprostać standardom EBU (gdzie, przypomnę – wymogiem jest odgrywanie materiału na poziomie Integrated Loudness równym -23dB LUFS). Analogicznie, jeśli zaraz po naszej piosence miałby polecieć jakiś utwór, który został zmiksowany znacznie ciszej (powiedzmy muzyka klasyczna), gdzie poziom Integrated Loudness rejestrowałby się powiedzmy na -28dB LUFS, to głośność tego utworu zostałaby podniesiona o 5dB, żeby ujednolicić poziomy.

Dlatego, już tak na marginesie, dzięki wprowadzeniu takich obostrzeń, kwestia masakrowania utworów podczas masteringu, żeby brzmiały jak najgłośniej, przestaje mieć jakiekolwiek znaczenie, bo i tak wszystko będzie odtwarzane na tym samym poziomie, niezależnie od tego, jak głośno zostało zmiksowane, a w zasadzie, zmasterowane. I płyną z tego same korzyści – lepsze i naturalniejsze brzmienie, brak hiperkompresji i większy zakres dynamiki. I najważniejsze – koniec wojny głośności. Nie muszę chyba nikomu przypominać, że nieumiejętnie sprasowane kawałki podczas masteringu brzmią niefajnie. A jak dodamy jeszcze kompresyjną masakrę w trakcie emisji, to już w ogóle mamy do czynienia z pogromem jakiejkolwiek dynamiki w piosence.

Dobre wieści są takie, że platformy typu Spotify, YouTube, Vevo czy iTunes i wiele innych już mają zaimplementowany (bądź dają nam jako opcję) taki standard, dzięki czemu nie musimy sięgać po gałkę od głośności co każdy utwór. Ale wracając…

Zakres głośności

Częstym elementem, jaki spotkamy w miernikach LUFS jest także wskaźnik Loudness Range (w skrócie LRA), czyli zakres głośności, który po prostu pokazuje nam o ile dB LUFS zmienia się średnia głośność utworu na przesłuchiwanym fragmencie. Można to poniekąd porównać z zakresem dynamiki, ale to też nie do końca to samo. Tutaj mamy bowiem do czynienia z sytuacją, gdzie wartość LRA informuje nas o wahaniach postrzeganej głośności, ale ona jest podawana po odjęciu od obliczeń najbardziej skrajnych wartości. Mowa o krótkich, bardzo głośnych wyskokach poziomu (najgłośniejsze 10% sygnału), jak i o bardzo cichych momentach (najcichsze 5% sygnału), a także ściszeniach na końcu utworu, które mogłyby zaburzyć rzeczywisty wynik. Łatwo to sobie skojarzyć z systemem oceniania skoczków narciarskich, gdzie najniższa i najwyższa nota są odcinane, a ostateczny wynik oblicza się z pozostałych.

Podsumowanie

Bardzo bym chciał, aby standard LUFS i zalecenia opublikowane przez EBU stały się także ogólnie przyjętymi wytycznymi w świecie muzyki, ale wątpię, że to jakoś prędko nastąpi. Byłoby zapewne bardzo miło, gdybyśmy nie musieli się zamartwiać o to, czy nasz miks jest wystarczająco głośny oraz na pewno pozwoliłoby to na zachowanie zdrowszego rozsądku w kwestii zakresu dynamiki i prasowania utworów kompresją na potęgę. Może kiedyś taki dzień nadejdzie…

A inna rzecz, że jeśli nie pracujemy w telewizji czy radiu w UK czy USA, gdzie standard dostarczania wynosi odpowiednio -23dB LUFS i -24dBLUFS, to… możemy (przynajmniej na chwilę obecną) się tym absolutnie nie przejmować. A jeśli chcemy dostarczać materiały emisyjne do polskiej telewizji czy radia, to… musimy się konkretnej stacji dopytać o wymogi, bo, o ile mi wiadomo, istnieje tutaj nadal pewna rozbieżność i brak ujednolicenia. Niestety.

Mam nadzieję, że ten artykuł rozwiał wątpliwości ‘pajczura’ i raz jeszcze proszę o wybaczenie, że tyle czasu zajęło mi zabranie się za tę kwestię. Ale jak to mawiali Nadbałtyccy Górale z Wileńszczyzny oraz moja prześwietna siostra – co się odwlecze, to się dowlecze.

  1. Witam, bardzo serdecznie dziekuje za ten post. Przeczytalem go od razu jak tylko sie pojawil i bylem niezle podekscytowany i zaszczycony, zel wrecz mialem poczucie, ze byl bezposrednio do mnie zaadresowany 🙂 Taki samolub ze mnie 🙂
    Nie odpisalem od razu gdyz pojawilo mi sie kilka watpliwosci i chcialem je zebrac i jakos mi sie tak zeszlo.
    Moje pytanie jest takie: wciaz nie do konca rozumiem jak z tego kozystac? Tzn. czy zgodnie z tymi wytycznymi powinienem dazyc do tego, aby moj kawalek juz po masteringu mial poziom integrated Loudness LFSU na poziomie tych -23 dB? Czy istnieje jakis zloty srodek, w miedzy czasie cos gdzies mi sie przeczytalo, ze niby jest taki jakby zloty srodek, ale z tego co pamietam to on byl raczej gdzies w okolicach -12dB. Nie moge sobie przypomniec gdzie to wyczytalem, ale czy to jest jakas zwykla bujda? Czy rzeczywiscie jest jakis poziom, ktorego powinnismy, moze nie kurczowo, ale jednak sie trzymac?
    Jeszcze raz wielkie dzieki za post i pozdrawiam.

    • Jeśli chodzi o pubikowaną muzykę, to o ile mi wiadomo, w Polsce na razie standard ten nie jest wymogiem. Co do radia i tv – trzeba pytać konkretne stacje, bo różnie mają.

    • Te -12 dB DR utworów po masteringu to moim zdaniem faktycznie taki rozsądny ‘kompromis’ w miażdżeniu utworów. Dowodem tego jest choćby to, że najlepiej sprzedające się płyty miały właśnie podobny zakres dynamiki (rysunek w linku)

      https://2020k.files.wordpress.com/2012/03/the-loudness-wars.jpg

      Gdy utwór po masteringu będzie miał poziom -23 dB integrated LUFS to będzie raczej ‘cichy’. Standard EBU R128 został stworzony z myślą o radio i telewizji, aby odbiorca nie musiał co 3 minuty zmieniać głośności a w szczególności gdy zaatakują go reklamy.

Zostaw komentarz