Harmoniczne i Zamiana Audio na MIDI – Pytania od Czytelników

Dzisiaj dalsza część artykułu, który „nieco” się ostatnio rozciągnął przy okazji omawiania sposobów na zwiększenie wydajności komputera podczas pracy z dźwiękiem (kogo ja chciałem oszukać myśląc, że zmieszczę coś więcej niż omówienie tej jednej rzeczy w całym wpisie…?)

W poniższym tekście postaram się w miarę jasno odpowiedzieć na 2 kolejne pytania związane z technikami i możliwościami pracy w środowisku DAW. A wkrótce poznacie odpowiedzi na dwa następne (i ostatnie, póki co) pytania.

Potem, na jakiś czas dam Wam odsapnąć od tego typu wpisów i zajmiemy się czymś innym. Zobaczmy więc, z czym zmierzymy się dziś…

Na pierwszy ogień idzie pytanie zadane przez Grzegorza, który chciał się dowiedzieć:

I. Jakie są sposoby na generowanie harmonicznych sygnału oraz jaki jest ich wpływ na czystość miksu oraz balans pasmowy.

Bardzo dobre pytanie!

Jest kilka sposobów na to, aby wzbogacić sygnał harmonicznymi (czyli wielokrotnościami częstotliwości fundamentalnej). One zwykle powstają albo w wyniku rzeczywistego przesterowania sygnału (np. przeładowując któreś z urządzeń w torze audio, powiedzmy preamp lampowy albo kompresor) albo w wyniku zastosowania wtyczek (i tutaj królują te symulujące sprzęt analogowy, bo cyfrowe przesterowanie najlepiej nie brzmi).

Jeśli chodzi o pierwszy przypadek (realnego przesterowania powiedzmy preampa), to pisałem o tym niedawno przy okazji omawiania poziomów nagrania W TYM ARTYKULE (akapit pt. Poziomy nagrania a zewnętrzny preamp). Polecam sprawdzić. A dla leniwych – w wielkim skrócie wygląda to tak, że podczas nagrania bardzo mocno wysterowujemy czułość zewnętrznego preampa, ale zmniejszamy poziom na wyjściu, żeby nie przeładować kolejnego urządzenia w łańcuchu, czyli zwykle wejścia interfejsu (bo to by poskutkowało pojawieniem się nieprzyjemnego clippingu).

Co do drugiej metody, to zasada jest mniej więcej ta sama, ale nie wymaga posiadania zewnętrznych klocków, bo jest mnóstwo wtyczek, które mogą wprowadzić do sygnału harmoniczne. Będą to różnego rodzaju plug-iny symulujące taśmy (od McDSP, Waves, Slate Digital) symulujące lampy (od SPL, Antares, Softube), niektóre kompresory (np. protoolsowy Smack!), czy efekty (od SoundToys) lub jeszcze inne. Cały proces polega zwykle na podkręceniu jakiejś jednej gałki. Ot, cała filozofia. Klucz jednak tkwi w odpowiedniej ilości tegoż procesu, jego nasilenia względem oryginalnego brzmienia (bo przedobrzyć też się da).

Masa jest wtyczek, które mogą spełniać rolę generatorów harmonicznych. Niektóre z nich są wyłącznie do tego celu przewidziane, a inne mają taką funkcjonalność wbudowaną niejako pobocznie. Moimi faworytami z tej kategorii są Sonnox Inflator (ten działa trochę na zasadzie excitera) oraz efekty od SoundToys, które oprócz tego, że same w sobie są niezłą kopalnią dobrze pojechanych brzmień filtrów, phaserów, auto-pannerów i innych, to każda z nich może dać nam bardzo przyjemnie brzmiące przeładowanie sygnału – wystarczy mocniej podkręcić gałkę Input.

Mało tego, jeśli uznamy, że taka konfiguracja daje nam za mało, to można również wprowadzić w stan przesterowania sygnał na wyjściu (w przypadku SoundToys) i tym sposobem uzyskać bardzo mocno nasycone brzmienie. Dodatkowo, dostajemy do wyboru kilka różnych typów (algorytmów) generowania harmonicznych – od czysto cyfrowego (ale stonowanego) clippingu, przez tłuste nasycenie niskich lub wysokich pasm i kilka innych, aż po hiper-kompresję.

Każdy z tych wariantów brzmi oczywiście inaczej (i naprawdę świetnie), co jeszcze bardziej utwierdza mnie w przekonaniu, że ta (niegdyś) ogromna przepaść pomiędzy „czystą i zimną” cyfrą, a “ciepłym, nieprzewidywalnym i nieliniowym” analogiem zmniejszyła się do rozmiaru mózgu gołębia europejskiego.

Tak, jak wspomniałem, są również wtyczki, które służą tylko nasycaniu sygnału harmonicznymi (jak darmowy Ferric TDS czy Softube Saturation Knob). Są one równie proste w obsłudze i dają nam możliwość przesterowania wybranych zakresów częstotliwości lub całości liniowo – różne mogą być kombinacje z różnym poziomem możliwej ingerencji.

No dobrze, ale dość o sposobach uzyskiwania harmonicznych, pomówmy o drugiej części pytania, czyli o tym

Jak proces dodawania ich do sygnału wpływa na miks i jego balans pasmowy?

Wyczuwam, że Grzegorz obawia się trochę sytuacji, w której wygenerowane, dodatkowe częstotliwości zaburzą mu wypracowaną do tej pory równowagę między pasmami, stąd ta część pytania. I choć rzeczywiście dostajemy po takim procesie zastrzyk elementów, których wcześniej w miksie nie było, to o ile przeprowadzimy ten proces z wyczuciem, nasz utwór (i balans) jakoś na tym zbytnio nie ucierpi, wręcz przeciwnie – możemy sporo zyskać. Ale czy to oznacza, że możemy dodawać harmonicznych ile tylko chcemy bez żadnych konsekwencji? Co to, to nie. Jak ze wszystkim – umiar jest wskazany. Poza tym, nie każdy ślad takiego zabiegu potrzebuje. Inna rzecz, że jak przesadzimy, to naprawdę zacznie nam się zaburzać ten balans.

I tutaj mała Dygresja (z dużej litery, bo jak bym się urodził dziewczyną, to bankowo miał(a)bym tak na drugie…)

Chciałem tu nawiązać do pewnej kwestii, która jest dość blisko związana z przesadnym użyciem lampowej saturacji. Spotykam się bowiem z pytaniami o to, czy do mikrofonu lampowego trzeba dokupić preamp lampowy, żeby mieć ten „legendarny i tłusty” sygnał. Kupić oczywiście można, ale nie trzeba. Mało tego – nie polecam, a wręcz odradzam. A już w szczególności zabraniam, gdy obie te zabawki mają być z niższej półki cenowej. Ja wiem, że młodym raperom się to nie spodoba, ale musicie sobie to dobrze wbić do swoich pełnych fantazji głów – pierwszy lepszy pojemnościowy „chińczyk” za kilkaset złotych w połączeniu z budżetowym preampem „lampowym” za 200zł (celowo nie wymienię firmy) to jest NAJGORSZA kombinacja, jaką możecie sobie sprawić (pomijając oczywiście nagrywanie hot-dogiem czy jakimś mikrofonem do Skype’a).

Prawda jest taka, że albo wprowadzimy bardzo dużo szumów i nieładnych zniekształceń z taką kombinacją (w sytuacji ekstremalnej) albo sygnał przesycimy harmonicznymi (bo przejdzie przez 2 etapy saturacji – a to zdecydowanie za dużo). Dołóżcie do tego nieładnie podbitą górę w najtańszych mikrofonach pojemnościowych i macie receptę na syczący i kłujący w uszy wokal, z którym będziecie się później musieli sporo napocić, żeby jakoś sensownie zabrzmiał…

No, ale wróćmy. Co dzieje się z pasmem po wygenerowaniu harmonicznych?

Będzie to oczywiście zależne od tego, na jakiego rodzaju ścieżce to zastosujemy, bo co innego stanie się po przepuszczeniu przez jakąś formę saturacji ścieżki basu, a co innego stanie się ze ścieżką wokalu czy jakiejś grzechotki… Harmoniczne generowane są „do góry”, czyli od częstotliwości fundamentalnej wzwyż.

Dlatego, jeśli zastosujemy ten proces na naszym przykładowym shakerze (u którego informacji w dolnym paśmie szukać nam próżno), to nie zaburzy nam to w żaden sposób balansu w całym utworze, bo jedyne, co się stanie, to pojawi się odrobina dodatkowych informacji w najwyższych częstotliwościach, co z kolei pomoże takiej grzechotce chociażby w podkreśleniu transjentów i lepszej prezencji na tle innych śladów.

Jeśli jednak weźmiemy na warsztat bas i dodamy mu harmonicznych bazując na częstotliwościach z okolic powiedzmy 60-90Hz i zrobimy to z rozwagą, to ustrzelimy 2 sztuki zwierzyny jednym pociskiem (tak, to jest możliwe, widziałem filmik…). Mianowicie:

    • Sprawimy, że bas będzie lepiej słyszalny na mniejszych głośniczkach, które nie są w stanie odtworzyć niskich częstotliwości, a harmoniczne w znacznym stopniu tu pomagają (i co najważniejsze, nie podbijamy korektorem dołu, co tylko zapchało by headroom, a i tak nie pomogłoby w lepszej słyszalności basu np. na laptopie.)
    • Uzyskamy tłustsze i masywniejsze brzmienie bez konieczności sięgania po korekcję w dolnym paśmie. Nasz mózg, to tak zaawansowany produkt, że potrafi na zasadzie identyfikacji harmonicznych bez problemu wmówić nam, że słyszymy więcej basu, niż w rzeczywistości go słyszymy i momentalnie „usłyszeć” częstotliwość fundamentalną (mimo, iż ta może być w ekstremalnych przypadkach cichsza niż wygenerowane harmoniczne…)

I to chyba tyle w temacie…

Grzegorzu – stosuj z rozwagą (szczególnie uważaj z basem, bo tu bardzo łatwo przesadzić) i nie przejmuj się aż tak kwestią zachwiania balansu, bo dopóki działasz z głową – nic mu nie grozi, a czystość ścieżek (mimo, iż zostanie lekko zachwiana dodaniem dodatkowych częstotliwości) zamienia się poniekąd na ich lepsze prezentowanie się w zderzeniu z resztą miksu.

Teraz czas na kolejne pytanie.

Autorem tego jest Jarek, który pytał o:

II. Sposoby zamiany realnej perkusji na ścieżki MIDI

Tak, dobrze przeczytaliście, zamieniamy Audio na MIDI, a nie na odwrót. Powód jest tu dość prosty – Jarek chciałby, aby zostało zachowane oryginalne wykonanie perkusisty (które zostało nagrane na śladach audio), tylko, że planuje użyć własnych sampli w wave’ach. Można też oczywiście podłożyć brzmienia próbek z jakiegoś romplera (wtyczki symulującej zestaw perkusyjny) – to już jak kto woli. Obie metody mają plusy i minusy, ale proszę zauważyć, że są to tylko dwa sposoby radzenia sobie z taką sytuacją, a istnieje jeszcze jeden (moim zdaniem najlepszy), ale o nim za chwilę.

Najszybszym sposobem na wygenerowanie MIDI ze śladów audio jest skorzystanie z jednej z poniższych wtyczek (niestety nie znam darmowych odpowiedników):

    • Massey DRT 2
    • Slate Trigger
    • Toontrack Drumtracker

Dwie pierwsze służą wprawdzie do podmieniania brzmień w czasie rzeczywistym (to jest ten trzeci, moim zdaniem najlepszy sposób), ale do zastosowania, o jakim mówi Jarek, też spokojnie się nadadzą.

Każda z tych wtyczek (po uprzednim przeanalizowaniu) jest w stanie wygenerować dla nas plik MIDI ze ścieżek perkusyjnych i to bardzo szybko. Nam pozostaje już tylko podstawić te ścieżki do wirtualnego perkusisty, albo załadować do dowolnego samplera wtyczkowego odpowiednie próbki dźwiękowe, które będą wywoływane komunikatami MIDI z nowopowstałych śladów.

Nieco inna opcja, to ręczne podstawienie wave’ów na podstawie zgodności czasowej z widocznymi komunikatami MIDI – czasochłonne, ale też skuteczne. Poza tym, będziemy musieli w takim przypadku dopasować też głośność poszczególnych uderzeń, żeby jak najwierniej oddać prawdziwy sposób gry perkusisty.

I to jeszcze nie koniec trudności – trzeba rozróżnić, czym jest mocne uderzenie powiedzmy werbla, ale odtworzone cicho, a czym jest lekkie uderzenie werbla, ale odtworzone głośno. To dwa zupełnie inne światy dające nam totalnie inne wyniki. Dlatego ta metoda, choć jak najbardziej używana, będzie skuteczna tylko w sytuacji lekkiego podrasowania istniejących już bębnów (kiedy różnica między ‘velocity’ a ‘volume’ nie ma aż tak wielkiego znaczenia).

A mój ulubiony sposób, to po prostu skorzystanie z któregoś z narzędzi do podmiany brzmień – w moim przypadku jest to Trigger. Dlaczego? Bo działa w bardzo prosty sposób, ma pokaźny zasób brzmień, można samemu rozbudowywać biblioteki tych brzmień (Slate dodaje do instalatora narzędzie do zamiany wave’ów na format, który czyta Trigger), można podstawić kilka różnych brzmień pod każdy element zestawu, wszystkie próbki są zawsze zgodne fazowo i co najważniejsze  – Trigger oprócz bardzo dobrego bloku detekcji, bez problemu odzwierciedla każdy niuans związany z dynamiką gry perkusisty.

Oznacza to, że jeśli wtyczka analizuje ślad werbla, a pałker grał raz lżej, a raz mocniej, to wszystkie te różnice są uwzględnione podczas aplikowania podmienionych brzmień i co nie mniej ważne (przede wszystkim dla Jarka) – te różnice są także widoczne w pliku MIDI (jeśli takowy zdecydujemy się wrzucić na osobny ślad). W praktyce oznacza to mniej więcej tyle, że dzięki Triggerowi możemy w okamgnieniu mieć świetnie brzmieniowo bębny, ale z oryginalnym zachowanym wykonaniem perkusisty (pod względem dynamiki, rytmu, stylu i siły uderzeń). Słowem – miód.

I jak zawsze konieczne sprostowanie – wiadomo, że w sytuacji idealnej i kiedy dążymy do możliwie najbardziej naturalnego brzmienia, powinniśmy korzystać z rzeczywistego nagrania z oryginalnym brzmieniem. Ale nierzadko zdarzy się, że wykonanie będzie świetne, ale uzyskane brzmienie trochę słabsze. Wtedy moim zdaniem warto nieco mu dopomóc omówionymi metodami. Może nie koniecznie skłaniałbym się ku totalnej podmianie brzmień, bo to może czasami zabrzmieć zbyt sztucznie, prędzej podchodziłbym do sprawy na zasadzie lekkiego podrasowania dodatkowymi próbkami zarejestrowanego brzmienia.

Podsumowanie

I tyle na dzisiaj moich odpowiedzi na Wasze pytania. Czeka nas jeszcze jedna seria „Pytań od Czytelników”, która pojawi się niebawem i opowiem tam m.in. o dość ciekawym sposobie pracy wirtualnej, o którym nie wszyscy wiedzą, a którego twórcy zasługują co najmniej na jakąś prestiżową nagrodę czy inny weekend w Vegas z Megan Fox 😉

Zostawić komentarz ?

17 Komentarze.

  1. Odniosę się do 2 cześci artykułu. Bardzo skutecznym programem do tego typu rzeczy, czyli zamiany audio na midi jest Melodyne od Celemony. Bardzo często ten program jest dodawany w wersji essential przy zakupie DAWu. Z każdego pliku audio wyciągnie midi czy to wokal czy to jakiś drumloop, a trwa to z 5 sekund może ciut dłużej w zależności od długości ścieżki audio 🙂

    • Też go kiedyś próbowałem w ten sposób używać i o ile na jakichś prostszych i bardziej rytmicznych rzeczach się rzeczywiście jakoś tam sprawdzał, to niezłe były kwiatki przy próbie przerzucenia partii basu na MIDI – nie, żebym miał powód to robić, tak chciałem sprawdzić z nadmiaru czasu 🙂 A tak serio, to podobną funkcjonalność ma również Tune od Waves.

  2. Jeśli chodzi o audio-> MIDI to świetnie działa nowy algorytm w Ableton Live 9. Zamiana audio na midi w 3 trybach, drums, melody, harmony w zależności od tego co chcemy zamienić. Działa to tak dobrze, że czasami wystarczy, że sobię zanucę melodię która mi chodzi po głowie. Przeciągam to przez ten algorytm i mam gotowe midi, na które wpinam co tylko chcę. Mam dokładnie to co nuciłem, ale w midi do edycji. Jeśli są tutaj użytkownicy Live’a to polecam.

    • Przyznam, że brzmi interesująco.

    • tomkultury

      Dokładnie tak, można też nagrać beatbox i przerobić na ścieżkę midi co czasem bardzo pomaga.

  3. No i Jarek jest zadowolony. Temat nakreślony. Dzięki za odpowiedź.

  4. Fajnie by było gdyby temu Triggerowi wystarczyła suma bębnów do rozpoznania. Ja używam perkusji midi która zawsze pozostawia wiele do życzenia pod względem artykulacji i techniki gry.A tak wystarczyłoby zebrać wszystko jednym jakimkolwiek mikrofonem , zapodać maszynce i vualà!

    • Trociniak

      Na technikę gry nic nie poradzisz, ale raczej wszystko, co nagrasz możesz później dopieścić w piano rollu tak, że będzie jak żywe 😀

  5. Przypomniałem sobie że Reaper posiada wtyczkę trigger. Nie jest to Slate, ale po wyszukaniu zagranicznych tutoriali widać, że służy również podmianie audio w midi. To tak w ramach uzupełnienia tematu. Nie bawiłem się dotychczas tym, ale z tego co na yt można zobaczyć da się coś tym ciekawego stworzyć.

  6. Kiedyś chciałem sprawdzić programik, jakiś darmowy radzieckiej produkcji który niby zamienia audio na midi. Chciałem użyć gitary elektrycznej do nagrywania ścieżek basu w midi bo wydawało się wygodniejsze. Co uzyskiwałem to zlepek różnych nut, oczywiście niby brzmiało to podobnie ale trzeba było jeszcze dużo edytować, nie był w stanie wyłatać pojedynczej nuty, łączył kilka jednocześnie i trzeba było samemu wybierać która jest dobra. Stwierdziłem że klawiatura komputera jednak będzie lepsza :)Widzę że technika poszła do przodu, jarek dzięki że podpowiedziałeś o Reaperze i tej wtyczce, trzeba to sprawdzić.
    Psss jakby co to iZotope wypuścił darmowego e-booka o mixie, 70 stron, niestety po angielsku.
    link:
    http://downloads.izotope.com/guides/iZotope-Mixing-Guide-Principles-Tips-Techniques.pdf

    • Dzięki wielkie za cynk o e-booku, Przeczytałem wstęp i zapowiada się ciekawie. 🙂 Jak ktoś zna angielski na poziomie średnim/średnio-zaawansowanym to powinno się gładko czytać, można się ewentualnie wspomóc słownikiem. 😉

  7. To znowu ja 😈 muszę to napisać bo to rzecz godna uwagi,mam nadzieję, że się nie powtórzę i że nie było jeszcze na blogu (z tego co widziałem to nie). Znalazłem wtyczkę która trenuje słuch realizatora dzwięku, jest darmowa nazywa się Free ear Training VST. Zapinamy ją na dowolnym kawałku, może to być, wasz lub komercyjny. Wtyczka zmienia pasmo częstotliwości a my musimy wskazać które to pasmo. Zakres częstotliwości można zmieniać, na początek ciężko jest operować na całym spektrum lepiej sobie wybrać mniejszy zakres i wyłapywać różnice. Możemy ustawić sobie jak bardzo słyszalne mają być to różnice. Zabawa przednia, 15 minut dziennie z tą wtyczką i po roku powinien być wyraźny progres 🙂 Przydało by się teraz coś do ćwiczenia kompresji 😛
    Link do wtyczki jest w opisie do filmu:
    http://www.youtube.com/watch?v=Q94XTbz60gY
    Igor warto byłoby ją dodać do linków z darmowymi wtyczkami 🙂

    • Ktoś już chyba o niej (lub o podobnej) kiedyś wspominał przy okazji TEGO wpisu o treningu słuchu i genialnego Mr. Soundmana (sprawdź go). W każdym razie, dorzuciłem już Tune od earPlugins do spisu darmowych plug-inów.

  8. Faktycznie już było wspomniane w komentarzach. Co do Mr. Soundmana to oczywiście że mam, zaraz po napisaniu komentarza wczoraj zacząłem szukać podobnych wtyczek jak Tune. Mam wersję darmową, może kiedyś postaram się o wersję Premium 🙂 Warto korzystać z obu wtyczek, mnie te próbki w Mr Soundmanie nieco drażnią, on działa jak samodzielna aplikacja. Jak zapniemy Tune na śladzie, możemy uczyć się na kawałkach które lubimy. Dzięki za wrzucenie linków 🙂

    • Słuszna uwaga. Ale Soundmana można też użyć jako wtyczki, nie tylko standalone 🙂 Fakt, próbki bywają monotonne, ale w wersji Platinum jest tego znacznie więcej (ponad 100 próbek) i można też ładować własne.

  9. doktorsamuel

    Aż muszę poszukać darmowej wtyczki do przerabialiśmy audio na midi

Zostaw komentarz