Egy valódi digitális „végfok” és egy út az audio ösvényein

Úgy 8 évvel ezelőtt kérdezte Farkas Péter barátom, lehetne-e készíteni külső DAC helyett, direkt digitális végfokot? Digitális végfok alatt olyan teljesítmény erősítőt értett, amiben nincsenek karakterisztikával rendelkező erősítő elemek, vagy visszacsatolás, mint egy analógban. Tehát nem egy jel-erősítő, de mégiscsak szabályozható teljesítménnyel bíró végfokozat.

Ő olyan, nagy teljesítményű ellenállás létrára, vagy kapcsolt áramgenerátorra gondolt, ami egy kis jelű DAC-ban lehetséges. Az volt az elképzelése, hogy ilyet kellene építeni nagyobb teljesítmény leadásra, nem pedig analógban erősíteni utána. Ez már csak amiatt is dicséretes gondolat volt tőle, mert ő analóg erősítőket fejlesztgetett akkor már majd 15 éve. Egy versenyre hívtuk ki egymást: Ő analógban építi meg azt, amit legjobbnak vél, és én építek egy tisztán digitális végfokot, majd összehasonlítjuk. Így indult részemről a digit-végfok története.

Tehát a lecke fel volt adva, és én hamar rájöttem, hogy ami kis jelnél lehetséges, az nagy jelnél, erősebb teljesítmény leadás mellett felmelegedne, és nem tudná tartani a megcélzott CD minőséget, a 16 bit pontosságot… A kérdés tehát az lett: hogyan lehet akkor energetikailag kifejezni a PCM kódot?

Adódott a PWM technológia. Egy natív frekvenciájú (44.1kHz-en működő) PWM esetében, nagyjából 22us idő adott az impulzusszélesség maximális értékére. Nyilván technikai okok miatt célszerű ennél valamivel kisebbet választani, de a kalkuláció bemutatására vegyük ezt az értéket. Ha ez a 100%, akkor mennyi lehet a legkisebb lépés? Érdemes volt felismerni, hogy a 16 bit valójában nem is 16 bit, hanem +/- 15. Vagyis a legfelső bit tulajdonképpen a jel polaritását fejezi ki. Ezt műszakilag külön lehetett kezelni, és így emiatt „csak” 15 bites felbontású idő-lépcsőkre lett szükség. Ez 32768 elemi lépést jelentett a felépítésben.

Ha a 22us-ot felosztjuk 32768 lépésre, megkapjuk az elemi idő „kvantumot”, aminek az egész számú többszöröseit kell összeállítanunk, hogy megkapjuk a pillanatnak megfelelő időértéket (PCM – idő konverzió). Ez az érték nagyjából 670ps-re jött ki. Ez kivitelezni pedig már nem tűnt nekem lehetetlennek. Nagyjából féléves munkával sikerült is meghallani az első, ilyen módon készített hangot ami biztató volt! Aztán újabb fél év múlva már össze is volt szerelve az első proto-verzió. (Az elmúlt 10 év alatt összesen három verzió készült, mindegyikből egy-egy darab.)

Mivel nem volt alsó határfrekvenciája (DC-től ment), veszélyt jelenthetett volna a hangfalak számára, akár csak egy hibás wav-file miatt is, ezért ki kellett egészíteni DC védelemmel. Amikor ez is meglett, már el lehetett vinni ide-oda, meghallgatni jobb akusztikai körülmények között és hangfalakkal, mint amilyenek nálam voltak.

Vissza egy kicsit az elvhez: tehát ha a PCM kódot megfeleltetem területnek, akkor az arányos energiaként jelenik meg egy D-osztályú teljesítmény-kapcsoló kimenetén. Ez a terület egyik irányban az idő (a kód szerint változó impulzus szélesség), a másik irányban az amplitúdó, amit egy szabályozható tápegység ad a D-osztályú hídra. Ez a változtatható tápfeszültség a hangerő. (Kis feszültség = kis hangerő.) Tehát nincs bitmanipuláció, kis hangerőnél is a teljes eredeti bit-felbontás van jelen.

Az egész kulcsa a PCM-idő konverzió. El is neveztem akkor szép hangzatos névvel, ez az egység volt a „Time Converter”. (Annak, aki megkérdezné: nem, nem volt szükség a digit-végfokhoz fluxus kondenzátorra.) Ha a PCM - idő megfeleltetés bit-pontos, akkor az egész teljesítményben erősíteni vágyott hang-spektrum fázis-hibáktól, intermodulációs torzítástól, és egyéb analóg hibáktól mentesen kerül át a teljesítmény tartományba, és az eredeti minőségben hallgatható meg.

Van persze egy kis probléma még ebben a helyzetben.  Shannon mintavételezési törvénye értelmében, a kimenetre oda kellett volna tennem egy meredek alul-áteresztő szűrőt (20KHz-nél) a kimenetre, ami viszont elrontotta volna a létrehozott precíz fázist. Ez megengedhetetlen, hiszen akkor visszasüllyed a minőség csak hifizős szintre. (Akkor pedig mire volt ez a nagy igyekezet?)

Egy kis kitérő: szerintem mi a különbség a hifi és az audiophile hangzás-világ között?

A hifi megsimogat, (ha kicsi a torzítás és nincs nagy tonalitási probléma). Az audiophile (high-end) viszont képes megérinteni a lelket és a szívet. A cél pedig az lett volna, hogy a CD formátumból kihozzam azt a lelkesedést, amit akkor tettek bele, amikor készült. Persze, ha egy felvétel torz volt, akkor sajna az marad, ha viszont törődés, gondosság volt benne, akkor átjön, még az előadó lelke is.

Figyelj csak meg például egy századfordulós gépzongorát. Nincs energia árnyalás, minden hang egyforma erővel szólal meg. Mégis, ha nem kislányok, kotta alapján lyukasztották a mesterszalagot kézzel, hanem igazi zenész játszotta fel a lyukasztós-zongorával, akkor az idő hordozza a játszó lelkét és azonnal megérzed, hogy e mögött nem gép, hanem ember van.

Az idő és a pontosság a kulcs az eredeti hangspektrum megjelenítésében is. Ha szétcsúsznak a spektrumtartalmak az időben, akkor megváltozik a hangszín, más lesz a hangszerek, az énekesek hangja, szélsőséges esetben a zene lüktetésének csomópontjai is máshová kerülnek és egyáltalán nem lesz érthető egy karmester koncepciója, mert a produkció az elektro-akusztikus megjelenítő pontatlansága miatt szétesik.  Ez nagyon kicsi dolgok együtt-nem állásából fakad.

A fül-agy rendszer nagyon fázis érzékeny, és az eredeti akusztikus teret és eseményt képes újraépíteni a hallott hang alapján. Ha az információ torzul, akkor nem képes visszaállítani az eredeti történést, vagy nagy munka és fárasztó odafigyelni, nem élvezet. Ha pedig minden a helyén van, akkor elmerülünk a zenész eredeti intuíciójában, ami képes megjelenni (persze hozzá véve a zenei rendező, a karmester, és a technikai közreműködők stb. együttes munkáját is).

Mit lehet várni ettől a tisztán digitális megközelítéstől?

Eltűnnek a digitális-analóg átalakítás hibái, az analóg teljesítmény erősítők  jellemző hibái (néha persze keletkeznek újabb problémák, mint például a „dead-time”, de ez szerencsére szépen kezelhető a legújabb gyors FET-ekkel). Amikor a hangszerek és az énekesek egyszerre, egymás melletti kicsi és nagy hangerőn szólnak, nem nyomják el egymást, nem oldódnak fel egymásban, hanem egymástól függetlenül, külön-külön tisztán hallhatóak, jól elkülönülnek.

A fázishelyesség miatt a színpadon a hangszerek, énekesek helye nem változik és lehet érzékelni a méreteket, néha még a feltűnőbb mélységi távolságát is. Életszerű képet kapunk, ami nagy élmény! Ha nagyobb a hangerő, akkor egy analóg erősítő el kezd „szenvedni”, mert a dinamikai maximumoknál erősebben görbül az átviteli karakterisztikája. D-osztályú esetében ilyen probléma nincs: nagyobb hangerőnél csak a hangfal tulajdonságai korlátozóak, nem pedig a végfoké.

Ha a hangfal és a lehallgató helység (visszhang, verődések, rezonanciák) bírja nagy hangerőnél, torzítás és erős visszhang okozta problémák nélkül, különleges élményben részesít minket egy ilyen erősítő. Koncert élményt lehet átélni. (Egy zongora felerősítése, ami természetellenessé is válhat, persze nem fog eufórikus élményt okozni. De egy nagy vegyeskar, mondjuk orgonával, hárfával kísérve, hát az megrezegteti a lelket is, nem csak a testünket. Például: Sampler Volume2 Reference Recordings , /5/ Rutter : „Lux Aeterna” from Requiem. Vagy egy orgonamű, ami eredetileg is hangos volt, nagy térben.)

Az első Digit-végfokom csak USB-ről ment, és egy kis lejátszó programmal wav-al táplálkozott. A második verziónak már kétféle bemenete is volt: USB és SPDIF. A harmadik verziót nagyjából hat évvel ezelőtt készítettem el. Ez két SPDIF bemeneten fogad jeleket. Ebben már volt egy jelentős változtatás: lineáris interpolációval ---- ( A+B) / 2 ---- a 44.2KHz-es 16 bites wav-ból 88.2KHz-es , 17 bites jelet készítettem és négyszer finomabb időfelbontás (kb. 170pS) lépcsőt kellett használni. A 88.2KHz-nek köszönhetően nem kellett szűrőt alkalmazni, mert nem volt a hallható tartományba eső keverési komponens a mintavételi jel és hangjel-tartalom miatt. A hangja kitisztult, megmaradt a precíz fázis, ráadásul finomabb felbontásban. Nem hiszem, hogy egy jó CD felvétel esetében könnyen meg lehetne mondani, hogy most sima CD-t hall, vagy valamilyen HD audio felvételt.

A jövő

Szerintem a közeljövőben azzal fogok foglalatoskodni, hogyan lehet a passzív keresztváltókat eltüntetni a hangfalakból, helyette pedig digitális keresztváltókat építeni, minden hangszóró előtt saját végfokkal, digitális átvitel korrekcióval, amihez kisebb teljesítményű erősítők kellenek majd, igaz legalább 6 darab, vagy 8, de jobb minőségűek, mint a mostaniak általában. (És itt most persze nem surround-ra gondolok, csak a kétutas sztereóra, ez a 7+1-nél még szorzódni fog…)

Ezzel olyan megvalósítás érhető majd el egy megfelelően kezelt akusztikájú, de otthoni helységben is, mint ami korábban csak egy drága stúdióban volt lehetséges.

Távolabbi jövő

A síkhullám leképezése történik most a mikrofonokkal. Lehetőség nyílik majd a térbeli hullámok rögzítésére és visszajátszására is, és ezzel megközelítőleg igazi valóságélmény lesz elérhető. Remélhetőleg nem lehet majd megkülönböztetni a jó felvételt, az ott helyben játszó zenész produkciójától.

Melléklet

Volt szerencsém részt venni idén Csobánkán, a Szabó Zoli által rendezett erősítő és DAC meghallgatáson. Ott kiváló akusztikájú helységben hallhattam után-épített csöves végerősítőt is, aminek nagyon szép hangja volt. Mondtam is magamnak: ha a basszusok a csöves erősítőknél megfogottabbak lennének, (azt az alacsony impedanciát ott nehéz technikailag megvalósítani) akkor azt a hangkaraktert is teljesen jónak tartanám, amivel boldogan együtt lehet élni. Sajnos egy idő múlva a túl sok (szép tiszta), de úszó basszus hangba belefulladtam, mint a légy a mézbe… (Bár van, aki épp ezt szereti benne.)

Egy másik tapasztalatom a Core Audio-nál: az ott fejlesztett PC-s analóg-tápos zeneszerver, DAC, és analóg nagy teljesítményű mono-blokkok, mindez tisztított, összeszinkronozott órajellel, minden akusztikus igényemet kielégítette. Sajnos ez viszont már túlmegy a pénztárcám lehetőségein, ráadásul külön zenehallgató helységet is igényelne. Emiatt számomra egy szép, referencia értékű tapasztalat marad, de nem választható alternatíva.

Négy éve jártam a Müncheni HiFi show-n is. (Különös volt látnom ott a KáCsa Audio-t, a bejárat közelében. Egy kis műhelyt rendeztek be, és kívánságra ott helyben meg lehetett rendelni kábeleket, majd egy-két óra múlva vissza lehetett jönni a kész termékért. Hát így is lehet csinálni. Élmény volt ezt látni. Akkor ott hangfalakat kerestem, mert szerintem az a leggyengébb része a hangrendszereknek, és szerettem volna tudni, azok a darabok, amik számomra elérhetetlen árban vannak, mit tudnak, hogy ennyire drágák? (Az egyik – Lanche termék – 300 000 Euro volt…)

Volt olyan is, hogy nagyon sokat: 20 ülésnyit (nem csak egy fókuszban!!!) tudott egyenletesen ellátni olyan dinamikával, neutralitással, nagy energiával, szuper alacsony torzítással! Ez jobb volt, mint amit ez előtt néhány perccel korábban meghallgatott, a világ egyik legjobb fejhallgatójának tartott elektrosztatikus STAX produkált. Pedig százszor könnyebb jó hangot csinálni a fül hallójárataiban közvetlenül, mint egy nagy térben, több méterre a fültől…

Mindenkinek kellemes hangokat kívánok: törő