Natuke teooriat MP3-e kohta

Suhtleme (heli + pilt) + auto teemadel...
Vasta
Nakataja
Postitusi: 397
Liitunud: R Dets 10, 2004 10:17
Asukoht:
Auto:

#1

N Nov 24, 2005 22:13

Olen ammu tahtnud kirjutada natuke sel teemal, kuna tundub, et ega inimesed teagi mis asi see MP3 on. See jutt ei ole päris omast peast välja mõeldud, vaid üritan teha kokkuvõtet soome HiFi Lehti 6-7/8 2005 numbrites avaldatud artiklitest.

Audio ja video signaalide digitaalne pakkimine sai alguse juba 70-ndate alguses, kui hakati üritama kinofilme digitaalsel kujul salvestama. Kuid kohe saadi ka aru, et ilma signaali pakkimata ei mahu see ühelegi andmekandjale ära. Sealt sai siis asi alguse ning 90-ndate alguses esitlesid Sony ja Philips esimesi kodukasutajatele mõeldud helisignaali pakkimis süsteeme. Philipsi Pasc- ja Sony Atrac süsteem kasutasid kodeeringut, mille tulemusena säilis vaid 20 protsenti alginfost. Mõlemad süsteemid põhinesid inimkõrva omaduste ärakasutamisel. Lahendus tundus toimivat suurepäraselt ning mis kõige tähtsam - võideti ju juurde kuni 80% salvestusaega.
Millel kodeerimine põhineb?
Kodeerimine põhineb inimeste aistmismeelte tundmisel. Kui me teame kui hästi inimene kuuleb või näeb, siis on võimalik ära jätta sellist teavet, mida me ei kuule ega näe. Kui inimkõrv filtreerib igaljuhul osa infot ära, siis miks mitte lasta teha see töö ära arvutil.
Teoreetiline põhjendus aju ja kõrva koostööle on selline, et kõrva kuulmisala jaguneb nn. kriitilisteks aladeks. Need on sellised sagedusvahemikud, kus kuulmismeel ei oska korralikult eristada kahte erinevat heli teineteisest. Lisaks peidab sellises alas tugevam heli, samasse alasse sattuvad nõrgema helid, mida kutsutakse peitenähtuseks. Just seda nähtust kasutataksegi ära erinevates säästukodeerimis süsteemides.
Heli säästukodeerimise uus laine saabus koos interneti levikuga 90-ndate lõpus.
MP3 ehk Mpeg Audio Layer III sai alles siis üldiseks muusika pakkimis formaadiks. Samas vähesed teavad, et mp3 standard loodi juba aastal 1992 Moving Pictures Expert Group nimelise firma poolt. Nende ideeks oli nii video kui muusika pakkimine cd-tooriku poolt pakutavale mahule, mille jaoks loodi standard MPEG-1.
MPEG-standardi teeb huvitavaks selle “tegutsemisvabadus”. Nimelt määrab standard ära milliste tulemusega peab mp3-koodeks hakkama saama heli pakkimisel, kuid ei sätesta kuidas seda tuleb täpselt teha. Seda võiks võrrelda tööriista kastiga, mille küljele on kirjutatud milline peab lõpptulemus olema, samas mis tööriistu selleks kasutatakse on juba tegija enda valida.
Heli kvaliteedi kohalt on selline “tegutsemisvabadus” osutunud väga heaks teguriks. Parimad tänapäeva mp3-kodeerijad võimaldavad teha juba nii head “jälge”, et pakitud muusika eristamine originaalist on päris raske või isegi võimatu. Tundub ju uskumatu – eriti teades, et heli pakkimisel on hävitatud kohati kuni 90 protsenti infost.
MP3-le lisaks enim kasutatavad säästukodeerimis formaadid on Dolby Digital (ac-3), DTS, AAC, WMA9 ja mingil määral ka Ogg Vorbis. Nendest kaks esimest on peamiselt kasutusel vaid dvd-salvestiste surround heli pakkimisel ning tuntud kõigile dvd-filmide traileritest ja plaadiümbristelt.
Heli pakkimisest tekkivaid vigu on väga raske kuulda ja mõõta. Samas kui me teame täpselt millele kuulamisel tähelepanu juhtida, siis on vead suht lihtsalt tuvastatavad. Samuti ei pruugi me kuulda vigu korraliku koduse HiFi süsteemiga, kuid samas odavate arvuti kõrvaklappidega on kõik kuuldav. Põhjus selles, et ruumis peegeldub heli ka seintelt ja mööblilt ning need heli peegeldused peidavad vead ära. Vigade kuulmist vähendavad ka muud välised tegurid nagu näiteks mootori ja maantee müra autos.
HiFi Lehti tegi ka erinevate helipakkimis programmide testi. Test seisnes selles, et viiel inimesel lubati valida välja 5 lemmik muusikapala originaal plaatidelt ning need lood kopeeriti täpselt sama bititäpsusega (bitrate) arvutisse. Seejärel salvestati need lood kindlas järjekorras plaatidele tagasi. Salvestamiseks kasutati kvaliteetseid cd-toorikuid (Verbatim) ja väga kvaliteetset Yamaha Audiomaster kirjutajat.
Võrreldavad süsteemid olid PCM ehk algupärane cd (44.1kHz, 16Bit, Stereo), AAC (iTunes 4.8), MP3 (Lame 3.96.1), OGG (Ogg Vorbis AoTuVb3) ja WMA (DBPowerAmp r.11,WMA9.1 Standard). Pakkimisel kasutati 128kb/s bitrate`i.
Plaatidele pandi kõigile esimeseks looks originaal pakkimata versioon ja seejärel juhuslikus järjekorras erinevad pakitud versioonid. Kuulajad pidid panema kõikidele lugudele hindeid 10 punkisüsteemis. Samuti teadsid testijad, et esimene lugu on originaal (pcm), mille järgi nad teisi võrdlema peavad.
Tulemus oli üllatav. AAC formaat sai kõige paremad punktid (8,1), kui samas originaal PCM versioon jäi teiseks punktidega (8,0). Kolmandale kohale tuli OGG puntidega (7,4), neljandaks jäi MP3 (6,8) ja viimaseks viiendaks jäi WMA (6,5).
Enamus testijaid tõdesid, et väga raske oli kohati eristada lugusid kvaliteedi järgi ning vaid teadlik vigade otsimine kuulamis protsessis võimaldas leida erinevusi.
Kokkuvõtteks võib õelda, et kindlasti ei ole pakitud heli 128 kb/s bitrate`ga alati sama hea kui cd- heli. Samas tuleb aga tunnistada, et heli pakkimine toimib suurepäraselt ning see on tihti arukas võimalus säästa salvestusruumi ilma, et kuulamisnauding oluliselt väheneks.

Jutt sai pikk (äkki pikim siin foorumis :)) aga loodetavasti ka hariv.
triibutu
Postitusi: 432
Liitunud: T Dets 14, 2004 17:55
Asukoht:
Auto:

#2

N Nov 24, 2005 23:03

Siia täpsustuseks niipalju, et Moving Pictures Expert Group ei ole "firma", vaid rahvusvaheline ISO/IEC töörühm, kuhu kuulub üle maailma päris palju eri ettevõtete esindajaid.
tarmiit
Saabiklubi liige
Postitusi: 392
Liitunud: K Juul 28, 2004 23:45
Asukoht:
Auto:

#3

N Nov 24, 2005 23:33

see on nii tark jutt,et peab seda poisile ja tema kamraatidele ludeda andma!!:notworthy:
See juba viimased pool aastat kuum teema,tähtis on ,et oleks MP3,pole ju oluline,mis ja mida see tähendab....MP3
Puidust toodete valmistamine eritellimisel: http://www.isoptera.ee/
tarr
Postitusi: 42
Liitunud: N Veebr 26, 2004 15:34
Asukoht:
Auto: XC70

#4

R Nov 25, 2005 0:45

Vada 5 inimest on ikka liiga väike grupp, et sellest mingeid statistiliselt olulisi järeldusi teha (välistada 95% tõenäosusega tulemuste juhuslikku viga). Kui veel rohkem karva poolitada, siis peaks uuritavate grupi omaduste (vanus, sugu, kuulmistervaus jne.) keskmised olema võrreldavad sihtgrupi keskmistega.

(no sain ka tarka panna öösel):eureka:
Cyber
Täiesti Mõttetu Mölaööbik
Postitusi: 14295
Liitunud: K Mär 03, 2004 9:25
Asukoht: Tallinn
Auto: 9000 '96, V70 '03
Kontakt:

#5

R Nov 25, 2005 8:30

Koodek on siin asja juures väga tähtis. LAME ja Fraunhofer kõlbavad, ülejäänu on põhk üldiselt. Mingi hetk ma uurisin neid erinevusi ja sattusin mingi mehe tehtud võrdluste peale. Sama lugu erineva koodekiga üle lastud ja siis oli saadud asjast miski analüüs tehtud. Eelpoolnimetatud eristusid just selle poolest, et neis oli olemas kogu sagedusvahemik alt üles. Teised lõikasid suht järsult kõrgeid maha ja ka muus osas oli puudujääke. See oli küll mõni aasta tagasi ja eks vahepeal on neid parandatud, aga siiski on need 2 jäänud parimateks (ja õnneks levinumateks...). Samas on isegi nendega võimalik väga jubedaid mp3-sid toota..:) BTDT..:) settinguid on piisavalt, millega asi puusse keerata.
Ogg-i koha pealt ma sõna ei võta, puudub kogemus.
[Kaarel]: Ka pealtnäha süütu vikatiga memm kuskil tee ääres võib olla Aero omanik...
Pilt
Nakataja
Postitusi: 397
Liitunud: R Dets 10, 2004 10:17
Asukoht:
Auto:

#6

R Nov 25, 2005 9:06

Algselt postitas: tarr
Vada 5 inimest on ikka liiga väike grupp, et sellest mingeid statistiliselt olulisi järeldusi teha (välistada 95% tõenäosusega tulemuste juhuslikku viga). Kui veel rohkem karva poolitada, siis peaks uuritavate grupi omaduste (vanus, sugu, kuulmistervaus jne.) keskmised olema võrreldavad sihtgrupi keskmistega.

(no sain ka tarka panna öösel):eureka:


Tegelt oli seal artiklis ära toodud ka, et viiest inimesest kahel olid vaid kogemused pakitud muusikast vigade leidmisel. Ülejäänud kolm olid enamvähem suvalised inimesed tänavalt.
Ega selle testiga ei üritatudki otseselt tõestada, et üks või teine varjant on parem, vaid pigem pakitud muusika kvaliteeti kuulaja kõrva jaoks üldiselt. Kes on ikkagi paadunud "hifist", käib nendest pakitud muusika vrjantidest niikuinii suure kaarega mõõda. ;)
Omast seisukohast aga niipalju , et autos kuulan ma küll 90% pakitud muusikat aga kodus taas vastupidi. Asja nimi on Mugavus.
sebastian
Operaator Kõps
Postitusi: 2137
Liitunud: T Nov 09, 2004 1:35
Asukoht:
Auto: 9000CDE '97

#7

R Nov 25, 2005 14:26

Eks palju oleneb ka pakkimise kiirusest. See kiiruse/kvaliteedi suhe on enamustel audio-video koodekitel täiesti tuntav. WAV-i võib MP3-ks teha näiteks 8x kiirusega (olenevalt arvuti protsessori võimsusest 'normal mode') või näiteks 1x kiirusega (very high quality), aga tänapäeval enamasti "pilli lõhki ei aeta". MP3 algusaegadel lepiti tavaliselt 128kb/s kuna mälu oli kallis ja oli vaja rohkem mahutada. Siis oli ka hea öelda, et näe, CD plaadile mahub 10 korda rohkem muusikat CD-kvaliteediga (;) ). Nüüd on nn. maagiliseks piiriks saanud nähtavasti 192kb/s...

Aga kui juba teooriast jutt, siis annaks ka paar nõuannet, ehk on kasu MP3-de autos kuulamisel:
1. MP3 lood on teatavasti kõik erineva helitugevusega, kui näiteks autosse MP3 plaadi teha, on see üsna ebameeldiv kui peab pidevalt 'volume' nuppu kruttima. Abiks selline (tasuta) programm nagu MP3Gain. Asja võlu on selles, et midagi ei pakita ringi, vaid kirjutatakse faili päisesse teatud bitid, mis sunnivad mängijat (mp3 dekoodrit) just vajaliku tugevusega mängima. Ühesõnaga toimub helitugevuse 'normaliseerimine' üldise tugevuse järgi, nii nagu kõrv seda kuuleb, mitte aga nn. 'peak normalize', millest poleks mingit kasu.
Ühe albumi lugude selline muutmine pole hea, aga kui lood erinevatelt plaatidelt, siis võib kasu olla.
2. Kindlast on mõni hädas, kui näiteks 'playlisti' salvestamisel plaadile (siis MP3 plaat, mitte Audio-CD) ronivad kõik lood tähestikulisse järjekorda ja pleilistist pole enam haisugi. See on Windowsi 'viga' kõrvetamisel. Variant kõik lood ümber nimetada näit 01_mingilaul.mp3, 02_laul.mp3 ja nii edasi. Tülikas toiming, kui lugusid on mitusada. Päästab selline programm nagu MP3BR Imager. Impordib pleilisti ja teeb sellest 'image' faili, ehk siis läheb mööda Windowsi lollakast tähestiku järjekorrast. Kõrvetades plaadi, ongi lood just sellises järjekorras nagu 'image' fail (või playlist) neid sisaldab.
Kui mängija oskab lugeda pleilisti .m3u või .pls faile, siis pole eelnev vajalik. Enamused siiski ei oska.
triibutu
Postitusi: 432
Liitunud: T Dets 14, 2004 17:55
Asukoht:
Auto:

#8

R Nov 25, 2005 17:52

MPEG-1 Audio Layer 3 (ehk rahvakeeli lihtsalt mp3) on algselt (~ 13 aastat tagasi) projekteeritud nii, et alates 192kb/s oleks tulemus transparentne, st. praktiliselt eristamatu originaalist. Kuivõrd hästi eri koodekid selle ülesandega hakkama saavad ja millistele kompromissidele lähevad, on iseasi, aga vähemalt teoreetiliselt peaks 192kb/s katma ära mingi piisavalt suure % inimeste nõudmised. Kuidas seda täpselt määratleti, millal on piisav ja kui suure hulga inimeste jaoks, seda ma enam ei mäleta, aga minu jaoks igatahes on 192kb/s täiesti ok, seda tööl kõrvaklappidest ja seda enam autos kuulamiseks. 128 kb/s on enamasti juba "imelik", kuigi ma täpselt vigu nimetada ei oska...
Seda veel juurde, et olemas on ka Layer 1 ja Layer 2, transparentsed (jällegi teoorias) vastavalt alates 384 ja 256 kb/s.
sebastian
Operaator Kõps
Postitusi: 2137
Liitunud: T Nov 09, 2004 1:35
Asukoht:
Auto: 9000CDE '97

#9

L Nov 26, 2005 12:37

Olen kuulnud ka üsna kvaliteetselt 128kb/s pakitud muusikat ja olenevalt zhanrist on vahest raske aru saada, et midagi oleks valesti..
Enda plaadikogust näiteks Dire Strates 'The Best Ballads' reedab üsna hästi, kui pakkida - Bitrate 128kb/s on hoobilt viletsam, 160kb/s 'pole enam see', aga 192kb/s tõstan käed püsti - vahet originaaliga (CD-ga) enam ei tee.
Ja naljakas, need kes näiteks 128kb/s MP3 pakkimise nn. moonutusi (artefacts) algselt ei taju, siis pärast väikest selgitust oskavad juba üsna täpselt öelda, et 'midagi on valesti' ja seda hoopis kõrgema bitrate juures. Olen sellist nn. pimekuulamist mitmeid kordi korraldanud ja alati on tulemus sama.
MP3 pakkimise algoritmi 'kavalus'?...Tundub nii.
Nõrk signaal ei allu pakkimisele korralikult, aga helitugevuselt äärmuseni kompresseeritud muusikaga (tümakaga :P) on suht ükskõik: muud moonutused on hoopis paremini tajutavad.
Vasta