Τελική ένταση μίξης

Αμα τα γράφεις γρήγορα, αυτά παθαίνεις... Ασφαλώς και εννοώ nyquist. Όσο για το ανάποδα, όχι. Γιατί μέσα σε ένα δευτερόλεπτο (διότι Khz/sec είναι το sample rate) οι πρίμες συχνότητες προλαβαίνουν να δειγματιστούν (λόγω γρήγορου μήκους κύματος) πολύ καλύτερα στο εύρος τους από τις χαμηλές. Όταν κάνεις το wav, mp3 δηλαδή, που πονάει περισσότερο? Στις χαμηλές.  Είναι άλλο να δειγματίσεις 10 κύκλους από μία πρίμα συχνότητα στα 44100 κι άλλο έναν κύκλο από μπάσα συχνότητα στα ίδια Khz. Στα 96Khz αυτόν τον ένα κύκλο, τον συλαμβάνεις  με ακρίβεια στην κυματομορφή του. Το ίδιο βέβαια ωφελούνται και τα πρίμα όσο ανεβαίνει το sample rate, αλλά εκεί το ακουστό αποτέλεσμα είναι λιγότερο προβληματικό από ότι στις χαμηλές. Όπως και να'χει το πράγμα, άσχετα αν πιστεύουμε ότι τα 44100 είναι υπερ αρκετά, επειδή δεν ακούμε πάνω από τα 20Khz, εσείς με την απλή λογική πότε νομίζετε ότι έχετε καλύτερη ανάλυση και ευκρίνεια σήματος, όταν το πιάσεις με 44100 δείγματα το δευτερόλεπτο ή όταν το πιάσεις με 96000 δείγματα? Δηλαδή στο ίδιο δευτερόλεπτο έχουμε μεγαλύτερη "ποσότητα" για να μην πω "πυκνότητα" ληφθέντος σήματος και σαφώς περισσότερο πιο κοντά στην τέλεια αναλογική του μορφή που ασφαλώς σε ιδανικές ψηφιακές συνθήκες θα ήταν τα άπειρα Khz/sec σε sample rate. Είναι κάτι σαν τα γκάλοπ, όσο πιο πολλά δείγματα πάρεις, τόσο πιο ολοκληρωμένη και ακριβή άποψη κοντά στην πραγματική αλήθεια θα έχεις.

ΥΓ : Είμαι σίγουρος, πως ο superfunk, σκαλίζει το internet, να βρεί και να ποστάρει κανένα άρθρο που θα λέει τα ακριβώς αντίθετα...

 
Αν ίσχυαν αυτά που γράφεις, το θεώρημα του Shannon δεν θα ήταν θεώρημα αλλά ...urban legend. Λοιπόν: αν δειγματοληπτείς στα 44100 μπορείς να ανακατασκευάσεις ΤΕΛΕΙΑ όλες τις συχνότητες μέχρι τα 22050. Η αύξηση του sampling rate μπορεί να επηρεάσει αυτό που θα ακούσεις αν το σήμα υποστεί περαιτέρω επεξεργασία, αλλά πριν από την επεξεργασία, το θεώρημα Shannon και τα περί συχνότητας Nyquist ισχύουν και παραϊσχύουν.

Επίσης:

α) 1 Hz = 1 κύκλος/sec. Δειγματοληψία στα Χ Hz = X δείγματα ανά δευτερόλεπτο. Το kHz/sec που έγραψες δεν έχει νόημα.

β) Γρήγορο μήκος κύματος δεν υπάρχει: υπάρχει μικρό/μεγάλο μήκος κύματος ή ισοδύναμα μεγάλη/μικρή συχνότητα.

 
Τελευταία επεξεργασία από moderator:
Με κάλυψε ο κ. συνάδελφος αποπάνω.  :)

Εν ολίγοις....

χαμηλή συχνότητα----->πολλά samples σε κάθε περίοδο

υψηλή συχνότητα----->λίγα samples σε κάθε περίοδο

 
Τελευταία επεξεργασία από moderator:
Φίλε audiobox δεν κατάλαβα αυτό που λες για τα samples μιας χαμηλής και μιας υψηλής συχνότητας στα 44100 Hz sampling rate.

Όταν fs = 44100 Hz, τότε λαμβάνουμε:

Από συχνότητα 44.1 Hz, 1000 samples/cycle

Από συχνότητα 88.2 Hz, 500 samples/cycle

Από συχνότητα 441 Hz, 100 samples/cycle

Από συχνότητα 882 Hz, 50 samples/cycle

Από συχνότητα 4410 Hz, 10 samples/cycle

Από συχνότητα 8820 Hz, 5 samples/cycle

Από συχνότητα 22050 Hz, 2 samples/cycle

Ουσιαστικά γράφεις ότι ισχύει το αντίθετο.

 
Ακριβώς. Απλά να προσθέσω ότι και αυτά τα 2 samples/cycle που παίρνουμε για τα 22050 Hz αρκούν (κι ας φαίνονται λίγα) για την πλήρη ανακατασκευή του περιεχομένου του αρχικού σήματος σε αυτή τη συχνότητα. Προφανές, αλλά καλό είναι να αποφευχθεί περαιτέρω σύγχυση για το ποιές συχνότητες δειγματοληπτούνται "καλά" και ποιές όχι. :)

Και άλλο ένα που είδα τώρα:

audiobox είπε:
Όταν κάνεις το wav, mp3 δηλαδή, που πονάει περισσότερο? Στις χαμηλές.  Είναι άλλο να δειγματίσεις 10 κύκλους από μία πρίμα συχνότητα στα 44100 κι άλλο έναν κύκλο από μπάσα συχνότητα στα ίδια Khz.
Όταν κάνεις το wav mp3 το βασικό που συμβαίνει ΔΕΝ είναι η ενδεχόμενη δειγματοληψία σε χαμηλότερο rate, αλλά η συμπίεση αυτή καθαυτή. Με λίγα λόγια (και χωρίς να μπω σε τεχνικές λεπτομέρειες των σύγχρονων αλγορίθμων συμπίεσης): μηδενίζεις το περιεχόμενο του σήματος σε συχνότητες στις οποίες είναι αμελητέο ή στις οποίες δε γίνεται ιδιαίτερα αντιληπτό από το αυτί για λόγους που σχετίζονται με την ψυχοακουστική (auditory masking), κβαντώνεις περαιτέρω το σήμα, και κωδικοποιείς την πληροφορία που απέμεινε σε λιγότερα bytes με τη χρήση πινάκων (κάτι σαν τους κώδικες Huffman). Αυτά δεν έχουν καμία σχέση με τη δειγματοληψία και επηρεάζουν πολύ περισσότερο το αποτέλεσμα.

 
Τελευταία επεξεργασία από moderator:
Digital sound is produced by sampling a sound (or should I say the electrical version of it) in real time and expressing it in bit words. Once you start sampling or recording digital sound a clock starts and progressive samples of what the sound is are taken. The rate at which the samples are taken is called the sampling rate.  So obviously the higher the sample rate the more accurate the resolution. So when we say that the sound is 16bit, 44.1Khz it means that the sound is being sampled at 44.1 thousand times a second and it is being measures with 16 bit accuracy. Not a very accurate version of a simple waveform. But 44.1kHz, now that's fast, or is it? Lets look at sound in seconds.

1kHz will have 44.1 samples taken of each of it's waveform as its oscillating at 10,000 waveforms a second. 100Hz will have 441 samples taken of each of its waveforms. But 10kHz will have 4.41 samples taken of each of it's waveforms. imagine how inaccurate 4.41 samples are of a complex waveform. That is why digital high frequencies sound harsh!! The industry has constantly denied this factor and even gone to the extent of saying the hear can't distinguish between a square wave and a sine wave above 7kHz. Pigs Bum.

At a sampling rate of 96kHz you get 9.6 samples of a 10kHz wave and believe me, you can hear it.

In an article by Rupert Neve, I read recently, he said that we should aim for 24bit resolution and 192kHz sampling rate if we want to equal the quality of high quality analogue recording. We will get there. DVD is already up to 24 bit 96kHz sampling so we are on the way. But if your 16bit, 44.1kHz CD sounds bright, consider what makes it bright and you will see that it's a false bright created by the high frequencies sounding like square waves!!

Απόσμασμα από τo reference material του site της SAE...

 
Τελευταία επεξεργασία από moderator:
audiobox είπε:
1kHz will have 44.1 samples taken of each of it's waveform as its oscillating at 10,000 waveforms a second.
Αυτό δεν είναι σωστό, μια κυματομορφή στο 1 kHz έχει 1000 κύκλους το δευτερόλεπτο, όχι 10,000.

But 10kHz will have 4.41 samples taken of each of it's waveforms. imagine how inaccurate 4.41 samples are of a complex waveform[/b]. That is why digital high frequencies sound harsh!! The industry has constantly denied this factor and even gone to the extent of saying the hear can't distinguish between a square wave and a sine wave above 7kHz. Pigs Bum.
Στο θεωρητικό κομμάτι, όταν έχεις ενα καθαρό ημιτονοειδές σήμα είναι μαθηματικά αποδεδειγμένο ότι χρειάζεσαι το λιγότερο 2 σημεία από τον κύκλο του για να αναγνωρίσεις τη συχνότητα και το εύρος του σήματος. Αυτό λέει και το Shannon-Nyquist. Απ'τη στιγμή που μια πολύπλοκη κυματομορφή μπορεί και αναλύεται σε άθροισμα σταθμισμένων ημιτονοειδών τότε κανένα πρόβλημα.

Στη ουσία όμως αυτό που παραθέτεις μιλά για τις υψηλές συχνότητες και όχι για τις χαμηλές που αναφέρθηκες πριν, μπερδεύτηκα που θες να καταλήξεις;  :-\

 
Τελευταία επεξεργασία από moderator:
Αυτά που διαβάζω παραπάνω ισχύουν όσο ισχύει το ότι αν μου δώσει κάποιος 200 σημεία μίας γραμμής, για την οποία ΞΕΡΩ εκ των προτέρων ότι είναι ευθεία, θα τη ζωγραφίσω καλύτερα από ότι αν μου δώσει 2 σημεία. ::)

 
spy είπε:
Αυτά που διαβάζω παραπάνω ισχύουν όσο ισχύει το ότι αν μου δώσει κάποιος 200 σημεία μίας γραμμής, για την οποία ΞΕΡΩ εκ των προτέρων ότι είναι ευθεία, θα τη ζωγραφίσω καλύτερα από ότι αν μου δώσει 2 σημεία. ::)
:D :D Πολύ ευφυείς προσέγγιση! Εύγε Spy!  ;)

 
audiobox είπε:
100Hz will have 441 samples taken of each of its waveforms. But 10kHz will have 4.41 samples taken of each of it's waveforms. imagine how inaccurate 4.41 samples are of a complex waveform. That is why digital high frequencies sound harsh!!
αρα ισχυει το αναποδο , οτι δηλαδη οι υψηλες συχν θελουν ποιο "συχνο" :) δειγμα.  και οχι αυτο που ειπες:

Οι υψηλές συχνότητες αντέχουν πολύ καλά στα λίγα Khz. Οι χαμηλές όμως οφελούνται ιδιαίτερα όταν ηχογραφούνται σε υψηλές συχνότητες δειγματοληψίας.

επισης στα wav που μετατρεπεται σε  Mp3  πρωτα "χαλανε" τα πριμα, στα χαμηλοτερα rates (και μαλιστα ειναι απολυτως ακουστα με το αυτι) και οχι το αναποδο που λες:

Όταν κάνεις το wav, mp3 δηλαδή, που πονάει περισσότερο? Στις χαμηλές.  
 
Τελευταία επεξεργασία από moderator:
spy είπε:
Αυτά που διαβάζω παραπάνω ισχύουν όσο ισχύει το ότι αν μου δώσει κάποιος 200 σημεία μίας γραμμής, για την οποία ΞΕΡΩ εκ των προτέρων ότι είναι ευθεία, θα τη ζωγραφίσω καλύτερα από ότι αν μου δώσει 2 σημεία. ::)
αχ !!! αγαπημενε μας spy,  ατυχουλικο το παραδειγμα με την ευθεια ( θα επρεπε να επιλεξεις καμια καμπυλη καλυτερα) αφου, οπως θα συμφωνουσαν και οι αρχαιοι προγονοι μας, δυο σημεια θα ηταν αρκετα για να σχεδιασεις μια ευθεια. Οπότε εσυ θα το σχεδιαζες με 200 σημεια , και τοτε θα ερχομουν εγω και θα ανακαλυπτα εναν επαναστατικο non destructive αλγοριθμο συμπιεσης που θα αλλαζε την ροη της μουσικης(ή της γεωμετριας εστω) και της βιομηχανιας της . (και μετα θα πηγαινα να φαω μια πάστα και να ξεκουραστω λιγο...  ;D )

;D

 
μα αυτο εννοει ο spy.Tο ανουσιο του να του δωσει καποιος 200 σημεια

 
ωχ μλκια ειπα! δε το διαβασα καλα! sorry spy! δε προσεξα αυτο το "ισχυουν οσο ισχυει ...."

 
Προφανώς είναι τυπογραφικό λαθάκι από το site. Όσο για το Θεώρημα shannon, ακριβώς όπως το λες, αναφέρεται σε θεωρητικό επίπεδο, στο πρακτικό όμως δεν μπορείς να δώσεις στο DAC την πληροφορία μόνο για 2 σημεία και να περιμένεις να ακούσεις το πλήρες σήμα... Ως εκτούτο, όσο περισσότερη πληροφορία (samples/sec) τροφοδοτείς το DAC (τον μετατροπέα) τόσο πληρέστερη είναι η απεικόνιση του αρχικού σήματος στην έξοδο του. Συνεπώς ένα σήμα στα 96Khz, περιέχει περισσότερα "σημεία" για την πιστή μετατροπή του σε αναλογικό (στην έξοδο του DAC), από το αρχικό σήμα από το οποίο προήλθε. Γι αυτό και εγώ αναφέρθηκα με τον όρο "ευκρίνεια" στο τελικό σήμα, ως κέρδος από τις υψηλότερες συχνότητες δειγματοληψίας. Και υπάρχουν και άλλα κέρδη : ο περιορισμός του bandwith στα 22050 (όταν δουλεύουμε στα 44Khz) προκαλεί και αυτό : "Removing part of the spectral content of a broadband signal is very likely to cause a peak level increase" και αυτό : "Constructing a square wave in the digital domain from a harmonic series will be limited by the Nyquist frequency, and thus the square wave will be rounded (στρογγυλοποιείται, χάνει τις ακριβείς αρχικές του πληροφορίες) A digital square wave with its steep slopes,sharp edges and flat top does not fulllfill the sampling theorem. Such a waveshape inprinciple requires an infnite bandwidth, and the practical digital systems in use at present are not even of high bandwidth (cd players 44100/16bit). The result is therefore aliasing - a perceptually unpleasant artefact." δηλαδή όσο μεγαλύτερο bandwith έχουμε (48000 hz στα 96khz) τόσο καλύτερα και απροβλημάτιστα συμπεριφέρεται το τελικό σήμα μας, άσχετα αν εμείς ΔΕΝ ΑΚΟΥΜΕ τίποτα πάνω από τα 20ΚΗΖ. Και κάτι ακόμα : Σύμφωνα με το θεώρημα Nyquist, αν θελήσω να ηχογραφήσω ένα κοντραμπάσο (θεωρώντας ότι έχω χρήσιμες συχνότητες από το όργανο έως τα 3khz - και πολύ έβαλα) είναι αρκετό λοιπόν να κάνω την ηχογράφηση σε sample rate ... 6khz και όλα καλά! 'Οσο για το παράδειγμα με το mp3, δεν εννοούσα ότι γίνεται downsampling στην συχνότητα. 'Οχι βέβαια... Εννοούσα ότι όπως ακριβώς με την κωδικοποίηση αυτή "στρογγυλεύεται" η πληροφορία του ήχου και ΧΑΝΕΙ σε ευκρίνεια, έτσι χάνουμε και ευκρίνεια της αναπαράστασης του αρχικού μας σήματος αν επιλέξουμε μιά χαμηλή συχνότητα δειγματοληψίας σε σχέση με μία υψηλότερη. Γιατί μιλάμε πάντα για την αναπαραγωγή του ήχου σε digital domain δηλαδή τι πληροφορίες παίρνει και δίνει ο DAC ή o ADC και όχι αν σε μία μαθηματική γραφική παράσταση μπορώ με 2 μόνο σημεία να απεικονίσω μία τέλεια ημιτονοειδή κυματομορφή. Να την απεικονήσεις μαθηματικά ναι, να την ακούσεις όμως??? Δεν είναι καλύτερα να έχεις 96000 samples (πληροφορίες) να περιγράφουν το σήμα σου, από 44000? Δεν θα σου δώσει το DAC στην έξοδό του ακριβέστερο σήμα συγκρινόμενο με το εισαγώμενο αναλογικό? Αν ανεβάσω την ανάλυση στο monitor του υπολογιστή (παράδειγμα λέω, ε?) δεν θα έχω λιγότερους "κόκους" και μεγαλύτερη ευκρίνεια στην οθόνη μου, με καλύτερη απόδοση των ενδιάμεσων χρωματικών αποχρώσεων?

Το θέμα τώρα :

[glow=red,2,300]Από συχνότητα 44.1 Hz, 1000 samples/cycle

Από συχνότητα 88.2 Hz, 500 samples/cycle

Από συχνότητα 441 Hz, 100 samples/cycle

Από συχνότητα 882 Hz, 50 samples/cycle

Από συχνότητα 4410 Hz, 10 samples/cycle

Από συχνότητα 8820 Hz, 5 samples/cycle

Από συχνότητα 22050 Hz, 2 samples/cycle

[/glow]

Έγώ πράγματι το έθεσα ανάποδα, δηλαδή σε 1 sec δειγματοληψίας, πόσους κύκλους καταφέρνουμε να γράψουμε, πόσοι κύκλοι "χωράνε" σε ένα δευτερόλεπτο? Λιγότεροι από μία χαμηλή συχνότητα, περισσότεροι από μία υψηλή. Βέβαια είτε γράφουμε σε 44100 είτε σε 96000 οι ίδιοι κύκλοι θα ηχογραφηθούν μέσα σε 1' από μία δεδομένη συχνότητα, γιατί είναι δεδομένο το μήκος κύματος. Όμως όσο μεγαλύτερη είναι η συχνότητα δειγματοληψίας οι ίδιοι κύκλοι θα ψηφιοποιηθούν πολύ ακριβέστερα. Δείτε το σαν την γραμμή του automation σε κάποιο τrack στο cubase πχ. Μέσα σε ένα μέτρο, εφαρμόζω 20 σημεία που ορίζουν μια καμπύλη αυξομείωσης στην ένταση του track, αν χρησιμοποιήσω 40 σημεία, η αυξομείωση θα γίνει πολύ πιο ομαλή και η μετάβαση από σημείο σε σημείο πιο λεπτομερής.

'Οσο για τα γρήγορα μήκη κύμματος που δεν υπάρχουν, όφειλα να τα χαρακτηρίσω "γρήγορα" εννοώντας ότι χρονικά κάνουν τον κύκλο τους γρηγορότερα από άλλα χαμηλότερης συχνότητας που τους παίρνει περισσότερο χρόνο να ολοκληρώσουν τον κύκλο τους.

 
SPY αυτό που λες για τα 200 ή τα 2 σημεία μιας ευθείας, δεν έχει καμία σχέση με το πως θα παραχθεί ο ήχος. Δυστυχώς αν θέλεις να αναπαράξεις μία δεδομένη συχνότητα για 2 δευτερόλεπτα π.χ. θα πρέπει να στείλεις για κάθε χιλιοστό του δευτερολέπτου την πληροφορία συνεχώς, άσχετα αν στέλνεις την ίδια πληροφορία επί 2 sec. Δηλαδή και τα 200 σημεία είναι απαραίτητα να τα στείλεις για να ορίσεις την αρχή, το τέλος και την διάρκεια. Δηλαδή άμα βάλεις ένα cd που έχει γραμμένο έναν ακουστικό τόνο 1Khz επί πέντε λεπτά το ίδιο, η πληροφορία επάνω στο cd, δεν είναι συνεχώς γραμμένη επί πέντε λεπτά με 44100 ψηφία το δευτερόλεπτο? Δεν λες στο cd, πάρε έναν κύκλο από αυτήν την κυμματομορφή και πολλαπλασίασε τον ώστε να πιάσει τα 5 λεπτά διάρκεια.... Την ευθεία την σχεδιάζεις με 2 σημεία ναι, για να την περπατήσεις όμως από άκρη σε άκρη πρέπει να κάνεις και τα διακόσια βήματα.

 
1. Για τελευταία φορά. Για ένα ΑΝΑΛΟΓΙΚΟ ΣΗΜΑ f(t) ισχύουν τα εξής:

α) Τυχαίο σήμα με περιεχόμενο σε οποιαδήποτε συχνότητα: Αναπαράσταση με ολοκλήρωμα Fourier F(v) από τη συχνότητα v=-∞ έως v=∞. Δηλ. χρειάζεται ένα (μη αριθμήσιμα) άπειρο πλήθος αριθμών F(v) για να το περιγράψουν.

β) Περιοδικό σήμα με περιεχόμενο σε οποιαδήποτε συχνότητα: Αναπαράσταση με άπειρη σειρά Fourier F(n) από n=-∞ έως n=∞. Δηλ. χρειάζεται ένα (αριθμήσιμα) άπειρο πλήθος αριθμών F(n) για να το περιγράψουν.

γ) Σήμα με περιεχόμενο σε συχνότητες μέχρι μία ανώτατη συχνότητα B: Αναπαράσταση με ολοκλήρωμα Fourier F(v) από τη συχνότητα v=-B έως ν=B. Παρότι οι συντελεστές F(v) είναι άπειροι το πλήθος, καθένας από αυτούς μπορεί να γραφεί σαν σειρά Fourier με συντελεστές τα δείγματα x(n)=f(n/2B), τα οποία είναι 2BΤ το πλήθος, όπου Τ η χρονική διάρκεια του σήματος. Άρα αρκεί ένα πεπερασμένο πλήθος αριθμών x(n) για να το περιγράψουν.

Το (γ) είναι το θεώρημα Shannon (η Β είναι η συχνότητα Nyquist) και είναι η βάση του DSP. ΤΕΛΟΣ. Ένας καλός DAC θα κάνει τέλεια τη δουλειά του με τα 2ΒΤ δείγματα που θα πάρει.

(γνωρίζω ότι ένα σήμα πεπερασμένης διάρκειας δεν μπορεί να περιοριστεί σε πεπερασμένο εύρος συχνοτήτων και αντίστροφα, αλλά αυτό δεν επηρεάζει σημαντικά τα παραπάνω)

2. Για το square wave, προφανώς και δεν είναι bandlimited όπως απαιτεί το θεώρημα Shannon. Αλλά αυτό που θα χάσεις από sampling στα 44.1kHZ δεν μπορείς να το ακούσεις έτσι κι αλλιώς. Να σου το πω και αλλιώς: αν υπήρχε τρόπος να καταγραφεί αυτό που ακούει το αυτί σου και αντιλαμβάνεται ο εγκέφαλός σου όταν ακούει ένα square wave, η κυματομορφή θα ήταν rounded στα άκρα (και θα είχε και πολύ περισσότερες ατέλειες από όσες μπορείς να φανταστεις).

3. Για το aliasing, το phasing και ότι άλλο πρόβλημα μπορεί να προκύψει από περαιτέρω επεξεργασία συμφωνώ, όπως είχα γράψει και παραπάνω: ένα oversampling (αλλά προς θεού όχι και 96kHz) θα μετατοπίσει τα προβλήματα στην περιοχή που δε γίνονται αντιληπτά.

 
Τελευταία επεξεργασία από moderator:
Θεέ μου, θα αυτοκτονήσω με αυτά που διαβάζω audiobox. H μόνη λογική βάση σε αυτά που λες είναι κάτι που χρησιμοποιείς σαν καραμέλα για να στηρίξεις και τα σαθρά υπόλοιπα, δλδ η αρχή κβαντοποίησης της κυματομορφής στην ψηφιακή δειγματοληψία:

sampling-rate.gif


Ναι, είναι αλήθεια ότι όσα περισσότερα είναι τα "σκαλοπάτια" τόσο πιο πιστή θα είναι η αναπαραγωγή της κυματομορφής. Όμως το θέμα είναι αν είναι ακουστό ή όχι (και στο παραπάνω γράφημα τα "σκαλοπάτια" δεν θα έπρεπε να είναι καν ορατά στο ανθρώπινο μάτι - είναι εσφαλμένη οπτική παρουσίαση). Για όλα τα υπόλοιπα, συνιστώ μια προσεκτική ανάγνωση: http://www.noiz.gr/index.php?topic=164943.0

Kαι κυρίως αυτά:

http://www.soundonsound.com/sos/feb08/articles/digitalaudio.htm

http://www.soundonsound.com/sos/sep07/articles/digitalmyths.htm

http://www.soundonsound.com/sos/apr04/articles/cuttingedge.htm

Για να μην τρελαθούμε κιόλας...  ;D ;D

spy είπε:
3. Για το aliasing, το phasing και ότι άλλο πρόβλημα μπορεί να προκύψει από περαιτέρω επεξεργασία συμφωνώ, όπως είχα γράψει και παραπάνω: ένα oversampling (αλλά προς θεού όχι και 96kHz) θα μετατοπίσει τα προβλήματα στην περιοχή που δε γίνονται αντιληπτά.
Oπωσδήποτε συμφωνώ. Αλλά σαν fuel for thought, από δω: http://www.gatewaymastering.com/pdf/BobLudwigAbsoluteSoundInterview.pdf

<a href="http://picasaweb.google.com/lh/photo/_sNWKs0LVqq1JnUSjyn6Xg?authkey=e1WpYoB63_w&feat=embedwebsite"><img src="http://lh5.ggpht.com/_u1pghyaj8Y0/SYCMxYnXPCI/AAAAAAAAAyE/EaR2PKzesFU/s800/untitled.JPG" /></a>

 
Η πρότασή μου, στον αγαπητό vangelisorfas, που ξεκίνησε το post, ήταν να δουλέψει default όλα τα project 48/24, ούτε 96, ούτε 192. Συμφωνώ ότι δεν υπάρχει λόγος να ανεβούμε πολύ ψηλά κι αν είναι να ανεβούμε τα 88 είναι υπέρ αρκετά.

Από την άλλη, αφού τα 44.1 είναι "υπέρ αρκετά" αρκεί να είναι 24 Bit, τότε γιατί να μην είναι και 32 bit floating ή ακόμη καλύτερα γιατί όχι να μην δουλεύουμε στο νέο sonar που έχει true 64 bit επεξεργασία και όχι floating? Ο λόγος του post ήταν η αύξηση της δυναμικής περιοχής για να προσεγγίσουμε αυτά του εμπορίου και όχι τα 96 ή τα 5 δις Khz. Από τα συμπεράσματα στην αναζήτηση του θέματος στο internet, υπάρχει το εξείς αποτέλεσμα : Με βάση την ανάλυση Nyquist και την αναπαράσταση fourier δεν υπάρχει θεωριτικά λόγος για τίποτε παραπάνω από το ακουστικό φάσμα των 22050, αλλά σε σχέση με την πραγματική εφαρμογή και λειτουργία των DAC, υπάρχει μεγάλο όφελος στην λειτουργία σε μεγαλύτερες συχνότητες και έχουμε καλύτερο ηχητικό αποτέλεσμα στην ψηφιακή αναπαραγωγή. Μερικλα αποσπάσματα :

These brick wall filters are what make 44.1 khz signals lack in fidelity what 96 khz can provide, the "brick wall" filters are not "brick walls" but rather progressive filters that induce a lot of distortion, like phase shifts that can go up to 1000 degrees (unless they are really expensive)... At 96 khz, the brick walls are set at 48 khz (not 22.05 khz) and their effects (distortion) are NOT audible, hence why it's better (hence, cheaper).

At 96 khz there is much bandwidth for plug ins to work in, if they're poorly engineered, it may make a difference. The real achievable difference for having high sample rates would be re-pitching or non-linear processes like compression (and I mean really heavy one, like 20:1). 96 khz will sound more analog (actually it feels more than it sounds), but its a very subtle effect and only shown off with very good mixes always done and preserving the full 48khz audio bandwidth.

-------------------------------------------------

Most music is recorded at 44.1, which means the brick wall filter is at 22.05KHz. While most people over the age of 30 can't hear above 17KHz, *some* people have accurate hearing that go well into 23+KHz territory. Some people have complained about "high frequency ringing" from low sampling rates of 44.1KHz, which is why the original movie formats of DTS and DD were set at 48KHz, or the filter extended to 24KHz (nearly inaudible).While most people can't hear much above 20KHz, there are still higher frequency harmonics that can be felt. 96+ KHz sampling rates are of course, the answer for high fidelity audio.

-----------------------------------------------

Higher sample rates provide smoother curves at high frequencies. There can be a total loss of certain frequencies if the sample rate is timed at mid phase. There are also harmonic interactions between frequencies and if those frequencies aren't there, subtle changes occur in the content. Samples in their raw form produce a saw type wave that has a frequency of its own. These are partially corrected by smoothing software and hardware that fills in the gaps between samples. Higher sample rates have smaller gaps between samples.So, although 44.1KHz can accurately sample fundamental (that is sine-wave) frequencies as high as 22.05KHz, a complex wave-shape at 22.05KHz will require a much higher sampling rate if you want an accurate representation. 96KHz and 192KHz sampling (as used in SACD and DVD-A discs) can often sound better because of this. Nobody can hear a 40KHz note, but the notes you do hear (especially the high notes, 8Khz and up) will be more accurately represented. Depending on the nature of the source material and the quality of your playback equipment, the differences can often be easy to hear.

-------------------------------------------

Finally, the concept of higher sample rates creating more "points" between samples and therefore a smoother sound makes intuitive sense but is actually wrong. As Michael Fraser explained, the beauty of sampling is that, say, an 18kHz tone will sound identical at 44.1kHz and 192kHz. Or a 3.5kHz tone at an 8kHz sampling frequency. All the information necessary to reconstruct the tones perfectly is in the lower sample rate recordings.

Huh? ... This is very wrong. In your example, one cycle of the 18khz waveform would be defined by about 2.45 points on a graph. Less than 3 points to define one complete cycle of the waveform!

Sampling it at 192khz would allow the waveform to be defined, ie shaped, with 10.66 points.

Draw me this on a graph and tell me which represents the original waveform the most accurately? You can't tell me that a waveform defined by 3 points for the entire cycle is going to sound the same as the original. All those sharp angles and straight lines mean lots of distortion.

-----------------------------------------------

use the highest sampling rate you can, it can't hurt...maybe you can't hear the difference, but maybe you can feel it...if analog is a solid line, digital is a dotted line, but the more dots you can cram in, the tighter they get to each other and the closer you get to a solid line. Remember that it takes years of critical listening to pick up on the the kind of nuances which we are talking about, but the bottom line is more information equals more detail and more detail will always be better

----------------------------------------

Consider that at 44.1k, a 440Hz wave is measured about 100 times per wave cycle. That might seem like plenty of measurements, but then consider that a 4400Hz wave is measured only about 10 times per cycle, and an 9kHz wave is measured only about 5 times per cycle.

Yes, recording at 88.2kHz would extend the highest frequency you could record up an extra octave (from 22k up to 44k) but it does a few extra things too. It records everything else more accurately (twice as often) and it reduces the severity of the brick wall anti-aliasing high-frequency roll off that causes so much strange behavior at the top end of the spectrum.So it's not just about recording frequencies we can't hear, but about recording what we do hear, better.

--------------------------------------

My Wikipedia fueled explanation of Sample Rate and Bit Depth:

The Sample Rate, which is that second number you mention (96kHz and 192kHz) defines the number of samples per second (or per other unit) taken from a continuous signal to make a discrete signal. For time-domain signals, it can be measured in hertz (Hz). When recording, your interface/computer is actually taking small pictures of your signal called samples, every second. It is generally understood that the more pictures taken per second will result in a better overall image. Therefore, the higher the sample rate, the better characterization of your overall sound.

Αυτά....

 
Άντε πάλι. Σαν να μην ποστάρισα καν προηγουμένως.

bloody_sunday είπε:
Θεέ μου, θα αυτοκτονήσω με αυτά που διαβάζω audiobox. H μόνη λογική βάση σε αυτά που λες είναι κάτι που χρησιμοποιείς σαν καραμέλα για να στηρίξεις και τα σαθρά υπόλοιπα, δλδ η αρχή κβαντοποίησης της κυματομορφής στην ψηφιακή δειγματοληψία:

Ναι, είναι αλήθεια ότι όσα περισσότερα είναι τα "σκαλοπάτια" τόσο πιο πιστή θα είναι η αναπαραγωγή της κυματομορφής. Όμως το θέμα είναι αν είναι ακουστό ή όχι (και στο παραπάνω γράφημα τα "σκαλοπάτια" δεν θα έπρεπε να είναι καν ορατά στο ανθρώπινο μάτι - είναι εσφαλμένη οπτική παρουσίαση). Για όλα τα υπόλοιπα, συνιστώ μια προσεκτική ανάγνωση: http://www.noiz.gr/index.php?topic=164943.0

Kαι κυρίως αυτά:

http://www.soundonsound.com/sos/feb08/articles/digitalaudio.htm

http://www.soundonsound.com/sos/sep07/articles/digitalmyths.htm

http://www.soundonsound.com/sos/apr04/articles/cuttingedge.htm

Για να μην τρελαθούμε κιόλας...
Αν κάνω copy paste αυτά που γράφει το Sound On Sound στα λινκς το κατεβατό μου θα είναι μεγαλύτερο, περίπου 106345612 πιο αξιόπιστο και θα φανώ και πιο ψαγμένος. Χώρια που θα απαντούσε σε όλα τα σκυλοπνιγμένα που προηγούνται.  :-X

 

Απαντήσεις

Trending...

Νέα θέματα

Back
Top