Σύμφωνα με το θεώρημα των παραπάνω κυρίων αρκεί μία ψηφιοποίηση στα 96khz να ακουμπήσει τον αναλαγικό ήχο?
Όχι, ή μάλλον όχι ακόμα, γιατί και το DSD είναι προσέγγιση.
Θεωρητικά μπορούμε να πάρουμε 96000hz? σχεδόν το διπλάσιο από τον κλασσικό αναλογικό που είναι κάπου στα 50000hz
Θεωρητικά και πρακτικά μπορούμε να έχουμε πολύ περισσότερο από 96 KHz. Το πρόβλημα δεν είναι αν θα είναι διπλάσιο ή τριπλάσιο. Το πρόβλημα είναι τί είδους θα είναι το διπλάσιο ή το τριπλάσιο και κατά κύριο λόγο σχετίζεται με τα low-pass φίλτρα και στην AD και στην DA μετατροπή. Συνήθως τα φίλτρα είναι τύπου 0.44 ή 0.55. Αυτό σημαίνει χοντρικά, ότι για να βρεις το πραγματικό εύρος πολλαπλασιάζεις την συχνότητα δειγματοληψίας με αυτούς τους αριθμούς. Δηλ. για sampling rate 44.1, έχουμε π.χ. 44.1 KHz * 0,44 = 19,404 Hz. Αυτό συμβαίνει αφενός γιατί δεν υπάρχουν brickwall φίλτρα με όλη τη σημασία της λέξεως αλλά και αυτά που υπάρχουν δημιουργούν ένα είδος phasing κοντά στην συχνότητα αποκοπής. Τα φίλτρα τύπου 0.44 δεν ρολάρουν τόσο απότομα άρα και παράγουν λιγότερο phasing, με τίμημα μικρότερο ακουστικό εύρος, δηλαδή 19404 Hz και όχι 22050 όπως θα θέλαμε.
Πολλοί ρωτάνε: είναι τόσο σημαντική η περιοχή στα 19.4 KHz? Ακούει κανείς τόσο ψηλά; Δεν είναι εκεί το θέμα όμως. Ας πούμε ότι έχουμε μία τετραγωνική κυματομορφή στα 1000 Hz. H δεύτερη αρμονική της είναι στα 3000, η τρίτη στα 5000, κ.λ.π. ... η δεκατη είναι στα 19.000 Hz. Δυστυχώς όμως με 10 αρμονικές δεν μπορούμε να κατασκευάσουμε μία αρκετά πιστή τετραγωνική κυματομορφή (τουλάχιστον όχι με αυτή την θεμελιώδη συχνότητα). Αν δείτε π.χ. εδώ:
http://en.wikipedia.org/wiki/Square_wave
θα δείτε ένα ωραίο animation, που αποδεικνύει του λόγου το αληθές.
Εάν τώρα προσπαθήσουμε να κάνουμε frequency modulation μεταξύ δύο τέτοιων σημάτων, που ήδη δεν αναπαριστώνται σωστά, τότε πως το αποτέλεσμά τους με εκατοντάδες (ίσως και χιλιάδες) πλευρικές συχνότητες να δώσει σωστά αποτελέσματα; Για αυτό μετακινούμε την συχνότητα δειγματοληψίας όλο και παραπάνω έτσι ώστε να έχουμε και καλύτερη αναπαράσταση του σήματος αλλά και τα ηχητικά σκουπίδια (aliasing, distortion, phasing κ.λ.π) να μετακινηθούν σε συχνότητες πολύ πάνω από το ηχητικό μας εύρος. Αυτό έχει σαν αποτέλεσμα να έχουμε δειγματοληψίες 192 KHz, 384 KHz, κ.λ.π. Αλλά σε PCM μετατροπές πάντα υπάρχει ένα low-pass φίλτρο για την ανακατασκευή του σήματος στον μετατροπέα. Με το DSD αποφεύγεται το φίλτρο αυτό (άρα και τα προβλήματα που κουβαλάει) αλλά το DSD δεν είναι άμεσα τροποποιήσιμο, πρέπει να γίνει DXD (π.χ. 24*384 KHz) για να μπορέσει να γίνει κάποιου είδους editing. Άρα για την ηχογράφηση, προσωπική μου γνώμη είναι όσο το δυνατόν μεγαλύτερο εύρος διαύλου (24 πραγματικά bits είναι υπερ του δέοντος αρκετά - χώρια ότι δεν υπάρχει κανένας απολύτως μετατροπέας με 24 bits για τα πραγματικά μουσικά δεδομένα, ο καλύτερος που ξέρω είναι 21,5 αν θυμάμαι καλά) και όσο το δυνατόν μεγαλύτερη συχνότητα δειγματοληψίας, χωρίς φυσικά αυτό να σημαίνει ότι αυτά τα δύο είναι οι μόνοι παράγοντες για μία καλή ηχογράφηση.
Δείτε π.χ. εδώ στο site της DAD, μερικά σχεδιαγράμματα που μπορεί να δώσουν λίγο περισσότερο φως:
http://www.digitalaudio.dk/ax24_present.htm