Audio resolution test: 192kHz vs 96kHz vs 44.1kHz

blue είπε:
θα διατυπωσω μια αποψη, την οποια δεν την εχω βρει καπου γραμμενη, αλλα την εχω συμπερανει (ενδεχομενως λανθασμενα) απο ενα συνδυασμο δυο διαφορετικων θεματων :

Ενα φυσικο οργανο περιλαμβανει πρακτικα απειρες αρμονικες και το Θ. Shannon λεει οτι θα φιλτραρουμε τις ανωτερες απο αυτες που επιτρέπονται, ωστε να εχουμε πληρη αναπαρασταση του σηματος. Φαινομενικα, επειδη ακουμε μεχρι 20k (και λιγοτερο στην πραγματικοτητα) λεμε οτι δεν πολυπειραζει και να φιλτραρουμε τις υψηλοτερης ταξης αρμονικες.

Επειδη ομως λαμβανει χωρα και το φαινομενο των τονων αθροισματος και διαφορας (οπως και αλλα φαινομενα παραγωγης νεων τονων που δεν εχουν παιχτει, αλλα ακουγονται), αναρωτιεμαι μηπως με το φιλτραρισμα  για να υπακουσουμε στο Shannon , δεν επιτρεπουμε την παρουσια των νεων αυτων αρμονικων (που ειναι ακουστες) που διαμορφωνουν τελικα τη χροια του ηχου ενος φυσικου οργανου.

Μηπως ενα απο τα πραγματα που ακουγονται στις ανωτερες δειγματοληψιες ειναι και αυτες οι υψηλης ταξης (ακουστες) αρμονικες που προκυπτουν απο τονους διαφορας ακομα ψηλοτερων (μη ακουστων) αρμονικων;
Ωραίο το ερώτημά σου, δυστηχώς δεν έχω την θεωρητική κατάρτιση να σου απαντήσω σε αυτό, μπορώ όμως να το συμπληρώσω θέτοντας μια επιπλέον παράμετρο που ίσως έχει μεγαλύτερη σημασία και έχει να κάνει με τις υπερηχητικές θεμελιώδεις που παράγουν υπο-αρμονικές μέσα στο ακουστό φάσμα και που μάλλον αποκόπτονται και αυτές.

Αυτά βέβαια μπορούν να απαντηθούν μόνο από ανάλογης παιδείας γνώστες, άρα είναι όλα μάλλον φιλολογικού ενδιαφέροντος.

Προσωπικά αυτό που μου μένει είναι ότι τα 192kHz ήταν για μένα μια πολύ ευχάριστη έκπληξη. :)

Και να συμπληρώσω βέβαια ότι απλώς αναφερόμαστε στο όταν το σήμα παραμένει σε υψηλή ανάλυση.. η βελτίωση που ακούω από τα 192 στα 44.1 φυσικά δεν προέρχεται από οποιεσδήποτε αρμονικές και αν βγάλουμε εκτός την απουσία φίλτρου αποκοπής του ad converter δεν έχω άλλη εξήγηση...

 
Τελευταία επεξεργασία από moderator:
blue είπε:
θα διατυπωσω μια αποψη, την οποια δεν την εχω βρει καπου γραμμενη, αλλα την εχω συμπερανει (ενδεχομενως λανθασμενα) απο ενα συνδυασμο δυο διαφορετικων θεματων :

Ενα φυσικο οργανο περιλαμβανει πρακτικα απειρες αρμονικες και το Θ. Shannon λεει οτι θα φιλτραρουμε τις ανωτερες απο αυτες που επιτρέπονται, ωστε να εχουμε πληρη αναπαρασταση του σηματος. Φαινομενικα, επειδη ακουμε μεχρι 20k (και λιγοτερο στην πραγματικοτητα) λεμε οτι δεν πολυπειραζει και να φιλτραρουμε τις υψηλοτερης ταξης αρμονικες.

Επειδη ομως λαμβανει χωρα και το φαινομενο των τονων αθροισματος και διαφορας (οπως και αλλα φαινομενα παραγωγης νεων τονων που δεν εχουν παιχτει, αλλα ακουγονται), αναρωτιεμαι μηπως με το φιλτραρισμα  για να υπακουσουμε στο Shannon , δεν επιτρεπουμε την παρουσια των νεων αυτων αρμονικων (που ειναι ακουστες) που διαμορφωνουν τελικα τη χροια του ηχου ενος φυσικου οργανου.

Μηπως ενα απο τα πραγματα που ακουγονται στις ανωτερες δειγματοληψιες ειναι και αυτες οι υψηλης ταξης (ακουστες) αρμονικες που προκυπτουν απο τονους διαφορας ακομα ψηλοτερων (μη ακουστων) αρμονικων;
blue,

δεν είναι αδικαιολόγητη η απορία σου. Το link αναφέρεται σε combination tones (τόνων αθροίσματος και διαφοράς), οπότε ας χρησιμοποιήσω ένα παράδειγμα που να έχει και τα δύο.

Ας πάρουμε δύο ημιτονοειδή σήματα 40 KHz και 30 KHz και ας τα πούμε X και Υ. Και τα δύο είναι μή ακουστά σήματα, από την στιγμή που είναι πολύ πιο πάνω από το πάνω όριο ακοής. Τα δύο αυτά σήματα τα στέλνουμε σε ένα κύκλωμα που κάνει δακτυλιοειδή διαμόρφωση (ring modulation). Στην δακτυλιοειδή διαμόρφωση δύο τέτοιων σημάτων, το αποτέλεσμά τους είναι ένα σήμα το οποίο περιέχει ταυτόχρονα δύο "συστατικά": ένα είναι το άθροισμα τους και άλλο ένα είναι η διαφορά τους.

Αρα έχουμε:

X + Y = 70 KHz (μη ακουστό σήμα)

X - Y = 10 KHz (ακουστό σήμα)

Βλέπουμε λοιπόν ότι υπάρχει περίπτωση 2 μη ακουστά σήματα, μέσω διαμόρφωσης (στην συγκεκριμένη περίπτωση είναι ουσιαστικά amplitude modulation), να παράγουν ένα ακουστό σήμα. Διάλεξα επίτηδες αυτά νούμερα Χ και Υ για να δείξω τι γίνεται σε περίπτωση που αυτά δεν υποστούν band-limiting. Σε ένα modular με εφαρμογή CV στην χροιά των ταλαντωτών μπορεί κάλλιστα να επιτευχθούν αυτές οι τιμές (30 και 40 KHz) και δεν υπόκεινται σε κανενός είδος περιορισμούς (αν εξαιρέσουμε φυσικά τα ηχεία).

Το πρόβλημα ανακύπτει αν αυτές οι δύο τιμές (ή οποιεδήποτε άλλες πάνω από Nyquist/2) παραχθούν ψηφιακά. Το καίριο ερώτημα είναι πρέπει ή δεν πρέπει να περιορισθούν ευθύς εξαρχής από γεννησιμιού τους μέσα στον κώδικά ή μπορούμε να τις αφήσουμε ανεξέλεγκτες να παράγουν οποιοδήποτε αποτέλεσμα και να επαφιόμαστε στο ότι θα φιλτραριστούν από το lowpass φίλτρο του μετατροπέα; Εάν δεν πρέπει να περιοριστούν γιατί φοβούμαστε μήπως χάσουμε κάποια πολύτιμη μουσικά πληροφορία, τότε είμαστε σίγουροι ότι τα αποτελέσματά τους (τα οποία είναι μέσα στο ακουστό εύρος) δεν παράγουν ηχητική σαβούρα (π.χ. aliasing);

Στο παράδειγμα που ανέφερα: Τι δουλειά έχει ένα ring modulated σήμα, ξεκάρφωτο στα 10 KHz? Θα μπορούσε να είναι σε διάφορα άλλα σημεία που είναι τελείως μη προβλέψιμα. Θα μπορούσε ακόμα να είναι σε πολλαπλά σημεία εάν τα αρχικά σήματα δεν ήταν απλές κυματομορφές. Θα μπορούσε να είναι ένα σύνθετο σήμα και όχι ένα απλό ημιτονοειδές σήμα. Εδώ ναι μεν έχουμε ένα σήμα στα 10 KHz αλλά το σήμα αυτό δεν μπορεί να διαχωριστεί από το σήμα στα 70 KHz παρά μόνο με ένα PLL κύκλωμα.

Είναι σημαντικό να μην ξεχνάμε το ακουστικό μας εύρος. Ότι και να παραχθεί, είτε απ' ευθείας από το εκάστοτε όργανο, είτε από σπόντα μέσω modulation, πρέπει τα αντικατοπτριζόμενα στοιχεία μέσα στο ακουστικό μας εύρος να μην είναι ηχητική σαβούρα και να είναι το κατά δύναμη προβλέψιμα. Δεν είμαι πολύ σίγουρος κατά πόσο είναι προβλέψιμα μιας και η σύνθεση που συνήθως παράγει τα πιο απρόβλεπτα αποτελέσματα είναι η FM μεταξύ πολύπλοκων κυματομορφών.

Στην περίπτωση που απλά έχουμε κάποια συνήχηση που παράγει (ή νομίζουμε ότι παράγει) κάποια τρίτα σήματα, φαντάζομαι ότι πάλι πρέπει να δούμε κατά πόσο είναι προβλέψιμα (ή έστω αρεστά). Δηλαδή να συνηχούν 2 σήματα, να παράγουν ένα καινούριο το οποίο είναι εκτός ακουστικών ορίων, και αυτό με την σειρά του να έχει κάποιο mirroring μέσα στο ακουστό εύρος το οποίο είναι επιθυμητό... Δεν ξέρω.. εξ άλλου μερικές φορές και το aliasing παράγει ενδιαφέροντα αποτελέσματα, άρα κρίνοντας το έτσι, γιατί να το κόψουμε;

Ποιά είναι η γνώμη σου;

...

Haryy θα ακούσω προσεκτικά τα δείγματα στα ηχεία (και όχι στο laptop) για να δώ μήπως και διακρίνω κάτι.

:)

 
haryy είπε:
Γεια σου infectme247. Ευχαριστώ για τις παρατηρήσεις σου. Μήπως άκουσες και το τεστ στην 5η σελίδα με την σταθερή πηγή? Θα ήθελα την άποψή σου αν δεν το έχεις ήδη ακούσει.
Καλησπέρα Haryy. Είχα ακούσει και αυτά τα αρχεία όταν έγραφα το προηγούμενο ποστ, χωρίς να μπορώ να καταλάβω κάποια διαφορά. Η μόνη μου παρατήρηση είναι ότι ο ήχος μου ακουγόταν κάπως "κούφιος" και με πολύ αντήχηση, σε όλα τα αρχεία. Σίγουρα δεν θα ήταν ένα δείγμα ήχου πάνω στο οποίο θα ήθελα να κάνω critical listening, αν ήταν να εμπιστευτώ τα αυτιά μου.

Η αλήθεια είναι πάντως ότι ούτε έμπειρα αυτιά έχω, ούτε κανένα αξιόλογο σύστημα μόνιτορινγκ ή κάρτα ήχου, οπότε δεν θα μου φαινόταν περίεργο αν κάποιοι όντως ακούν διαφορές.

Πάντως, η άποψή μου παραμένει ότι το πείραμα αυτό είναι πολύ δύσκολο να γίνει σωστά (τουλάχιστον όπως ορίζω εγώ το "σωστά"), για διάφορους λόγους, μερικούς εκ των οποίων ανέφερα και στο προηγούμενο ποστ.

Ίσως αν είχα κάποια κάρτα ήχου με σοβαρούς converters και μια "πραγματικά αναλογική" πηγή ήχου (δηλαδή όχι προϊόν DAC) να δοκίμαζα κάτι αντίστοιχο, αλλά δυστυχώς...

 
Thanks for listening!

Το συγκεκριμένο δείγμα χρησιμοποιήθηκε με αυτόν τον τρόπο γιατί έπρεπε να τηρεί 2 κανόνες:

α) Η πηγή έπρεπε να είναι σταθερή.

β) Αν ήταν μόνο ψηφιακό το σήμα θα είχα καταρχήν σοβαρή ένσταση εγώ για λόγους που ειπώθηκαν τουλάχιστον 2 φορές.

Ήθελα λοιπόν να είναι όσο πιο σύνθετο γινόταν. Με τον τρόπο αυτό οι χιλιάδες ανακλάσεις του χώρου και η διαφορές φάσεις μεταξύ των 2 ηχείων που "έπιανε" το μικρόφωνο, έκαναν το σήμα περισσότερο αναλογικό και σύνθετο κατά τη γνώμη μου αλλά ταυτόχρονα διατηρούσε και τον κανόνα της "σταθερής" πηγής.

Αυτά και πάλι ευχαριστώ για την άποψή σου.

 
haryy είπε:
Με τον τρόπο αυτό οι χιλιάδες ανακλάσεις του χώρου και η διαφορές φάσεις μεταξύ των 2 ηχείων που "έπιανε" το μικρόφωνο, έκαναν το σήμα περισσότερο αναλογικό και σύνθετο κατά τη γνώμη μου
Αυτό δεν το καταλαβαίνω... ακούμε με αναλογικό και όχι με ψηφιακό τρόπο, ανεξαρτήτως του τι είναι η πηγή. Και τι θα σήμαινε "περισσότερο αναλογικό"? Δεν υπάρχουν διαβαθμίσεις... ή είναι ή δεν είναι!  :-\

 
bloody_sunday είπε:
Αυτό δεν το καταλαβαίνω... ακούμε με αναλογικό και όχι με ψηφιακό τρόπο, ανεξαρτήτως του τι είναι η πηγή. Και τι θα σήμαινε "περισσότερο αναλογικό"? Δεν υπάρχουν διαβαθμίσεις... ή είναι ή δεν είναι!  :-\
Μα δεν μιλάω γενικά για το πως ακούμε. Φυσικά και ακούμε αναλογικά.

Συγκεκριμένα λοιπόν μιλάω για το τι είδους είναι η πηγή του παραδείγματος. Και αυτό είναι ένα cd, δηλαδή ένα σήμα που έχει ήδη υποστεί ψηφιοποίηση άρα είναι μακριά από το ιδεατό, δηλαδή τον ζωντανό ήχο (αυτό είναι και το απόλυτα αναλογικό στην περίπτωσή μας).

Παρεμβάλλωντας λοιπόν την αλυσίδα μεγάφωνο-ζωντανός χώρος με ανακλάσεις-μικρόφωνο αλλοιώνουμε την απόλυτα ψηφιακή πηγή και την κάνουμε πιο "αναλογική" ώστε να φανούν περισσότερο οι όποιες διαφορές μεταξύ των αναλύσεων στο τεστ.

Αν απλά χρησιμοποιούσα ένα cd player να αναπαράγει την μουσική και ένα daw να ηχογραφεί απευθείας (χωρίς μικρόφωνο) στις 3 αναλύσεις, η προηγούμενη ψηφιοποίηση του cd νομίζω ότι θα στεκόταν εμπόδιο στην ανακάλυψη τυχόν διαφορών.

Δεν αποκλείω και το να φαίνονταν καθαρά όμως, αλλά δεν είναι αυτό το θέμα στην απορία σου.

Ελπίζω να έγινα κατανοητός με την έκφραση "περισσότερο αναλογικό". Ήθελα να "εξαφανίσω" εν μέρη τα artifacts της πρότερης ψηφιοποίησης και να προσθέσω στην πηγή του τεστ "αναλογική" κίνηση μεγαφώνου, "αναλογικές" ανακλάσεις χώρου και "αναλογική" κίνηση διαφράγματος μικροφώνου.

Ετσι προέκυψε το "περισσότερο αναλογικό". :)

 
Καταλαβαίνω, όμως θα ήθελα να σχολιάσω αυτό (και πάλι παρακαλώ για όποιες διορθώσεις):

haryy είπε:
Αν απλά χρησιμοποιούσα ένα cd player να αναπαράγει την μουσική και ένα daw να ηχογραφεί απευθείας (χωρίς μικρόφωνο) στις 3 αναλύσεις, η προηγούμενη ψηφιοποίηση του cd νομίζω ότι θα στεκόταν εμπόδιο στην ανακάλυψη τυχόν διαφορών.
Αυτό θα αποτελούσε εμπόδιο μόνο αν η ψηφιοποίηση είχε κάποια σοβαρά σφάλματα ή αν ήταν χαμηλής ποιότητας (πχ. αν ήταν σε ΑΜ radio quality), κι αυτό μόνο γιατί το προς σύγκριση αντικείμενο θα είχε πολύ περιορισμένο φάσμα πληροφοριών ως προς την ανθρώπινη ακοή. Όμως, από τη στιγμή που μιλάμε πχ. για ένα cd πιστεύω πως δεν τίθεται τέτοιο θέμα. Και αν κάποιος είχε αμφιβολία για την ποιότητα της απόδοσης ενός cd (που δεν θα μπορούσα να καταλάβω προσωπικά το γιατί), θα μπορούσε να καταγράψει ψηφιακά την πληροφορία σε μια υπερυψηλή ποιότητα, όπως τα 192, και μετά να συγκρίνει το πώς αυτή συλλαμβάνεται πχ. από ένα ακριβό μικρόφωνο αναφοράς μόλις γίνει πάλι ηχητικό κύμα.

 
bloody_sunday είπε:
Καταλαβαίνω, όμως θα ήθελα να σχολιάσω αυτό (και πάλι παρακαλώ για όποιες διορθώσεις):

Αυτό θα αποτελούσε εμπόδιο μόνο αν η ψηφιοποίηση είχε κάποια σοβαρά σφάλματα ή αν ήταν χαμηλής ποιότητας (πχ. αν ήταν σε ΑΜ radio quality), κι αυτό μόνο γιατί το προς σύγκριση αντικείμενο θα είχε πολύ περιορισμένο φάσμα πληροφοριών ως προς την ανθρώπινη ακοή. Όμως, από τη στιγμή που μιλάμε πχ. για ένα cd πιστεύω πως δεν τίθεται τέτοιο θέμα. Και αν κάποιος είχε αμφιβολία για την ποιότητα της απόδοσης ενός cd (που δεν θα μπορούσα να καταλάβω προσωπικά το γιατί), θα μπορούσε να καταγράψει ψηφιακά την πληροφορία σε μια υπερυψηλή ποιότητα, όπως τα 192, και μετά να συγκρίνει το πώς αυτή συλλαμβάνεται πχ. από ένα ακριβό μικρόφωνο αναφοράς μόλις γίνει πάλι ηχητικό κύμα.
ένα ψηφιακό σήμα είναι φασματικά περιορισμένο από τη συχνότητα δειγματοληψίας.

το να κάνω δειγματοληψία στα 192 σε κάτι που έχει υποστεί δειγματοληψία στα 44.1 είναι σα να πάρω ένα τσουβάλι με ρεβίθια και φακές, να το περάσω από ένα κόσκινο που κρατάει τα ρεβίθια (και αφήνει τις φακές) και μετά να πάρω τα ρεβίθια και να ψάχνω για άμμο!

 
Για εμένα η ηχητική απόδοση ενός cd θα υπερκάλυπτε τις απαιτήσεις, αφού όπως είπα προηγουμένως α. τα ΤΥΧΟΝ σφάλματα ψηφιοποίησής του είναι ιδιαίτερα έως εντελώς ανεπαίσθητα στην ανθρώπινη ακοή, β. η απόδοσή του περιέχει όλη την πληροφορία που δύναται αυτή να συλλάβει, κι έτσι δεν θα υπάρχει masking πολύτιμων ηχητικών δεδομένων. Για περισσότερα, τα προηγούμενα ποστς τα περιγράφουν πολύ καλύτερα από αυτά που θα έγραφα εγώ.

Δεύτερον, ακόμη και για τους σκεπτικιστές πρότεινα παραπάνω το αρχικό θέμα-καρμπόν να είχε καταγραφεί στα 192 κι όχι στα 44 όπως γράφεις (βασικά θα μπορούσα να κάνω quote αυτούσιο το προηγούμενό μου ποστ σαν απάντηση).

 
@skantzos

Ακριβώς. :)

Ένα άλλο παράδειγμα. Κατά την διάρκεια των τεστ έκανα κάτι πολύ απλό: "Χτυπούσα" τα δάχτυλά μου στο μικρόφωνο (κατά το αγγλιστί snap my fingers) και επιτόπου άλλαζα το sample rate από τα 44.1 στα 192 και ταυτόχρονα άκουγα από τα ακουστικά. Στα 192, κυριολεκτικά τα ακουστικά εξαφανίζονταν και ήταν σαν μην τα φορούσα.

Αν όμως ηχογραφούσα στα 44.1 και έκανα το test loop στις 3 δειγματοληψίες υπήρχε ποτέ περίπτωση να ξανακούσω αυτό το πράγμα?

Γιαυτό εξαρχής χρησιμοποίησα ζωντανές πηγές.

Στο θέμα του δεύτερου τεστ λοιπόν,η πολυπλοκότητα των ανακλάσεων και η κίνηση του μεγαφώνου και ακολούθως του μικροφώνου δίνει εκ νέου "φυσική" ζωντάνια (αν και πιο low-fi σε σχέση με το αρχικό) σε ένα ψηφιακό ηχογράφημα.

Αυτό για να αποκτήσουν ενδιαφέρον οι ακόλουθες δειγματοληψίες όχι για να το κυκλοφορήσουμε σε ..βινύλιο :)

Όσο για το δείγμα σε 192 και εγώ έχω πει ότι θα το δεχόμουν και θα το έκανα αλλά δεν έχω 2 daw με τέτοια ανάλυση.

 
Να πω απλά ότι δεν κατάλαβα διαφορές.

Μπορεί να φταίει το σύστημα ακρόασης μου ή απλά ότι η διαφορά είναι μηδαμινή για το συγκεκριμένο περιεχόμενο.

Αν έπρεπε να επιλέξω για να ηχογραφήσω μια δουλειά, θα διάλεγα τα 44,1kHz μιας και είμαι και τσίπης. ;D

Σε τελική ανάλυση θεωρώ ότι το σημαντικό είναι γράφουμε και να ακούμε σωστά. Σε αυτή την περίπτωση λοιπόν το 99,99% της πληροφορίας φαίνεται να αποδίδεται στα 44,1. Αν προκύπτει διαφορά παραπέρα, αφορά αυτό το 0,κάτι %, που έτσι κι αλλιώς ίσως ανήκει περισσότερο στη σφαίρα του μεταφυσικού για να αποδειχτεί ή απλά δεν είναι και τόσο σημαντικό να υπάρχει. Ισως το μικρόφωνο, ο προενισχυτής, τα ηχεία του ακροατή, ο κονβέρτορας να παίζουν σημαντικότερο ρόλο σε μια ηχογράφηση παρά η παραπάνω ανάλυση.

Θενκ γιου haryy.

 
Εγώ κατέβασα τα 1α αρχεία, και έτσι... δε μπορώ να βγάλω συμπεράσματα, αφού υπάρχουν διαφορές στο παίξιμο! Αλλά ομολογώ ότι η ποιότητα μου φάνηκε ίδια! (ακούω μέσω Lynx Two -> Grace Design m902 -> flying mole amps, PMC speakers)

Τώρα, μία φορά έκανα project σε υφηλή ανάλυση και αυτό γιατι η μουσική κατέληξε σε DVD και όχι σε CD! (το DVD χωράει dobly 5:1, ή στέρεο 24-bit, 96 KHz). Πήγα στα 24-bit, και επειδή τα samples που χρησιμοποιούσα είχαν τέτοια ποιότητα, η διαφορά ήταν φανερή! Αλλά όχι για το KHz παρά για τα παραπάνω bit, νομίζω.

Να πω κι εγώ το ευχαριστώ μου στον Haryy πάντως! Μόνο καλό μας κάνει αυτό το πείραμα!

 
Thanks guys... ;D

Yameth βέβαια μιλάμε για ..ψιλά γράμματα που ακούμε (ή νομίζουμε ότι ακούμε ;D ;D :D) οι καμμένοι sound freaks (αν το θεωρεί κάποιος προσβολή τον εξαιρώ από την κατηγορία :))

Για να σοβαρευτώ όμως, έχω την βαθιά πεποίθηση πως οποιαδήποτε βελτίωση του ήχου επιτυγχάνουμε αυτό περνάει υποσυνείδητα στον ακροατή και θα τον κάνει να ακούσει με μεγαλύτερο ενδιαφέρον και για περισσότερη ώρα το ίδιο "βελτιωμένο" προϊόν σε σχέση με το "απλό". Δεν χρειάζεται να καταλαβαίνει το γιατί το κάνει.. Γιαυτό έχει και αξία αυτό το "ψάξιμο" κατά τη γνώμη μου.

 
haryy είπε:
Για να σοβαρευτώ όμως, έχω την βαθιά πεποίθηση πως οποιαδήποτε βελτίωση του ήχου επιτυγχάνουμε αυτό περνάει υποσυνείδητα στον ακροατή και θα τον κάνει να ακούσει με μεγαλύτερο ενδιαφέρον και για περισσότερη ώρα το ίδιο "βελτιωμένο" προϊόν σε σχέση με το "απλό". Δεν χρειάζεται να καταλαβαίνει το γιατί το κάνει.. Γιαυτό έχει και αξία αυτό το "ψάξιμο" κατά τη γνώμη μου.
Συμφωνώ απόλυτα. Απλά λέω ότι αν όλα είναι τέλεια σε μια αλυσίδα, αυτός ο κρίκος (ο ρυθμός δειγματοληψίας) ίσως να παίζει τον μικρότερο ρόλο.
 
Τελευταία επεξεργασία από moderator:
αντε που είναι ο εθελοντης που θα βάλει τον εξοπλισμό να κάνουμε το νεο τεστ

από τα 192kHz σε 3 συχνότητες και να δούμε αν ακούμε τίποτα 8)

 
OurDarkness είπε:
blue,

δεν είναι αδικαιολόγητη η απορία σου. Το link αναφέρεται σε combination tones (τόνων αθροίσματος και διαφοράς), οπότε ας χρησιμοποιήσω ένα παράδειγμα που να έχει και τα δύο.

Ας πάρουμε δύο ημιτονοειδή σήματα 40 KHz και 30 KHz και ας τα πούμε X και Υ. Και τα δύο είναι μή ακουστά σήματα, από την στιγμή που είναι πολύ πιο πάνω από το πάνω όριο ακοής. Τα δύο αυτά σήματα τα στέλνουμε σε ένα κύκλωμα που κάνει δακτυλιοειδή διαμόρφωση (ring modulation). Στην δακτυλιοειδή διαμόρφωση δύο τέτοιων σημάτων, το αποτέλεσμά τους είναι ένα σήμα το οποίο περιέχει ταυτόχρονα δύο "συστατικά": ένα είναι το άθροισμα τους και άλλο ένα είναι η διαφορά τους.

Αρα έχουμε:

X + Y = 70 KHz (μη ακουστό σήμα)

X - Y = 10 KHz (ακουστό σήμα)

Βλέπουμε λοιπόν ότι υπάρχει περίπτωση 2 μη ακουστά σήματα, μέσω διαμόρφωσης (στην συγκεκριμένη περίπτωση είναι ουσιαστικά amplitude modulation), να παράγουν ένα ακουστό σήμα. Διάλεξα επίτηδες αυτά νούμερα Χ και Υ για να δείξω τι γίνεται σε περίπτωση που αυτά δεν υποστούν band-limiting. Σε ένα modular με εφαρμογή CV στην χροιά των ταλαντωτών μπορεί κάλλιστα να επιτευχθούν αυτές οι τιμές (30 και 40 KHz) και δεν υπόκεινται σε κανενός είδος περιορισμούς (αν εξαιρέσουμε φυσικά τα ηχεία).

Το πρόβλημα ανακύπτει αν αυτές οι δύο τιμές (ή οποιεδήποτε άλλες πάνω από Nyquist/2) παραχθούν ψηφιακά. Το καίριο ερώτημα είναι πρέπει ή δεν πρέπει να περιορισθούν ευθύς εξαρχής από γεννησιμιού τους μέσα στον κώδικά ή μπορούμε να τις αφήσουμε ανεξέλεγκτες να παράγουν οποιοδήποτε αποτέλεσμα και να επαφιόμαστε στο ότι θα φιλτραριστούν από το lowpass φίλτρο του μετατροπέα; Εάν δεν πρέπει να περιοριστούν γιατί φοβούμαστε μήπως χάσουμε κάποια πολύτιμη μουσικά πληροφορία, τότε είμαστε σίγουροι ότι τα αποτελέσματά τους (τα οποία είναι μέσα στο ακουστό εύρος) δεν παράγουν ηχητική σαβούρα (π.χ. aliasing);

Στο παράδειγμα που ανέφερα: Τι δουλειά έχει ένα ring modulated σήμα, ξεκάρφωτο στα 10 KHz? Θα μπορούσε να είναι σε διάφορα άλλα σημεία που είναι τελείως μη προβλέψιμα. Θα μπορούσε ακόμα να είναι σε πολλαπλά σημεία εάν τα αρχικά σήματα δεν ήταν απλές κυματομορφές. Θα μπορούσε να είναι ένα σύνθετο σήμα και όχι ένα απλό ημιτονοειδές σήμα. Εδώ ναι μεν έχουμε ένα σήμα στα 10 KHz αλλά το σήμα αυτό δεν μπορεί να διαχωριστεί από το σήμα στα 70 KHz παρά μόνο με ένα PLL κύκλωμα.

Είναι σημαντικό να μην ξεχνάμε το ακουστικό μας εύρος. Ότι και να παραχθεί, είτε απ' ευθείας από το εκάστοτε όργανο, είτε από σπόντα μέσω modulation, πρέπει τα αντικατοπτριζόμενα στοιχεία μέσα στο ακουστικό μας εύρος να μην είναι ηχητική σαβούρα και να είναι το κατά δύναμη προβλέψιμα. Δεν είμαι πολύ σίγουρος κατά πόσο είναι προβλέψιμα μιας και η σύνθεση που συνήθως παράγει τα πιο απρόβλεπτα αποτελέσματα είναι η FM μεταξύ πολύπλοκων κυματομορφών.

Στην περίπτωση που απλά έχουμε κάποια συνήχηση που παράγει (ή νομίζουμε ότι παράγει) κάποια τρίτα σήματα, φαντάζομαι ότι πάλι πρέπει να δούμε κατά πόσο είναι προβλέψιμα (ή έστω αρεστά). Δηλαδή να συνηχούν 2 σήματα, να παράγουν ένα καινούριο το οποίο είναι εκτός ακουστικών ορίων, και αυτό με την σειρά του να έχει κάποιο mirroring μέσα στο ακουστό εύρος το οποίο είναι επιθυμητό... Δεν ξέρω.. εξ άλλου μερικές φορές και το aliasing παράγει ενδιαφέροντα αποτελέσματα, άρα κρίνοντας το έτσι, γιατί να το κόψουμε;

Ποιά είναι η γνώμη σου;

Διαβασα προσεκτικα το ποστ σου και μου δινει την εντυπωση οτι δεν απανταει στο ζητημα που εθεσα. Το ερωτημα δεν ηταν ποτε για το αν θα παραχθουν ψηφιακα οι 2 τονοι, αλλα μιλησα συγκεκριμενα για φυσικα σηματα που υφιστανται δειγματοληψια. Τελικά, όχι μόνο δεν κατάλαβα αν απαντάς στο ερώτημα, αλλά ουτε καν αν συμφωνείς ή διαφωνείς με την άποψη μου (την οποία δεν έχω διασταυρώσει με βιβλιογραφία, γι' αυτό τη θέτω ως άποψη και όχι ως θεωρητικό δεδομένο, ενώ μου φαίνεται ακόμα οτι θεωρητικά στέκεται πλήρως).

Συγκεκριμενα , η διατυπωση του Θ. Shannon-Nyquist ακολουθείται από την πρόταση οτι "στην πραγματικότητα, τα φυσικά σήματα περιέχουν πρακτικά άπειρες αρμονικές", δηλαδή ξεκαθαρίζεται οτι πλήρης αναπαράσταση ενός φυσικού σήματος δεν μπορεί να υπάρξει, παρά μόνο με φιλτράρισμα. Στη συνέχεια ξεκινούν οι παραδοχές για το ποσοστό συνολικής ενέργειας που θα υπάρχει στο μη φιλτραρισμένο κομμάτι , ώστε να θεωρείται η αναπαράσταση επαρκής.

Αυτή η αλληλουχία νοημάτων συχνά παρακάμπτεται όταν αναφερόμαστε στο εν λόγω θεώρημα (το οποίο ώς θεώρημα είναι αναμφισβήτητο οτι στέκει και λειτουργεί), οπότε ενδεχομένως οδηγούμαστε σε ημι-αληθή συμπεράσματα.

Αυτά είναι δεδομένα. Αυτό που έθεσα περιλαμβάνει μια προσπάθεια μου να καταλάβω τι ακριβώς είναι αυτό που χάνεται στις δειγματοληψίες που περιέχουν πληροφορία που αντιστοιχεί σε ελάχιστα μικρότερο ποσοστό της συνολικής ενέργειας του κύματος που προστάζουν οι παραδοχές της θεωρίας.

Ως εκ τουτου ποτε δεν τεθηκε ζητημα γύρω από άλλα παρελκόμενα της δειγματοληψίας και της AD μετατροπής (aliasing, intermodulation distortion κλπ), για το λόγο οτι μιλάμε εξαρχής για τη σύλληψη ενός πραγματικού ήχου (της ακουστικής κιθάρας) και κατά πόσο ανταποκρίνεται αυτή στην κοντινότερη απόδοση της απευθείας ακουστικής αίσθησης, όπως δηλαδή γίνεται αντιληπτός ο ήχος πριν την ηχογράφηση. Δηλαδή δεν τεθηκε ποτε ζητημα αν οι τονοι συνδυασμού θα είναι ευχάριστοι, δεδομένου οτι είναι υπαρκτοί και περιλαμβάνονται στο περιεχόμενο που αντιλαμβάνεται ο ακροατής κατά την αρχική μουσική εκτέλεση (αυτονόητη η ύπαρξη τους ως μέρος του αυθεντικού ήχου που καλούμαστε να αναπαράγουμε).

 
blue είπε:
Συγκεκριμενα , η διατυπωση του Θ. Shannon-Nyquist ακολουθείται από την πρόταση οτι "στην πραγματικότητα, τα φυσικά σήματα περιέχουν πρακτικά άπειρες αρμονικές",
Δεν υπάρχουν άπειρες αρμονικές. Ούτε καν ο θόρυβος που είναι η πιο πλούσια κυματομορφή, είτε φυσικός είτε τεχνητός, έχει άπειρες αρμονικές. Τα ακουστικά όργανα παράγουν τόνους των οποίων η ένταση φθίνει μέχρι τελικής σιγής λόγω τριβής των μορίων του αέρα. Ακόμη και να υπάρχουν αρμονικές πάνω από τα 22,05 KHz, για ποιό λόγο να μπούμε στην διαδικασία να τις ηχογραφήσουμε; Αφού κατ' αρχάς δεν τις ακούμε!

Στη συνέχεια ξεκινούν οι παραδοχές για το ποσοστό συνολικής ενέργειας που θα υπάρχει στο μη φιλτραρισμένο κομμάτι , ώστε να θεωρείται η αναπαράσταση επαρκής.
Δεν θα το έλεγα ακριβώς παραδοχή. Το 99,99% των ανθρώπων δεν ακούνε πάνω από 22,05 KHz. Ίσως κάπου να υπάρχει κάποιος προικισμένος άνθρωπος που ακούει και λίγο παραπάνω, αλλά αυτό αποτελεί εξαίρεση και όχι κανόνα. Ακόμη και το εύρος ακοής των ανθρώπων να ήταν μέχρι τα 40 KHz, πάλι το θεώρημα ισχύει. Θα κάναμε δειγματοληψία στα 80 KHz, (ίσως και λίγο παραπάνω) όχι για να πάρουμε όλη την πληροφορία (γιατί αυτό είναι το μόνο σίγουρο) αλλά για να ακούσουμε όλη την πληροφορία.

Όσον αφορά στο link που παρέθεσες (σχετικά με combination tones), είτε κάτι προκύπτει απ' ευθείας από ένα φυσικό όργανο, είτε από κάποιο συνδυασμό τους, αυτό που μας ενδιαφέρει είναι πάλι το τι γίνεται μέσα στο ακουστικό εύρος. Δε νομίζω να υπάρχει χρήσιμη ακουστική πληροφορία εκτός του ακουστικού μας εύρους. Αν υπάρχει θα είναι αμελητέα και η μελέτη της θα ανήκει ίσως στην ψυχοακουστική και είμαι σχεδόν σίγουρος ότι τα αποτελέσματα θα είναι επιεικώς διφορούμενα.

Αυτό που έθεσα περιλαμβάνει μια προσπάθεια μου να καταλάβω τι ακριβώς είναι αυτό που χάνεται στις δειγματοληψίες που περιέχουν πληροφορία που αντιστοιχεί σε ελάχιστα μικρότερο ποσοστό της συνολικής ενέργειας του κύματος που προστάζουν οι παραδοχές της θεωρίας.
Στα 44,1 KHz το lowpass φίλτρο του μετατροπέα έχει συχνότητα αποκοπής που βρίσκεται συνήθως από τον τύπο:

44,1 KHz * 0,455 (δεν είμαι σίγουρος 100% αν είναι 0,455 καθότι δεν μπορώ να βρώ ένα pdf από το οποίο έχω την πληροφορία αυτή).

Το πάνω ισούται με 20,0655 Hz που είναι μέσα στο ακουστικό εύρος. Γενικά, ισχύει ότι όσο πιο απότομο είναι ένα φίλτρο τόσο αυξάνει η πιθανότητα να έχουμε διάφορες αλλοιώσεις στην φάση στην παραπάνω συχνότητα. Βγήκαν λοιπόν κάποιοι και είπαν ότι τα hi-hat που παράγουν αρκετές υψίσυχνες συχνότητες δεν ακούγονται καθαρά κ.λ.π. καθ' ότι κάποιες από τις αρμονικές τους είναι κοντά στα 20,0655 Hz με αποτέλεσμα να υφίστανται μία αλλοίωση (μικρή βέβαια).

Οπότε μετακινηθήκαμε στα 48 KHz και τώρα το φίλτρο λειτουργεί μέχρι και 48 * 0,455 = 21,84 KHz.

Αν το φίλτρο ήταν ιδεατό, δηλαδή ένα πραγματικά brickwall φίλτρο σαν αυτό:

4372952221_ee58d944ae_o.jpg


τότε δεν θα είχαμε κανένα απολύτως πρόβλημα. Επειδή όμως δεν είναι ιδεατό και επειδή εμφανίζεται και το φαινόμενο Gibbs (http://en.wikipedia.org/wiki/Gibbs_phenomenon) πρέπει να ελαττώσουμε την μετάδοση σε κάποιες από τις χαμηλότερες συχνότητες και να την αυξήσουμε σε κάποιες από τις υψηλότερες συχνότητες. Αυτό σημαίνει ότι το ακουστικό σήμα θα υποστεί μία μικρή αλλοίωση όπως φαίνεται στο παρακάτω σχήμα:

4373707278_b5c511f7de_o.jpg


Βλέπεις ότι υπάρχει ένα μικρό θεματάκι καμπυλότητας. Όσο αυξάνεται η συχνότητα δειγματοληψίας τόσο αυτή η πληγείσα περιοχή μεταφέρεται έξω από το ακουστικό εύρος. Στα 48 KHz κατά την προσωπική μου εμπειρία είναι μια χαρά. Στα 96 KHz είναι σαφώς καλύτερα και σε καμμία περίπτωση δεν χρειάζεται παραπάνω.

Μόλις βρω και το pdf που ψάχνω θα στο στείλω, γιατί ίσως να μην εξηγώ κάτι καλά ή να καταλάβα λάθος.

:)

 
Δεν νομίζω ότι είχαμε ξεφύγει τόσο ώστε να χαθεί το ενδιαφέρον από την υψηλή ανάλυση αλλά anyway..

Blue, πριν από κάθε συζήτηση για overtones και harmonics θα πρέπει σε κάθε περίπτωση να λαμβάνουμε υπόψιν μας τo frequency response των μικροφώνων που χρησιμοποιούνται

Στο συγκεκριμένο τεστ το μικρόφωνο έχει αυτό:

5b1e53a1414b7fb0_at4040_freq.jpg


..το οποίο σημαίνει ότι στα 20kHz ήδη είμαστε στα -5db.

Από τη στιγμή βέβαια που δεν βλέπουμε τίποτα παραπέρα μπορούμε να υποθέσουμε ότι το response εκτείνεται για αρκετά παραπάνω..

Αν ηχογραφεί κάποιος με κάποιο DPA π.χ. τότε ίσως πρέπει να λάβει παραπάνω υπόψιν του αυτόν τον παράγοντα.

Ενδιαφέρον θα είχε ακόμη για μένα να συζητήσουμε τα εντός του ακουστικού φάσματος.

Π.χ.

α) Τι χάνει(?) ένας converter κατά τη διάρκεια της διαδικασίας sample-and-hold και συγκεκριμένα στο στάδιο hold όπου περιμένει μέχρι να "πάρει" το επόμενο snapshot από τον αναλογικό ήχο?

β) Κατά τη διάρκεια του hold, ο πυκνωτής του συγκεκριμένου κυκλώματος έχει ένα διαφορετικό κάθε φορά βολτάζ που αντιστοιχεί στην τιμή που έχει "μεταφράσει" σε κάθε sample.

Mέχρι όμως το κύκλωμα να πάρει το επόμενο sample, ο πυκνωτής χάνει volts (droop time) και όσο πιο πολύ περιμένει (βλέπε χαμηλότερο sample rate) τόσο πιο πολύ βολτάζ θα χάσει και άρα τόσο περισσότερο λανθασμένη τιμή θα δωθεί στο επόμενο κύκλωμα που δεν είναι άλλο από τον AD converter.

Άρα είναι λογικό να υποθέσουμε ότι ένα μεγαλύτερο sample rate θα βελτιώσει την απόδοση του converter σε αυτή την παράμετρο.

 
Τελευταία επεξεργασία από moderator:
Καλησπέρα και από μένα.

Εξαιρετικό το θέμα που άνοιξε ο haryy καθώς δίνει την αφορμή για σοβαρή κουβέντα γύρω από το συγκεκριμένο αντικείμενο. Θα ήθελα λοιπόν να σας διατυπώσω και εγώ την απλοϊκή άποψή μου όσον αφορά την αύξηση της ανάλυσης σε ένα ψηφιακό σήμα στηριζόμενο βέβαια στα δείγματα που ανέβασε ο haryy.

1. Ακούγοντας το δεύτερο κυρίως σετ τεσταρίσματος το οποίο έχει πολύ καλύτερες προϋποθέσεις ώστε να χαρακτηριστεί αξιόπιστο, και χρησιμοποιώντας ακουστικά AKG 271 με DAC και headphone preamp αυτόν του focusrite platinum (από το οποίο γενικά είμαι αρκετά έως πολύ ευχαριστημένος τουλάχιστον ως προς το συγκεκριμένο τμήμα του), δεν παρατήρησα διαφορά.

Είναι όμως μόνο ένα track. Πιστεύω ακράδαντα ότι με 5-6 tracks ταυτόχρονα τότε θα μπορούσαμε να πούμε ότι διακαιολογείται σε άνα βαθμό η χρήση μιας παραπάνω ανάλυσης από τα καλά 44.1KHz και τα σίγουρα 48KHz στα 96KHz.

Από την άλλη, τα 96KHz πιστεύω θα ήταν πολύ πιο χρήσιμα αν έπρεπε το αρχείο να υποστεί κάποιου είδους επεξεργασία. Τότε ναι, και χρειάζονται και ακούγονται τα παραπάνω KHz ανάλυσης καθώς όλες οι μαθηματικές πράξεις που πραγματοποιεί ο επεξεργαστής ενός Η/Υ γίνονται με πολύ μεγαλύτερη ακρίβεια καθώς απαιτούνται λιγότερες στρογγυλοποιήσεις.

2. Αν όμως ήταν να διαλέξω εγώ προσωπικά μεταξύ των παραπάνω KHz και των παραπάνω bits η πλάστιγγα θα έγερνε σαφέστατα προς τα παραπάνω bits μιας και ενώ θεωρητικά με τα 44.1KHz έχουμε την πλήρη αναπαράσταση του σήματος στην έξοδο του βαθυπερατού φίλτρου του DAC, με τα bit πάντα έχουμε διακριτοποίηση των σταθμών. Θεωρητικά λοιπόν τα bit είναι αυτά που "ευθύνονται" για την πτώση της ηχητικής ποιότητας και όχι τα KHz. Ειδικά όταν ηχογραφούμε ένα take με 16bit και με 24bit η διαφορά, ιδίως σε μια μίξη των 5-6 οργάνων, το παραπάνω "βάρος" των αρχείων αποσβένεται άμεσα λόγω της σημαντικά υψηλότερης ποιότητας που λαμβάνουμε.

 

Απαντήσεις

Trending...

Νέα θέματα

Back
Top