Audio resolution test: 192kHz vs 96kHz vs 44.1kHz

Θα συμφωνήσω απόλυτα με τον skantzos. Έχεις καταλάβει απόλυτα το σκεπτικό μου και τις παγίδες που κρύβονται αν χρησιμοποιηθεί σαν μέσο ψηφιακή πληροφορία.

Ο σκοπός μου ήταν να είναι η πληροφορία πρωτογενής και αναλογική χωρίς τους περιορισμούς οποιουδήποτε μέσου αποθήκευσης είτε ψηφιακού, είτε αναλογικού.

Το μεν αναλογικό έχει αρκετούς περιορισμούς που τους ανέφερε και ο yameth, να μην τους αναφέρω ξανά αλλά το προτιμώ σαν "αναγκαστικό" μέσο εάν θέλουμε σώνει και καλά να κρίνουμε συχνότητες δειγματοληψίας με σταθερή πηγή.

Για το ψηφιακό μέσο έχω την άποψη πως είναι τελείως άκυρο αφού τα ήδη υπάρχοντα artifacts από τις συνεχείς μετατροπές ad, da και ξανά ad δεν με προδιαθέτουν ώστε να το λαμβάνω σοβαρά υπόψιν για ένα τέτοιο τεστ. Επιπλέον θα έπρεπε για να είναι λίγο περισσότερο αξιόπιστο, να ήταν ηχογραφημένο ήδη σε μεγάλη δειγματοληψία.

Οπότε δεν συμφωνώ καθόλου ότι το τεστ δεν έχει αξία και ότι θα ήταν πιο καλό να δίναμε σαν πηγή μια ήδη υπάρχουσα ψηφιακή ηχογράφηση. Νομίζω ότι η όσο το δυνατόν ελεγχόμενη αναλογική πηγή αποκαλύπτει περισσότερα πράγματα.

Υπάρχουν κάποια όρια στο να πεις ότι η απόδοση μεταξύ των takes "παραμορφώνει" τον σκοπό του τεστ και νομίζω ότι δεν τα ξεπέρασα. Νομίζω ότι το αρχικό ποστ μου το δείχνει αυτό.

Επίσης ξαναλέω ότι οι μικροδιαφορές μεταξύ των takes δίνουν μία επιπλέον αξία κατά τη γνώμη μου γιατί είναι παράδειγμα real-world, δηλαδή, αν δεν διακρίνουμε διαφορές μεταξύ τους τότε σημαίνει ότι δεν ακούμε διαφορά ανάμεσα στις δειγματοληψίες οπότε και απαντάμε αρνητικά στη ερώτηση για το αν αξίζει να ηχογραφούμε σε υψηλά sample rates.

Μπορεί να υπάρχουν και κάποιοι όμως (ανάμεσά τους και εγώ) που διακρίνουν διαφορές που έχουν να κάνουν και πέρα από το performance. Aυτό είναι προς κρίση του καθενός μας.

υγ. Ελπίζω σε λίγο να προλάβω να κάνω το τεστ με το ambient μικρόφωνο.

 
πάντως εμένα μου φαίνεται πως τελικά στο συγκεκριμένο δίλλημα, οι διαφορές είναι τόσο μικρές που μόνο για λόγους "άποψης" κάποιος θα χρησιμοποιούσε το ανάλογο sample rate.

παρατήρησα στο Jack control που χρησιμοποιώ στην ubuntu οτι όσο μεγαλύτερο το sample rate τόσο μικραίνει το (ενδεικτικό) latency. Γιατί γίνεται αυτό? Να ένας καλός λόγος να χρησιμοποιείς μεγαλύτερο sample rate!

 
Είτε γράψεις δύο ξύλα που χτυπάς, είτε μια ψηφιακή αναπαράσταση τους, αυτό που σε αφορά είναι το ΠΩΣ θα γραφτούν. Ας είναι ο πιό συνθετικός ήχος (όχι ότι δεν βοηθάει η σωστή επιλογή ήχων, για ευκολότερη αναγνώριση της πληροφορίας) εσύ τελικά θα συγκρίνεις τα 3 αρχεία που θα προκύψουν από την ηχογράφηση, αφού ο ήχος θα είναι σταθερός και το μόνο διαφορετικό μεταξύ τους θα είναι η ανάλυση.

 
Νομίζω ότι το masking effect από τις 2 επιπλέον μετατροπές του ηχογραφημένου θα κάνουν δισδιάκριτες τις διαφορές. Αν όμως γίνει όπως στο παράδειγμα που θέλω να ανεβάσω, δηλαδή να συμμετέχει μεγάφωνο-χιλιάδες ανακλάσεις-μικρόφωνο τότε ίσως το μειονέκτημα αυτό αναιρείται. Όπως και να 'χει το τεστ αυτό νομίζω ότι θα σας ικανοποιεί αφού θα έχει σταθερή πηγή.

Οff for testing! ;D

 
Ακούστε άλλο ένα (το τελευταίο ουφ!) τεστ από μένα με ένα φορητό cd player να παίζει ένα track και το μικρόφωνο σε 40 πόντους απόσταση να ηχογραφεί και στα 3 sample rates.

Ήθελα να το βάλω πιο μακριά αλλά χάνονταν τα μπάσα, οπότε η συγκεκριμένη απόσταση είναι ένας συγκερασμός λήψης φυσικού χώρου και ανακλάσεων μαζί με τον direct ήχο.

Τα συμπεράσματα δικά σας! ;)

yanni44.1_original.wav

 

Attachments

Καταρχάς αν δεν ήξερα ποιο αρχείο είναι ποιο δε θα καταλάβαινα διαφορά...αλλά επειδή και στα πρώτα δείγματα είχα τις ίδιες εντυπώσεις η ταπεινή μου άποψη είναι:

στα 192 νομίζω οτι λεπταίνει ο ήχος(ίσως αυτό να το αντιλαμβάνομαι σαν ποιο αναλυτικό..)

στα 96 μου ακούγεται καλύτερος(τρομάρα μου!),λες και έχει περισσότερη ένταση ένα πράγμα&έχει την ίδια καλή ανάλυση!

στα 44 απλά η διαφορά με τα άλλα ήταν σαν τη διαφορά αρχείου wav και mp3 320Kbs,δηλαδή σα να έχανε η ουρά απο το snare...

τεσπα haryy να σαι καλά..μας έκαψες  ;D

Α!η ακρόαση έγινε με τα sennheizer eh2200(έχουν υπερβολικό αέρα-πρίμο και βοηθάνε!)

 
Πολύ ενδιαφέρον πράγματι το thread

ωστόσο πρεπει να γίνει κατανοητό ότι ακόμη κι αν η μεγαλύτερη δειγματολειψία υπερέχει κατά 1% μιας χαμηλότερης τότε σε ένα σύνολο 30 ή 40 καναλιών μπορείτε να υπολογίσετε τη διαφορά....

Μοιάζει σαν το τεστ με οποιοδήποτε φτηνιάρικο plug in....Αν βάλεις το χειρότερο plug in Eq  κόσμο δίπλα σε ένα καλύτερο θα ακούσεις (αν ακούσεις) μια πολύ μικρή διαφορά...Αν χρησιμοποιήσεις 40 τέτοια όμως.....

Σχετικά με τη φυσική ή όχι πηγή που αναφέρει κι ο Yameth και ο Νικόδημος, σωστά όπως αναφέρει δεν υπάρχει διαφορά, ωστόσο θεωρώ ότι για τέτοιου είδους τεστ είναι καλό να γίνεται με μια πηγή που να μην έχει κομπρεσαριστει (όπως σε όλα τα cd), να μεριλαμβάνει LF χώρου, που συνήθως είναι κομμένες κλπ, και να γίνει σύγχρονη επαναδρομολόγηση του σήματος όπως λέει και ο Νικόδημος.

Η δική μου εμπειρία σε ένα κομμάτι Rock στο παρελθόν με τέτοια δειγματοληψία (192) σε όλα τα tracks (τύμπανα, μπάσο, 4 πλήκτρα, και 5 κιθάρες, και δύο φωνές, σύνολο 27 κανάλια, πράγματι η διαφορά ήταν τεράστια, σε βαθμό που δε μπορούσαμε να ακούσουμε το cd των 44,1/16. Επίσης παρατήρησα μια δυσκολία στη διαχείριση των αρχείων (οκ, παλιότερης γενιάς σκληροί και μνήμες), αλλά και από το πρόγραμμα και τα plug ins. Όχι δε "σερνόταν" αλλά όλα ήταν "κάπως". Έχω επιστρέψει έκτοτε στο 48/24 αλλά αν κάποτε αλλάξει το standard cd/audio/whatever..... format (εννοώ μαζικά, κάθε σπίτι, κάθε αυτοκίνητο κλπ) θα ακούσουμε όλοι καλύτερα.. 

 
Καλησπέρα στην παρέα.Πολυ ενδιαφέρον blind test το οποίο νομίζω ήδη αποδεικνύει οτι το κυνηγητό των khz είναι μάλλον ανούσιο...(αν η μπάντα δεν παίζει καλά... χε,χε::)).Αν τόσα ζευγάρια αυτιά εδω μέσα δεν μπορούν να πουν με σιγουριά πιο απ τα τρια δείγματα είναι καλύτερο φανταστείτε ο μέσος ακροατής...άλλωστε υπάρχουν στην αγορά μηχανήματα των 300€ που υποστηρίζουν οτι γραφουν στα 192khz με φτωχά όμως αποτελέσματα,ενω ταυτόχρονα ενας καλος stereo convertor στοιχίζει 2000€.Αρα το παιχνίδι μάλλον παίζεται στην ποιότητα του μετατροπέα απο αναλογικό σε ψηφιακό παρά στα πόσα khz υποστηρίζει οτι ηχογραφεί (αυτό το έχει πεί ο Holdsworth σε συνεντευξη πολλά χρονια πρίν)Παρόλα αυτά το τρίτο δείγμα (αν δεν είναι παγίδα το 192 που γράφει) έχει πιο έντονα ψηλά και πιο πολύ "αέρα",χωρίς απαραίτητα αυτό να είναι καλό.Πάντως αν είχα να διαλέξω καποιο απ τα τρια δείγματα για να μπεί στο cd μου για παράδειγμα,το πρώτο θα διάλεγα.Μου ακούγεται πιο σφιχτο και ελαφρώς πιο αναλογικό?.Ενδιαφέρον θα είχε και μια ηχογράφηση στα 88,2khz.Εχω ακούσει αρκετούς ηχολήπτες να το υποστηρίζουν.Anyway απλά οι απόψεις μου είναι αυτές και τίποτα παραπάνω.επόμενοοοοοοοοοος ;)

 
Στο 2ο test πιστευω αν δεν ηταν γραμμενα τα rates δεν θα καταλαβαινα διαφορα.Στα πρωτα 3 ειδα διαφορα και στα 3 με καλυτερο το 192 γιατι εξομαλυνε καποια παρασιτα απτο δεξι μου ακουστικο που ερχοντουσαν απτην κιθαρα τα οποια τα ειδα στα 96 και στα 44.1 kbps.Διαφορα απο 96 και 44.1 δεν ειδα,απειροελαχιστη.Χρησιμοποιω Asus Essence ST με Sennheiser HD 555 headphones στο build in head amp της καρτας με κανενα EQ ενεργοποιημενο

 
Άν θέλετε να κάνετε blind test στον εαυτό σας μπορείτε να κάνετε το εξής:

Γράψτε σε ένα cd τα 3 tracks από το τελευταίο τεστ και ακούστε το καθένα από 3-4 φορές. Μετά βάλτε το στο repeat, πατήστε Play και πατήστε το κουμπί για το επόμενο track πολλές φορές τυχαία. Χωρίς να βλέπετε φυσικά, ακούστε για λίγο το κομμάτι που έχει μπει στην τύχη και μόλις κάνετε την "μαντεψιά" σας, κοιτάξτε στον Player και δείτε ποιο κομμάτι παίζει. Ήταν αυτό που νομίζατε? ;)

EDIT: Επειδή έχει αναφερθεί 2 φορές (την μία με pm) η πιθανότητα τρικ στο τελευταίο τεστ, να πω ότι δεν υπάρχει τέτοιο πράγμα πουθενά σε κανένα τεστ. Απλώς στα τελευταία tracks έκοψα ισόποσα το τέλος για να χωράνε στο upload, οπότε και το ίδιο μέγεθος.

Δεν υπάρχει κανένα κόλπο, το ξαναλέω

 
Τελευταία επεξεργασία από moderator:
Καλημερα  και χρονια πολλα !!

Αργια μητηρ πασων ....εξωσχολικων  δραστηριοτητων  ;D

Εκανα ακροαση εις διπλουν  .... α) sennheizer HD650 /Cardas cable /M.Fidelity pro 

b)  EAR/Bryston/Sonus faber

Kαι στις 2 ακροασεις  η αποψη μου ειναι οτι  οσο ανεβαινουν τα Khz ανεβαινει και η ποιοτητα  , οι διαφορες οντως ειναι πολυ μικρες  και μονο με ΄μελετη΄ της εγγραφης

τις καταλαβαινει καποιος  και φυσικα μονο με Α/Β τεστ  , αναλυση , διαφανεια και καλυτερος διαχωρισμος

οργανων ειναι αυτα που  δυσκολα αναμεσα σε 96 - 192 και αρκετα ευκολα αναμεσα σε 44 - 192  παρατηρησα  , ενω ηταν εμφανης η εξωτερικη ηχογραφηση.

....να βαλουμε και ενα 4 τεστ  με το κομματι  απο Βινυλιο ?  ;D

 
Το θεώρημα της δειγματοληψίας (Shannon), πάνω στο οποίο βασίζεται όλη η επιστήμη του DSP (Digital Signal Processing) και το οποίο έχει εκατοντάδες εφαρμογές, μας εξασφαλίζει ότι:

Η δειγματοληψία στα 44,1 KHz εμπεριέχει ΟΛΗ (αλλά ΟΛΗ όμως) την πληροφορία ενός σήματος του οποίου η μέγιστη συχνότητα είναι 22,05 KHz.

Μην μπαίνετε στο τριπάκι να σκεφτείτε ότι μεγαλύτερη δειγματοληψία σημαίνει μεγαλύτερη ποιότητα. Είναι λάθος να ενώσετε τα διακριτά σημεία του sampling για να σχηματίσετε την καμπύλη εκείνη που μοιάζει με την αρχική κυματομορφή που δειγματολαμβάνεται. Εδώ μιλάμε για διακριτές τιμές και δίνεται λαθέμενα η εντύπωση ότι περισσότερες τέτοιες τιμές σημαίνει καλύτερη ποιότητα. Δεν λειτουργεί έτσι το θεώρημα, γιατί απλά έχουμε ΟΛΗ την πληροφορία μέχρι τα 44,1 Khz. Φυσικά και μπορούμε να κάνουμε μεγαλύτερη δειγματοληψία, αλλά δεν χρειάζεται.

Η ανάγκη να μεταβούμε στα 48 KHz (πέραν φυσικά από την εξαναγκαστική ανάγκη εξέλιξης που διακατέχει τον άνθρωπο γενικότερα.. ;D) προέρχεται από το lowpass φίλτρο του AD/DA μετατροπέα. Κάθε φίλτρο (μηδενός εξαιρομένου) έχει κάποια χαρακτηριστικά όπως μείωση ένταση ορισμένων συχνοτήτων (typical attenuation), τον περιορισμό κάποιων συχνοτήτων (band limiting) και φυσικά τα χαρακτηριστικά φάσης. Επειδή λοιπόν όλα αυτά τα χαρακτηριστικά δεν είναι ιδεατά και επειδή επηρρεάζουν το σήμα, κρίθηκε αναγκαίο να μεταβούμε στην δειγματοληψία των 48 KHz, έτσι ώστε η μείωση της έντασης των συχνοτήτων που ΔΕΝ μας χρειάζονται (δηλαδή όλες πάνω από το 1/2 της συχνότητας Nyquist) να ΜΗΝ επηρρεάζει καμμία συχνότητα κάτω από τα 22,05 KHz και συνεπώς να έχουμε ακόμη μικρότερη αλλοίωση (ή και μηδαμινή αλλοίωση) του αρχικού σήματος.

Προσωπικά, δεν μπορώ να ακούσω κάποια διαφορά μεταξύ 48 KHz και 96 KHz. Αν όντως υπάρχει κάποια διαφορά αυτή θα είναι πολύ μικρή. Με καλούς μετατροπείς δεν μπορώ να ακούσω ούτε διαφορές μεταξύ 44,1KHz και 48 KHz. Αν όντως υπάρχει κάποια διαφορά αυτή θα είναι πολύ μικρή.

Φαντάζομαι ένα test, το οποίο αν μη τι άλλο θα ήταν πιο σωστά στημένο, θα περιλάμβανε την ηχογράφηση ενός σήματος χρησιμοποιώντας έναν πολύ καλό μετατροπέα σε 2-3 sampling rates (π.χ. 44,1 KHz, 48 KHz και 96 KHz - προς θεού όχι 192 KHz) μετά κάποιον φτηνό μετατροπέα και φυσικά την σύγκριση μεταξύ τους.

 
Όλα καλά τα γράφεις Ourdarkness απλώς να κάνω μια μικρή ένσταση για την έκφραση περί ενός άλλου πιο καλά στημένου τεστ.

Θα ήθελα να μου εξηγήσεις τι δεν ήταν καλά στημένο σε αυτά τα τεστ και να το συζητήσουμε αν θέλεις.

Η Mackie Onyx 400f που χρησιμοποίησα θεωρείται από ευρεία γκάμα χρηστών ότι διαθέτει AD conversion υψηλής ποιότητας. Επίσης, πέρα από το αρχικό τεστ χρησιμοποίησα μετά από υποδείξεις μελών, και άλλο τεστ σταθερής πηγής. Οπότε?? :)

 
Haryy,

θεωρώ ότι π.χ. αυτό:

haryy είπε:
...με αποτέλεσμα να είναι όσο το δυνατόν πιο "ίδια"  σε απόδοση και χαρακτήρα.

Πρώτα ηχογράφησα τις ακουστικές για να έχω σε σταθερή θέση το μικρόφωνο και μετά τις φωνές με άλλη θέση (για να είμαι σε σταθερή απόσταση χρησιμοποίησα Pop filter).
επιδέχεται βελτιώσεις. :)

(εκτός αν είσαι 100% σίγουρος ότι και στα 3 takes έπαιξες πανομοιότυπα)

 
Εγώ νομίζω μεν ότι έπαιξα πολύ κοντά μεταξύ τους τα takes, αλλά επειδή συζητήσαμε και για προσθήκη τεστ σταθερής πηγής συμπεριέλαβα και ένα τέτοιο στο τέλος.

 
Πέρα από αυτά προσωπικά θα με ενδιέφερε να μου πεις τι ακούς από τα τεστ.. ;)

 
Αν και αργοπορημένος, ας πω κι'εγώ την άποψή μου...

Κατέβασα όλα τα αρχεία και τα άκουσα σε A/B/C mode... δεν θα καταλάβαινα διαφορά, που να τα άκουγα ένα μήνα!

Επίσης, πιστεύω (κι'εγώ) ότι το πείραμα "μπάζει" από αρκετές μεριές.

Πρώτον, θα προτιμούσα κάποιο σήμα που να μην είχε ίχνη του χώρου που ηχογραφήθηκε. Δηλαδή, κάτι τελείως "dry"... Δεν ξέρω γιατί, αλλά μου φαίνεται ότι η ύπαρξη "ambience" στο σήμα δεν προσφέρει απολύτως τίποτα στην διαδικασία.

Δεύτερον, για το λόγο που αναφέρθηκε ήδη, ότι δεν μπορούν να βγουν συμπεράσματα από διαφορετικές πηγές, όσο ίδιο και αν είναι το παίξιμο, η φωνή κτλ. Ειδικά όταν ψάχνουμε ψύλλο στ'άχυρα.

Και τρίτο, επειδή δεν είναι δυνατό από υποκειμενικές παρατηρήσεις ("μου άρεσε το τάδε", "το δείνα είχε πιο πολύ "αέρα" κτλ.) να βγει αντικειμενικό συμπέρασμα, που φαντάζομαι ότι ήταν το ζητούμενο του πειράματος.

Θα προτιμούσα να είχε ηχογραφηθεί πχ. ένα απλό ημιτονοειδές pure tone σε διαφορετικές συχνότητες δειγματοληψίας, να υποστεί το όποιο downsampling/bit reduction, και έπειτα να μετρηθεί πχ. η αρμονική παραμόρφωση στα τελικά αρχεία για κάθε περίπτωση. Ή ακόμα θα μπορούσαν να χρησιμοποιηθούν pure tones 2-3 ενδεικτικών συχνοτήτων για τις 3 κύριες μπάντες (πχ. στα 200Hz, 2ΚΗz, 12KHz) για να δούμε και αν η συχνότητα του ήχου επηρρεάζει τα αποτελέσματα.

Επειδή -φαντάζομαι ότι- η όποια διαφορά, αν υπάρχει, θα είναι της τάξης του χιλιοστού του εκατοστού (στο THD), μου φαίνεται λίγο "κάπως" να βγει συμπέρασμα βασισμένο μόνο στα αυτιά μας.

Βέβαια, υπάρχει και η περίπτωση που κάποιος θόρυβος στο σήμα ίσως να παράγει πιο ελκυστικά αποτελέσματα (πχ. το dithering) οπότε ίσως και αυτό που προτείνω να μην είναι σωστό approach... Απλά θα προτιμούσα να υπήρχε κάτι το "αντικειμενικά μετρήσιμο" που να βοηθούσε να βγει ένα πιο ασφαλές συμπέρασμα.

Πάντως, ευχαριστώ τον Haryy για το ενδιαφέρον πείραμα και τον χρόνο που διέθεσε.

 
OurDarkness είπε:
Το θεώρημα της δειγματοληψίας (Shannon), πάνω στο οποίο βασίζεται όλη η επιστήμη του DSP (Digital Signal Processing) και το οποίο έχει εκατοντάδες εφαρμογές, μας εξασφαλίζει ότι:

Η δειγματοληψία στα 44,1 KHz εμπεριέχει ΟΛΗ (αλλά ΟΛΗ όμως) την πληροφορία ενός σήματος του οποίου η μέγιστη συχνότητα είναι 22,05 KHz.

Μην μπαίνετε στο τριπάκι να σκεφτείτε ότι μεγαλύτερη δειγματοληψία σημαίνει μεγαλύτερη ποιότητα. Είναι λάθος να ενώσετε τα διακριτά σημεία του sampling για να σχηματίσετε την καμπύλη εκείνη που μοιάζει με την αρχική κυματομορφή που δειγματολαμβάνεται. Εδώ μιλάμε για διακριτές τιμές και δίνεται λαθέμενα η εντύπωση ότι περισσότερες τέτοιες τιμές σημαίνει καλύτερη ποιότητα. Δεν λειτουργεί έτσι το θεώρημα, γιατί απλά έχουμε ΟΛΗ την πληροφορία μέχρι τα 44,1 Khz. Φυσικά και μπορούμε να κάνουμε μεγαλύτερη δειγματοληψία, αλλά δεν χρειάζεται.
θα διατυπωσω μια αποψη, την οποια δεν την εχω βρει καπου γραμμενη, αλλα την εχω συμπερανει (ενδεχομενως λανθασμενα) απο ενα συνδυασμο δυο διαφορετικων θεματων :

Ενα φυσικο οργανο περιλαμβανει πρακτικα απειρες αρμονικες και το Θ. Shannon λεει οτι θα φιλτραρουμε τις ανωτερες απο αυτες που επιτρέπονται, ωστε να εχουμε πληρη αναπαρασταση του σηματος. Φαινομενικα, επειδη ακουμε μεχρι 20k (και λιγοτερο στην πραγματικοτητα) λεμε οτι δεν πολυπειραζει και να φιλτραρουμε τις υψηλοτερης ταξης αρμονικες.

Επειδη ομως λαμβανει χωρα και το φαινομενο των τονων αθροισματος και διαφορας (οπως και αλλα φαινομενα παραγωγης νεων τονων που δεν εχουν παιχτει, αλλα ακουγονται), αναρωτιεμαι μηπως με το φιλτραρισμα  για να υπακουσουμε στο Shannon , δεν επιτρεπουμε την παρουσια των νεων αυτων αρμονικων (που ειναι ακουστες) που διαμορφωνουν τελικα τη χροια του ηχου ενος φυσικου οργανου.

Μηπως ενα απο τα πραγματα που ακουγονται στις ανωτερες δειγματοληψιες ειναι και αυτες οι υψηλης ταξης (ακουστες) αρμονικες που προκυπτουν απο τονους διαφορας ακομα ψηλοτερων (μη ακουστων) αρμονικων;

 

Trending...

Νέα θέματα

Back
Top