Βήμα 10: Error στο GeneralMixtureModel.from_samples() #57

vassilispan · 2020-12-19T17:40:29Z

Καλησπέρα σας.

Εδώ και μερικές μέρες έχουμε κολλήσει σε ένα πρόβλημα που αφορά τις βιβλιοθήκες.
Αρχικά τρέχαμε τον κώδικα με βάση τα default versions που είχαμε εγκαταστήσει, δοκιμάζοντας διάφορους συνδυασμούς παραμέτρων, ωστόσο οι επιδόσεις ήταν συνεχώς γύρω από το 50%. Παράλληλα έβγαζε και αυτά τα errors που αναφέρθηκαν στο issue #43 και προτείνατε να τα αγνοήσουμε καθώς αν τα υπόλοιπα είχαν γίνει σωστά θα έπρεπε να βγάζει σωστές τιμές.

Τελικά, εγκαταστήσαμε τα προτεινόμενα πακέτα σε νέο environment με βάση την δική σας αναφορά #44 .

Αρχικά, μας πέταγε πρόβλημα όταν δίναμε στο gmm.from_samples() το όρισμα Χ ως λιστα από λίστες (n_samples στοιχεία όπου κάθε στοιχείο έχει m_features) και ζήταγε np.array. Το error ήταν AttributeError: 'list' object has no attribute 'shape'. Σημειώνεται ότι στην αρχική default εγκατάσταση δεν μας πέταγε τέτοιο πρόβλημα, δεχόταν κανονικά το Χ.

Αφού μετατρέψαμε τη λίστα σε np.array (n_samples, m_features) έδινε Segmentation fault: 11.

Μετά μετατρέψαμε τον πίνακα σε 'float64' με βάση ένα σχόλιο στο #44. Εκεί γινόταν το εξής παράξενο. Σε διαφορετικές εκτελέσεις του προγράμματος έδινε διαφορετικά σφάλματα. Τη μία φορά έδινε segmentation fault, την άλλη έτρεχε την πρώτη επανάληψη του loop των n_states ενώ στην δεύτερη έδινε Segmentation fault: 11. Τρέχοντας το ξανά μας πέταγε το πρόβλημα με τον kmeans που είχε αναφέρει ένας συνάδελφος στο #44. Γενικότερα σε κάθε εκτέλεση έδινε άλλα σφάλματα.

Τελικά δοκιμάσαμε να χρησιμοποιήσουμε την MultivariateGaussianDistribution.from_samples(X) αντί για το gmm και μας έδινε επίδοση στο 92%...

Τι πρέπει να κάνουμε τωρα; Γιατί η περισσότερη ώρα της ενασχόλησης μας με την εργασία έχει αναλωθεί για την αντιμετώπιση αυτών των errors...

georgepar · 2020-12-21T13:20:11Z

Θυμάμαι αυτό το error εβγαινε σαν warning, αλλα δε σταματουσε η εκτέλεση και έπαιρνες κανονικά αποτελέσματα.
Δείτε αν είναι η ίδια περίπτωση και σε σας.

vassilispan · 2020-12-21T13:21:26Z

Δυστυχως μας σταματαει τελειώς την εκτέλεση δεν έχουμε τίποτα. Τις περισσότερες φορές με segmentation fault...

danae-charitou · 2020-12-21T13:41:33Z

Και σε εμάς (#60) παρουσιάζει την ίδια συμπεριφορά. Δηλαδή εμφανίζεται ως σφάλμα και όχι ως warning, οπότε δεν μπορούμε να παράξουμε κάποιο output και να συνεχίσουμε με τα επόμενα βήματα.

georgepar · 2020-12-21T14:47:33Z

Έτρεξα τη δική μας λύση για να επιβεβαιώσω (ακολουθώντας ακριβώς τις οδηγίες για στήσιμο περιβάλλοντος στο σχετικό issue) και βλέπω ότι σε κάποια ψηφία μπορεί να σκάει το GMM - HMM με n_mixture>1.

Αυτό που προτείνω να κάνετε είναι ενα απλό grid search για 2-3 τιμές του n_mixture σε κάθε ψηφίο:

for digit in digits:
   select X_train / y_train
   for n_states, n_mixture in (possible values for n_states, n_mixtures):
         try:
               model = train gmm hmm model
               log_likelihood = calculate model log likelihood
          except:
                # Failed to train GMM HMM model. Ignore
                log likelihood = infinity
          # n_mixture = 1 is equivalent to MultivariateGausian model
          # should converge for every digit
          # some digits benefit from larger number of mixtures
          keep model with smallest log likelihood.

Γενικά τα GMM / HMM μοντέλα από τη φύση τους είναι κάπως ευαίσθητα στο initialization, και είναι εύκολο να απειριστούν τιμές, ή να πέσεις σε περιπτώσεις όπου δεν μπορείς να αντιστρέψεις τον πινακα covariance. (και αυτό δεν είναι θέμα βιβλιοθήκης, είναι στη φύση του μοντέλου), οπότε η επιλογή των παραμέτρων τους πολλές φορές είναι αναγκαία.

Στον παραπάνω κώδικα θα δείτε ότι άλλα ψηφία μπορούν να μοντελοποιηθούν με 2-3 mixtures, ενώ άλλα μόνο με 1. (ανάλογα και τον αριθμό των features που χρησιμοποιείτε).

Πιο ευσταθές είναι, όπως έχετε δει και στο μάθημα, όταν αναγκάζουμε τον πίνακα συνδιακύμανσης να είναι διαγώνιος (δηλαδή όταν υποθέτουμε ότι οι γκαουσιανες στα mixtures είναι ανεξάρτητες). Έτσι γίνεται πολύ πιο εύκολη η εκπαίδευση και δεν πέφτουμε τόσο συχνά σε τέτοια θέματα.
(η αντιστροφή ενός full covariance matrix γίνεται με cholesky decomposition και απαιτεί σε όλα τα updates ο covariance matrix να παραμένει positive definite. Η αντιστροφή ενός διαγώνιου πίνακα είναι πολύ πιο απλή 1/(τα στοιχεία της διαγωνίου) και άρα δεν σκάει τόσο εύκολα.)

Αυτό είναι και το default στα μεγάλα frameworks αναγνώρισης φωνής, όπως το kaldi.

Αν θέλετε να το ψάξετε λίγο παραπάνω, στο framework που χρησιμοποιείτε αυτό γίνεται ως εξής

diagonal_gmm = IndependentComponentsDistribution([MultivariateGaussianDistribution(...) for _ in n_mixtures]) # random initialization of eatch Gaussian component

inikokali · 2020-12-21T15:30:12Z

Στη δική μας περίπτωση ακόμη και με n_mixtures=1 παρατηρείται το ίδιο σφάλμα όσες φορές και να τρέξουμε τον κώδικα σε οποιονδήποτε από τους δύο υπολογιστές της ομάδας. Επίσης το δικό μας σφάλμα είναι το σφάλμα που έχουν αναφέρει τα παιδιά στο #43 το οποίο αφορά μετατροπή complex128 σε float64. Επίσης η συμπεριφορά που περιγράφεται παραπάνω παρατηρείται είτε τρέξουμε τον κώδικα σε jupyter είτε με python script. Ωστόσο σε άλλο υπολογιστή ο κώδικας τρέχει κανονικά. Δηλαδή το error αυτό εμφανίζεται ως warning.

georgepar · 2020-12-21T15:55:55Z

Στη δική μας περίπτωση ακόμη και με n_mixtures=1 παρατηρείται το ίδιο σφάλμα όσες φορές και να τρέξουμε τον κώδικα σε οποιονδήποτε από τους δύο υπολογιστές της ομάδας. Επίσης το δικό μας σφάλμα είναι το σφάλμα που έχουν αναφέρει τα παιδιά στο #43 το οποίο αφορά μετατροπή complex128 σε float64. Επίσης η συμπεριφορά που περιγράφεται παραπάνω παρατηρείται είτε τρέξουμε τον κώδικα σε jupyter είτε με python script. Ωστόσο σε άλλο υπολογιστή ο κώδικας τρέχει κανονικά. Δηλαδή το error αυτό εμφανίζεται ως warning.

Σε αυτη την περιπτωση δεν εχετε στησει σωστα τα πακέτα 99%. Φτιάξτε ένα νεο conda environment και ακολουθήστε επακριβώς τις οδηγίες εδώ: #44 (comment)

Αν δεν δουλεύει ούτε αυτό τότε δε γνωρίζω τι μπορεί να φταίει με αυτά τα δεδομένα.

inikokali · 2020-12-21T16:46:06Z

Δυστυχώς έχουμε φτιαξει 3-4 διαφορετικα περιβάλλοντα με τεράστια προσοχή στις οδηγίες που δίνετε παραπάνω και δεν τρέχει σε κανένα. Στην περίπτωση αυτή εμείς πως μπορούμε να συνεχίσουμε?

efthymisgeo · 2020-12-21T19:46:40Z

Στη δική μας περίπτωση ακόμη και με n_mixtures=1 παρατηρείται το ίδιο σφάλμα όσες φορές και να τρέξουμε τον κώδικα σε οποιονδήποτε από τους δύο υπολογιστές της ομάδας. Επίσης το δικό μας σφάλμα είναι το σφάλμα που έχουν αναφέρει τα παιδιά στο #43 το οποίο αφορά μετατροπή complex128 σε float64. Επίσης η συμπεριφορά που περιγράφεται παραπάνω παρατηρείται είτε τρέξουμε τον κώδικα σε jupyter είτε με python script. Ωστόσο σε άλλο υπολογιστή ο κώδικας τρέχει κανονικά. Δηλαδή το error αυτό εμφανίζεται ως warning.

Σε linux? Επίσης δεν υπάρχει η δυνατότητα να το τρέξετε στο μηχάνημα που δεν σας σκάει?

inikokali · 2020-12-21T20:58:19Z

Ναι σε linux δουλεύουμε. Δυστυχώς όχι δεν έχουμε αυτή τη δυνατότητα. :(

michaelbzms · 2020-12-22T19:05:25Z

for digit in digits:
select X_train / y_train
for n_states, n_mixture in (possible values for n_states, n_mixtures):
try:
model = train gmm hmm model
log_likelihood = calculate model log likelihood
except:
# Failed to train GMM HMM model. Ignore
log likelihood = infinity
# n_mixture = 1 is equivalent to MultivariateGausian model
# should converge for every digit
# some digits benefit from larger number of mixtures
keep model with smallest log likelihood.

To hyperparameter tuning δεν πρέπει να γίνει στο ensemble των hmms που χρησιμοποιούμε ως κατηγοριοποιητή; Πως γίνεται να το εφαρμόσουμε σε κάθε hmm ξεχωριστά και γιατί στον παραπάνω κώδικα κρατάμε αυτό με το μικρότερο log likelihood αφου τελικά επιλέγουμε το μοντέλο με το μεγαλύτερο log likelihood?

georgepar · 2020-12-22T22:08:42Z

To hyperparameter tuning δεν πρέπει να γίνει στο ensemble των hmms που χρησιμοποιούμε ως κατηγοριοποιητή; Πως γίνεται να το εφαρμόσουμε σε κάθε hmm ξεχωριστά;

Για κάθε digit χωριστα. Απλα κάνετε tuning μέσα στη λουπα που τρέχει πάνω στα digits.

γιατί στον παραπάνω κώδικα κρατάμε αυτό με το μικρότερο log likelihood αφου τελικά επιλέγουμε το μοντέλο με το μεγαλύτερο log likelihood?

negative log likelihood. mea culpa

michaelbzms · 2020-12-23T10:02:40Z

Το μεγαλύτερο average loglikelihood; Γιατί για κάθε sample στο validation θα πάρουμε και ένα διαφορετικό loglikelihood. Θα είχε νόημα και το μεγαλύτερο min loglikelihood ίσως;

georgepar · 2020-12-23T10:17:52Z

ναι το μέσο Log likelihood όλων των δειγμάτων εννοούμε. Αν για κάποιο δείγμα παίρνει inf / nan τιμές αγνοήστε το κατά το averaging.

michaelbzms · 2020-12-23T10:20:09Z

Δεν μας εχει δώσει ποτέ inf μεχρι στιγμής. Ευχαριστώ.

georgepar mentioned this issue Dec 21, 2020

[Lab 2] Σφάλμα κατα την εκέλεση της συνάρτησης GeneralMixtureModel.from_samples() #60

Closed

georgepar closed this as completed Oct 18, 2021

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Βήμα 10: Error στο GeneralMixtureModel.from_samples() #57

Βήμα 10: Error στο GeneralMixtureModel.from_samples() #57

vassilispan commented Dec 19, 2020

georgepar commented Dec 21, 2020

vassilispan commented Dec 21, 2020

danae-charitou commented Dec 21, 2020

georgepar commented Dec 21, 2020 •

edited

Loading

inikokali commented Dec 21, 2020

georgepar commented Dec 21, 2020 •

edited

Loading

inikokali commented Dec 21, 2020

efthymisgeo commented Dec 21, 2020

inikokali commented Dec 21, 2020

michaelbzms commented Dec 22, 2020

georgepar commented Dec 22, 2020

michaelbzms commented Dec 23, 2020

georgepar commented Dec 23, 2020

michaelbzms commented Dec 23, 2020

Βήμα 10: Error στο GeneralMixtureModel.from_samples() #57

Βήμα 10: Error στο GeneralMixtureModel.from_samples() #57

Comments

vassilispan commented Dec 19, 2020

georgepar commented Dec 21, 2020

vassilispan commented Dec 21, 2020

danae-charitou commented Dec 21, 2020

georgepar commented Dec 21, 2020 • edited Loading

inikokali commented Dec 21, 2020

georgepar commented Dec 21, 2020 • edited Loading

inikokali commented Dec 21, 2020

efthymisgeo commented Dec 21, 2020

inikokali commented Dec 21, 2020

michaelbzms commented Dec 22, 2020

georgepar commented Dec 22, 2020

michaelbzms commented Dec 23, 2020

georgepar commented Dec 23, 2020

michaelbzms commented Dec 23, 2020

georgepar commented Dec 21, 2020 •

edited

Loading

georgepar commented Dec 21, 2020 •

edited

Loading