Mojibake

Mojibake (文字化け, προφέρεται /modʑibake/) είναι η ονομασία για τους λανθασμένους, μη αναγνώσιμους χαρακτήρες που εμφανίζονται όταν το λογισμικό του υπολογιστή αποτυγχάνει να εμφανίσει σωστά το κείμενο. Κατά τη χρήση υπολογιστών, το κείμενο κωδικοποιείται με τη χρήση μιας κωδικοποίησης χαρακτήρων. Κατά τη μεταφορά, κάθε χαρακτήρας αντικαθίσταται από τη θέση του (ή τον αριθμό του) στην κωδικοποίηση. Για να εμφανιστεί ξανά ο χαρακτήρας, η θέση αντικαθίσταται και πάλι από τον χαρακτήρα. Όταν δεν καθορίζεται η αρχική κωδικοποίηση, μπορεί να χρησιμοποιηθεί ένας διαφορετικός χαρακτήρας όταν ο αριθμός αντικαθίσταται και πάλι με τον χαρακτήρα για την εμφάνιση. Ο Unicode εισήχθη για να λύσει αυτό το πρόβλημα: ο UTF-8 είναι σε θέση να κωδικοποιήσει τους περισσότερους κοινούς χαρακτήρες σε 2 bytes.

Πριν από την εισαγωγή του Unicode, χρησιμοποιούνταν άλλες κωδικοποιήσεις χαρακτήρων. Για παράδειγμα, το ISO-8859 περιέχει 15 διαφορετικές κωδικοποιήσεις. Αυτές είναι οι ίδιες για τους χαρακτήρες που χρησιμοποιούνται συνήθως στα αγγλικά. Έχουν διάφορα "μπλοκ" "ειδικών χαρακτήρων", τα οποία κατατίθενται διαφορετικά για κάθε κωδικοποίηση.



Κάπως έτσι μπορεί να μοιάζει ένας ιστότοπος αν χρησιμοποιείται λάθος κωδικοποίηση γραμματοσειράς.Zoom
Κάπως έτσι μπορεί να μοιάζει ένας ιστότοπος αν χρησιμοποιείται λάθος κωδικοποίηση γραμματοσειράς.

Το ιαπωνικό λήμμα της Βικιπαίδειας για το Mojibake χρησιμοποιεί κωδικοποίηση UTF-8. Αυτό το στιγμιότυπο οθόνης δείχνει πώς μοιάζει, όταν αποκωδικοποιείται χρησιμοποιώντας την τυπική κωδικοποίηση CP1252 των Windows.Zoom
Το ιαπωνικό λήμμα της Βικιπαίδειας για το Mojibake χρησιμοποιεί κωδικοποίηση UTF-8. Αυτό το στιγμιότυπο οθόνης δείχνει πώς μοιάζει, όταν αποκωδικοποιείται χρησιμοποιώντας την τυπική κωδικοποίηση CP1252 των Windows.

Προέλευση της λέξης

Το Mojibake είναι μια ιαπωνική λέξη. Η λέξη 文字化け ([moʥibake]) αποτελείται από δύο μέρη: 文字 (moji) σημαίνει γράμμα, χαρακτήρας. 化け (bake), από το ρήμα 化ける (bakeru), σημαίνει εμφανίζομαι μεταμφιεσμένος, παίρνω τη μορφή του, αλλάζω προς το χειρότερο. Κυριολεκτικά, σημαίνει "μετάλλαξη χαρακτήρα".



Ερωτήσεις και απαντήσεις

Ερ: Τι είναι το "μοτζιμπάκε";


A: Mojibake είναι ο όρος για τους λανθασμένους και μη αναγνώσιμους χαρακτήρες που εμφανίζονται όταν το λογισμικό του υπολογιστή αποτυγχάνει να εμφανίσει σωστά το κείμενο.

Ερ: Πώς κωδικοποιείται το κείμενο κατά τη χρήση των υπολογιστών;


Α: Το κείμενο κωδικοποιείται χρησιμοποιώντας μια κωδικοποίηση χαρακτήρων, όπου κάθε χαρακτήρας αντικαθίσταται από τη θέση ή τον αριθμό του στην κωδικοποίηση.

Ε: Τι συμβαίνει όταν δεν καθορίζεται η αρχική κωδικοποίηση κατά τη μεταφορά κειμένου;


Α: Όταν δεν καθορίζεται η αρχική κωδικοποίηση, μπορεί να χρησιμοποιηθεί ένας διαφορετικός χαρακτήρας όταν ο αριθμός αντικαθίσταται από τον χαρακτήρα για εμφάνιση.

Ε: Τι είναι ο Unicode και πώς λύνει αυτό το πρόβλημα;


Α: Ο Unicode είναι ένα πρότυπο κωδικοποίησης χαρακτήρων που μπορεί να αναπαραστήσει τους περισσότερους χαρακτήρες σε δύο bytes. Επιλύει το πρόβλημα της χρήσης διαφορετικών κωδικοποιήσεων χαρακτήρων και διασφαλίζει ότι οι χαρακτήρες εμφανίζονται σωστά.

Ερ: Ποια είναι μερικά παραδείγματα άλλων κωδικοποιήσεων χαρακτήρων που χρησιμοποιήθηκαν πριν από τον Unicode;


Α: Το ISO-8859 είναι ένα παράδειγμα άλλης κωδικοποίησης χαρακτήρων που χρησιμοποιήθηκε πριν από το Unicode.

Ε: Πόσες διαφορετικές κωδικοποιήσεις περιέχει το ISO-8859;


Α: Το ISO-8859 περιέχει 15 διαφορετικές κωδικοποιήσεις.

Ε: Οι ειδικοί χαρακτήρες στο ISO-8859 είναι ίδιοι για όλες τις κωδικοποιήσεις του;


Α: Όχι, οι ειδικοί χαρακτήρες στο ISO-8859 κατατίθενται διαφορετικά για κάθε κωδικοποίηση.

AlegsaOnline.com - 2020 / 2023 - License CC3