Ορισμός της αποσαφήνισης στις γλωσσικές σπουδές

Σε γλωσσολογία, η αποσαφήνιση είναι η διαδικασία προσδιορισμού της αίσθησης του λέξη χρησιμοποιείται σε ένα συγκεκριμένο συμφραζόμενα. Επίσης γνωστό ως λεξιλογικός αποσαφήνιση.

Στην υπολογιστική γλωσσολογία, αυτή η διακριτική διαδικασία ονομάζεται αποσαφήνιση λογικής λέξης (WSD).

Παραδείγματα και παρατηρήσεις

«Συμβαίνει έτσι ώστε το δικό μας επικοινωνία, σε διαφορετικά Γλώσσες Ομοίως, επιτρέπει την ίδια μορφή λέξης που χρησιμοποιείται για να σημαίνει διαφορετικά πράγματα σε μεμονωμένες επικοινωνιακές συναλλαγές. Η συνέπεια είναι ότι πρέπει να καταλάβουμε, σε μια συγκεκριμένη συναλλαγή, την επιδιωκόμενη έννοια μιας δεδομένης λέξης μεταξύ των δυνητικά συναφών αισθήσεών της. Ενώ το αμφισημίες που προκύπτουν από τέτοιες πολλαπλές έννοιες μορφής είναι στο λεξιλογικός επίπεδο, συχνά πρέπει να επιλυθούν μέσω ενός ευρύτερου πλαισίου από το ομιλία ενσωμάτωση της λέξης. Εξ ου και οι διαφορετικές αισθήσεις της λέξης «υπηρεσία» θα μπορούσαν να ξεχωρίσουν μόνο εάν μπορούσε κανείς να κοιτάξει πέρα από την ίδια τη λέξη, όπως σε αντίθεση υπηρεσία παίκτη στο Wimbledon "με" την υπηρεσία του σερβιτόρου στο Sheraton. " Αυτή η διαδικασία προσδιορισμού των εννοιών λέξεων σε έναν λόγο είναι γενικά γνωστός ως

instagram viewer

αίσθηση λέξης αποσαφήνιση (WSD). "(Oi Yee Kwong, Νέες προοπτικές για υπολογιστικές και γνωστικές στρατηγικές για αποσαφήνιση του Word Sense. Springer, 2013)

Λεξική αποσαφήνιση και αποσαφήνιση Word-Sense (WSD)

"Λεξιλογικός αποσαφήνιση στον ευρύτερο ορισμό του δεν είναι τίποτα λιγότερο από τον καθορισμό της έννοιας κάθε λέξης στο πλαίσιο, η οποία φαίνεται να είναι σε μεγάλο βαθμό ασυνείδητη διαδικασία στους ανθρώπους. Ως υπολογιστικό πρόβλημα, συχνά περιγράφεται ως «AI-complete», δηλαδή ένα πρόβλημα του οποίου η λύση προϋποθέτει μια λύση για ολοκλήρωση φυσική γλώσσα κατανόηση ή λογική λογικής (Ide and Véronis 1998).

"Στον τομέα της υπολογιστικής γλωσσολογίας, το πρόβλημα ονομάζεται γενικά αποσαφήνιση αίσθησης λέξεων (WSD) και ορίζεται ως το πρόβλημα του υπολογιστικού προσδιορισμού της «αίσθησης» μιας λέξης που ενεργοποιείται με τη χρήση της συγκεκριμένης λέξης συμφραζόμενα. Το WSD είναι ουσιαστικά ένα καθήκον ταξινόμησης: οι λέξεις είναι οι τάξεις, το πλαίσιο παρέχει το αποδεικτικά στοιχεία, και κάθε εμφάνιση μιας λέξης αντιστοιχίζεται σε μία ή περισσότερες από τις πιθανές τάξεις της με βάση το απόδειξη. Αυτός είναι ο παραδοσιακός και κοινός χαρακτηρισμός του WSD που το βλέπει ως μια ρητή διαδικασία αποσαφήνισης σε σχέση με ένα σταθερό ευρετήριο λέξεων. Οι λέξεις υποτίθεται ότι έχουν ένα πεπερασμένο και διακριτό σύνολο αισθήσεων από ένα λεξικό, μια λεξική βάση γνώσεων, ή μια οντολογία (στην τελευταία, οι αισθήσεις αντιστοιχούν σε έννοιες που μια λέξη λεξικοποιεί). Μπορούν επίσης να χρησιμοποιηθούν αποθέματα για συγκεκριμένες εφαρμογές. Για παράδειγμα, σε μια ρύθμιση μηχανικής μετάφρασης (MT), μπορεί κανείς να μεταφράσει τις μεταφράσεις λέξεων ως αισθήσεις λέξεων, ένα προσέγγιση που καθίσταται όλο και πιο εφικτή λόγω της διαθεσιμότητας μεγάλων πολύγλωσσων παράλληλο εταιρία που μπορούν να χρησιμεύσουν ως δεδομένα εκπαίδευσης. Το σταθερό απόθεμα του παραδοσιακού WSD μειώνει την πολυπλοκότητα του προβλήματος, αλλά υπάρχουν εναλλακτικά πεδία.. .. "(Eneko Agirre και Philip Edmonds," Εισαγωγή. " Word Sense Disambiguation: Αλγόριθμοι και εφαρμογές. Springer, 2007)

Ομονυμία και αποσαφήνιση

"Λεξιλογικός αποσαφήνιση ταιριάζει ιδιαίτερα σε περιπτώσεις ομώνυμο, για παράδειγμα, μια εμφάνιση μπάσσο πρέπει να αντιστοιχιστεί σε οποιοδήποτε από τα μπάσσα των λεξικών αντικειμένων₁ ή μπάσο₂, ανάλογα με την επιδιωκόμενη έννοια.

"Η λεξική αποσαφήνιση συνεπάγεται μια γνωστική επιλογή και είναι μια εργασία που αναστέλλει τις διαδικασίες κατανόησης. Πρέπει να διακρίνεται από τις διαδικασίες που οδηγούν σε διαφοροποίηση των λέξεων. Η προηγούμενη εργασία επιτελείται αρκετά αξιόπιστα επίσης χωρίς πολλές πληροφορίες με βάση τα συμφραζόμενα, ενώ η τελευταία δεν είναι (βλ. Βερόνης 1998, 2001). Έχει επίσης αποδειχθεί ότι οι ομώνυμες λέξεις, που απαιτούν αποσαφήνιση, επιβραδύνουν τη λεξική πρόσβαση, ενώ οι λέξεις πολυώνυμων, οι οποίες ενεργοποιούν την πολλαπλότητα των λέξεων, επιταχύνουν τη λεξική πρόσβαση (Rodd κ.ά. 2002).

"Ωστόσο, τόσο η παραγωγική τροποποίηση των σημασιολογικών τιμών όσο και η απλή επιλογή μεταξύ λεξικά διαφορετικών στοιχείων έχουν από κοινού ότι απαιτούν πρόσθετες μη λεξικές πληροφορίες. "(Peter Bosch," Παραγωγικότητα, Πολυσημεία και Predicate Indexicality ". Λογική, Γλώσσα και Υπολογισμός: 6ο Διεθνές Συμπόσιο της Τιφλίδας για τη Λογική, τη Γλώσσα και τον Υπολογισμό, εκδ. από τον Balder D. δέκα Cate και Henk W. Zeevat. Springer, 2007)

Λεξική κατηγοριοποίηση και η αρχή της πιθανότητας

Οι Corley και Crocker (2000) παρουσιάζουν ένα μοντέλο ευρείας κάλυψης του λεξική κατηγορίααποσαφήνιση βασισμένο στο Αρχή της πιθανότητας. Συγκεκριμένα, το προτείνουν για μια πρόταση που αποτελείται από λέξεις β₀... β_ν, ο επεξεργαστής προτάσεων υιοθετεί το πιο πιθανό μέρος του λόγου αλληλουχία τ₀... τ_ν. Πιο συγκεκριμένα, το μοντέλο τους εκμεταλλεύεται δύο απλές πιθανότητες: (Εγώ) η υπό όρους πιθανότητα της λέξης β_Εγώ δεδομένου ενός συγκεκριμένου μέρους της ομιλίας τ_Εγώ, και (ii) την πιθανότητα τ_Εγώ δεδομένου του προηγούμενου μέρους της ομιλίας τ_i-1. Καθώς αντιμετωπίζεται κάθε λέξη της πρότασης, το σύστημα της εκχωρεί αυτό το μέρος της ομιλίας τ_Εγώ, που μεγιστοποιεί το προϊόν αυτών των δύο πιθανοτήτων. Αυτό το μοντέλο αξιοποιεί την εικόνα που πολλοί συντακτικός οι αμφισημίες έχουν λεξική βάση (MacDonald et al., 1994), όπως στο (3):

(3) Οι τιμές / μάρκες αποθήκης είναι φθηνότερες από τις υπόλοιπες.

"Αυτές οι προτάσεις είναι προσωρινά διφορούμενες μεταξύ μιας ανάγνωσης στην οποία τιμές ή κάνει είναι το κύριο ρήμα ή μέρος ενός σύνθετο ουσιαστικό. Αφού εκπαιδεύτηκε σε ένα μεγάλο σώμα, το μοντέλο προβλέπει το πιο πιθανό μέρος της ομιλίας για τιμές, σωστά λογαριάζει για το γεγονός ότι οι άνθρωποι καταλαβαίνουν τιμή ως ουσιαστικό αλλά κάνει ως ρήμα (βλέπε Crocker & Corley, 2002, και παραπομπές που αναφέρονται εκεί). Όχι μόνο το μοντέλο αντιπροσωπεύει μια σειρά προτιμήσεων αποσαφήνισης που έχουν τις ρίζες τους στη λεξική κατηγορία αμφισημία, εξηγεί επίσης γιατί, σε γενικές γραμμές, οι άνθρωποι είναι πολύ ακριβείς στην επίλυση τέτοιων αμφισημιών. " (Ματθαίος W. Crocker, "Ορθολογικά μοντέλα κατανόησης: Αντιμετώπιση του παράδοξου της απόδοσης." Ψυχογλωσσολογία του 21ου αιώνα: Τέσσερις ακρογωνιαίοι λίθοι, εκδ. από την Anne Cutler. Lawrence Erlbaum, 2005)