freeforum.gr

δοκιμαστική λειτουργία - συμβουλές καλόδεχτες

Δικαστική Γλωσσολογία

User avatar
osho_st
Site Admin
Posts: 294
Joined: Tue Feb 11, 2014 12:04 am

Δικαστική Γλωσσολογία

Postby osho_st » Sat Aug 23, 2014 6:45 pm

Ένα πολύ ενδιαφέρον θέμα για ένα άγνωστο κλάδο της γλωσσολογίας. Εδώ μέρος από το κείμενο http://www.enl.auth.gr/symposium18/pape ... rantzi.pdf
=============
Δικαστική Γλωσσολογία: Αυτόματη Εξαγωγή Υφολογικών Γλωσσικών Χαρακτηριστικών
................
........
Γλωσσολογία Σωμάτων Κειμένων Η γλωσσολογία σωμάτων κειμένων (corpus linguistics) επικεντρώνεται στη μελέτη της πραγματικής χρήσης της γλώσσας και όχι στη μελέτη του τι είναι θεωρητικά πιθανό σε μία γλώσσα. Οι τεχνικές της γλωσσολογίας σωμάτων κειμένων εφαρμόζονται σε μεγάλες συλλογές κειμένων για την αυτόματη εξαγωγή πληροφορίας διαφόρων τύπων. Η γνωστική αυτή περιοχή περιλαμβάνει μελέτες για τη μορφολογία, σύνταξη, σημασιολογία, φωνολογία, λεξικογραφία, ορολογία κ.ά. (McEnery & Wilson 2000). Μεταξύ των εφαρμογών της γλωσσολογίας σωμάτων κειμένων συγκαταλέγονται και η μελέτη της γλώσσας προφορικού και γραπτού λόγου και γλωσσικών ποικιλιών, το ύφος συγκεκριμένων συγγραφέων, οι διάλεκτοι κ.ά. Μια προσέγγιση βασισμένη στις τεχνικές της γλωσσολογίας σωμάτων κειμένων κάνει εκτενή χρήση του ηλεκτρονικού υπολογιστή σε ένα σώμα κειμένων (corpus), μία μεγάλη συλλογή πραγματικών κειμένων (Biber et al. 1998), χρησιμοποιώντας αυτόματες αλλά και διαδραστικές τεχνικές. Ο υπολογιστής κάνει δυνατή την αποθήκευση και επεξεργασία μεγάλου όγκου κειμένων καθώς και τη γρήγορη παραγωγή ακριβούς και πλήρους πληροφορίας η οποία δεν θα μπορούσε να παραχθεί με τις παραδοσιακές χειρωνακτικές μεθόδους (Sinclair 1991).

Η μελέτη του ύφους έχει κυρίως εφαρμοστεί σε λογοτεχνικά κείμενα (Clark 1996; Semino & Culpeper 2002). Επικεντρώνεται στην εξαγωγή και περιγραφή της χρήσης της γλώσσας που επιλέγεται από συγκεκριμένα άτομα ή κοινωνικές ομάδες. Η χρήση της άρχισε στα μέσα του 19ου αιώνα για την πιστοποίηση συγγραφέων βιβλικών κειμένων της Παλαιάς και Καινής Διαθήκης. Μεταξύ των πρώτων εφαρμογών ήταν και η πιστοποίηση κειμένων που είχαν αποδοθεί στον Shakespeare. Η εφαρμογή τεχνικών της γλωσσολογίας σωμάτων κειμένων στη μελέτη του ύφους προσφέρει ένα συστηματικό, γρήγορο και ακριβή τρόπο για τη γλωσσολογική διερεύνηση λογοτεχνικών κειμένων, εφαρμόζοντας αυτόματη ή ημι-αυτόματη επεξεργασία σε ηλεκτρονικά κείμενα και χρησιμοποιώντας γλωσσολογική μαζί με εμπειρική γνώση.

Η Μεθοδολογία Τα μέσα μαζικής ενημέρωσης λαμβάνουν μηνύματα από τρομοκρατικές οργανώσεις, τα οποία συνοδεύουν χτυπήματα τρομοκρατικών οργανώσεων ή προειδοποιούν για μελλοντικά χτυπήματα. Συχνά η αυθεντικότητα των μηνυμάτων είναι υπό αμφισβήτηση. Η εύρεση του συγγραφέα (authorship identification) είναι μία σημαντική ερευνητική περιοχή της δικαστικής γλωσσολογίας (forensic linguistics) (Shy 1998; McMenamin 2002; Gibbons 2003; Olsson 2004). Σε αυτήν τη μελέτη περιγράφουμε ένα εργαλείο για την εύρεση του συγγραφέα κειμένου μεταξύ ενός συνόλου πιθανών συγγραφέων. Αν και το εργαλείο δεν θα μπορούσε να είναι πανάκεια, μπορεί να χρησιμοποιηθεί σε συνδυασμό με άλλα στοιχεία που παρουσιάζονται σε μία δίκη για την σωστότερη έκβαση της τελικής κρίσης. Χαρακτηρίζουμε κάθε πιθανό συγγραφέα από ένα σύνολο υφολογικών γνωρισμάτων τα οποία φαίνονται στα κείμενα του.

Ας υποθέσουμε ότι έχουμε κείμενα των οποίων γνωρίσουμε τους συγγραφείς. Αντιστοιχίζουμε τα κείμενα σε σύνολα τιμών υφολογικών γνωρισμάτων τις οποίες ταξινομούμε σε πίνακες. Ας υποθέσουμε για παράδειγμα ότι έχουμε τρία κείμενα. Για τα δύο από αυτά γνωρίζουμε τους συγγραφείς. Για το τρίτο γνωρίζουμε μόνο ότι ανήκει στον έναν από τους δύο συγγραφείς αλλά δεν γνωρίζουμε σε ποιον. Υπολογίσουμε την “απόσταση”, όσο αφορά στα υφολογικά τους γνωρίσματα, για τα δύο ζευγάρια κειμένων: τα (γνωστό-κείμενο1, άγνωστο-κείμενο) και (γνωστό-κείμενο2, άγνωστο-κείμενο). Το ζευγάρι που δίνει την μικρότερη “υφολογική” απόσταση δίνει τον πιθανότερο συγγραφέα του άγνωστου-κειμένου. Για τον χαρακτηρισμό των κειμένων και τον υπολογισμό της απόστασης τους, εξετάζουμε τα ακόλουθα υφολογικά γνωρίσματα:
Μέσο μήκος πρότασης Χρήση των συνδέσμων
Μέσο μήκος λέξης
Χρήση των προθέσεων
Αριθμός των διαφορετικών ουσιαστικών Χρήση των αντωνυμιών
Αριθμός των διαφορετικών επιθέτων
Χρήση των μορίων
Αριθμός των διαφορετικών κυρίων ονομάτων
Χρήση των σημείων στίξης
Αριθμός των διαφορετικών ενεργητικών ρημάτων
Χρήση των ερωτηματικών λέξεων
Αριθμός των διαφορετικών παθητικών ρημάτων
Χρήση των λέξεων πληροφορίας
Αριθμός των διαφορετικών επιρρημάτων
Χρήση των οριστικών άρθρων
Αριθμός των αναφορών στο μέλλον
Χρήση των αόριστων άρθρων
.................
..............
=============================


Η απελευθέρωση από το γνωστό.

Return to “Θέματα σχετικά με την γλώσσα.”

cron