Εργασία

Hit Counter

Εργασία

Η σελίδα αυτή είναι αφιερωμένη στην εργασία του μαθήματος.

Στόχος της εργασίας είναι η άσκηση στην συλλογή και την ανάλυση ηλεκτρονικών ισπανικών κειμένων δημοσιογραφικού λόγου από το Διαδίκτυο. Η εργασία εξελίσσεται στα ακόλουθα στάδια:

1. Επιλογή 300 ηλεκτρονικών ισπανικών κειμένων από εφημερίδες κατανεμημένων ως εξής:

	100 κείμενα με θεματολογία τον Πολιτισμό
	100 κείμενα με θεματολογία την Πολιτική
	100 κείμενα με θεματολογία τα Αθλητικά

Μερικές διευθύνσεις ισπανικών εφημερίδων στο Διαδίκτυο θα βρίσκονται στη σελίδα "Σημειώσεις και Σύνδεσμοι"

2. Σώσιμο των κειμένων από τους διαδικτυακούς τόπους των εφημερίδων ως απλό κείμενο (save as type *.txt).

Περισσότερα για το πώς να το κάνετε...

3. Οργάνωση των κειμενικών αρχείων στον σκληρό σας δίσκο σε τρεις ξεχωριστούς καταλόγους (folders):

	Deportes
	Cultura
	Política

4. Για κάθε αρχείο που θα κατεβάζετε στον σκληρό σας δίσκο θα πρέπει να κρατάτε μια σειρά από εξωκειμενικές πληροφορίες τις οποίες θα τις κωδικοποιείτε σε ένα αρχείο Excel. Το αρχείο αυτό θα περιέχει στήλες με τις παρακάτω πληροφορίες:

	Όνομα αρχείου (filename)
	Κειμενική κατηγορία (category)
	Τίτλος άρθρου (title)
	Αριθμός λέξεων (words)
	Πηγή

Ένα δείγμα του αρχείου Excel μπορείτε να κατεβάσετε εδώ...

5. Στη συνέχεια για κάθε αρχείο θα μετρήσετε μια σειρά από κειμενικές μεταβλητές. Μια από τις πιο γνωστές είναι ο λόγος κλιτών / άκλιτων λέξεων ή αλλιώς λεξιλογική πυκνότητα (lexical density). Η συγκεκριμένη μέτρηση μας αποκαλύπτει ποια είναι η αναλογία ενός κειμένου σε λέξεις με "γεμάτο" περιεχόμενο. Όσο μεγαλύτερη τιμή λεξιλογική πυκνότητας υπολογίζουμε τόσο περισσότερο "πληροφοριακό" είναι ένα κείμενο.

Ο τρόπος υπολογισμού του δείκτη της λεξιλογικής πυκνότητας είναι σχετικά απλός:

	Μετράμε τη συχνότητα εμφάνισης όλων των άκλιτων λέξεων ενός κειμένου και την καταχωρούμε σε νέα στήλη στο Excel αρχείο (με πιθανό τίτλο "άκλιτες").
	Από τον αριθμό συνολικών λέξεων ενός κειμένου (στήλη "words"), αφαιρούμε τον αριθμό άκλιτων λέξεων και έτσι βρίσκουμε τον αριθμών των κλιτών λέξεων, τον οποίο και καταχωρούμε σε νέα στήλη στο Excel (με πιθανό τίτλο "κλιτές")
	Δημιουργούμε μια νέα στήλη στο Excel (με πιθανό τίτλο "κλ/ακλ"), στην οποία καταχωρούμε την τιμή που προκύπτει από τη διαίρεση της τιμής στη στήλη "κλιτές" με την τιμή της στήλης "άκλιτες". Αυτή η τιμή αντιπροσωπεύει την λεξιλογική πυκνότητα του κειμένου.

6. Όλες οι μετρήσεις θα πρέπει να γίνουν με το πρόγραμμα Monoconc Pro. Αναλυτικές οδηγίες για το πώς θα το χρησιμοποιήσετε στο πλαίσιο της εργασίας μπορείτε να κατεβάσετε εδώ (1,5 Μb).

7. Μια έτοιμη λίστα άκλιτων λέξεων της Ισπανικής μπορείτε να κατεβάσετε εδώ. Ωστόσο, θα μπορούσε να συμπληρωθεί και με άλλες από εσάς.

8. Οι μεταβλητές που θα επιλέξετε να εξετάσετε εκτός της λεξιλογικής πυκνότητας αποτελεί δική σας απόφαση. Παράλληλα με τη λίστα των άκλιτων λέξεων θα μπορούσατε να ετοιμάσετε μια λίστα με αιτιολογικούς ή χρονικούς συνδέσμους και να μετρήσετε την χρήση τέτοιων προτάσεων στα κείμενά σας. Και φυσικά μπορείτε να αναζητήσετε αν κάποια συγκεκριμένα ρήματα εμφανίζονται σε διαφορετικά περιβάλλοντα ανάλογα με τη θεματική του κειμένου.

9. Τι θα παραδώσετε:

	Μία ολιγοσέλιδη αναφορά σχετικά με την μεθοδολογία που χρησιμοποιήσατε για να ολοκληρώσετε την έρευνα καθώς και τα βασικότερα συμπεράσματα που προκύπτουν από τη σύγκριση των μεταβλητών ανά κειμενικό είδος.
	1 δισκέτα με: α) Τα 300 ισπανικά άρθρα σε μορφή απλού κειμένου (txt)

β) Το αρχείο Excel συμπληρωμένο με όλα τα εξωκειμενικά στοιχεία και τις μετρήσεις των μεταβλητών που έχετε επιλέξει για κάθε κείμενο.

Copyright or other proprietary statement goes here.
For problems or questions regarding this web contact [[email protected]].
Last updated: 16-Dec-2002.

Hosted by www.Geocities.ws