Για οδηγίες σχετικά με απλές και παράλληλες σειριακές εργασίες R στην Υπολογιστική Συστοιχία του ΑΠΘ, συμβουλευτείτε το εγχειρίδιο εδώ.
Παράδειγμα παράλληλης εργασίας σε πολλαπλά threads
Θα χρησιμοποιήσουμε ως παράδειγμα το Moby Dick data set, το οποίο περιέχει τη συχνότητα με την οποία εμφανίζονται εξηζητημένες λέξεις στο βιβλίο του Herman Melville, Moby Dick .
Αναλυτικές πληροφορίες για το συγκεκριμένο παράδειγμα είναι διαθέσιμες εδώ.
Εφόσον θέλουμε να χρησιμοποιήσουμε μία συγκεκριμένη βιβλιοθήκη που δεν υπάρχει ήδη εγκατεστημένη, ακολουθούμε μία από τις παρακάτω επιλογές:
1. Υποβάλουμε την φόρμα αίτησης λογισμικού
2. Εγκαθιστούμε το πακέτο στο $SCRATCHDIR ως εξής:- Συνδεόμαστε στο User Interface
-
Δημιουργούμε το path στο οποίο θα αποθηκευθεί η βιβλιοθήκη
$ mkdir -p /mnt/scratchdir/home/<username>/.R/3.3
-
Ανοίγουμε την κονσόλα της R
$ R
-
Μέσα από την κονσόλα της R, ορίζουμε το PATH όπου θα εγκατασταθούν οι επιπλέον βιβλιοθήκες
> .libPaths("/mnt/scratchdir/home/<username>/.R/3.3")
-
Για να εγκαταστήσουμε την βιβλιοθήκη τρέχουμε την εντολή
> install.packages("<library>")
Υποβολή παράλληλης εργασίας σε πολλαπλά threads
Τα scripts του παραδείγματος βρίσκονται εδώ.
Υποβάλουμε την εργασία με την εντολή $ qsub submit.sh
Για έλεγχο της εξέλιξης της εργασίας $ qstat
Απεικόνιση αποδοτικότητας χρήσης πολλαπλών threads
Στο παρακάτω γράφημα παρουσιάζεται η μείωση του χρόνου εκτέλεσης του απλού παραδείγματος που δίνεται εδώ, με την αύξηση του αριθμού των threads.