Υποβολή εργασιών R σε πολλαπλά threads στην Υπολογιστική Συστοιχία του ΑΠΘ

Για οδηγίες σχετικά με απλές και παράλληλες σειριακές  εργασίες  R στην Υπολογιστική Συστοιχία του ΑΠΘ, συμβουλευτείτε το εγχειρίδιο εδώ.
Παράδειγμα παράλληλης εργασίας σε πολλαπλά threads

Θα χρησιμοποιήσουμε ως παράδειγμα το Moby Dick data set, το οποίο περιέχει τη συχνότητα με την οποία εμφανίζονται εξηζητημένες λέξεις στο βιβλίο του Herman Melville, Moby Dick .
Αναλυτικές πληροφορίες για το συγκεκριμένο παράδειγμα είναι διαθέσιμες εδώ.

Εφόσον θέλουμε να χρησιμοποιήσουμε μία συγκεκριμένη βιβλιοθήκη που δεν υπάρχει ήδη εγκατεστημένη, ακολουθούμε μία από τις παρακάτω επιλογές:

1. Υποβάλουμε την φόρμα αίτησης λογισμικού

2. Εγκαθιστούμε το πακέτο στο $SCRATCHDIR ως εξής:
  •     Συνδεόμαστε στο User Interface
  •     Δημιουργούμε το path στο οποίο θα αποθηκευθεί η βιβλιοθήκη $ mkdir -p /mnt/scratchdir/home/<username>/.R/3.3
  •     Ανοίγουμε την κονσόλα της R $ R
  •     Μέσα από την κονσόλα της R, ορίζουμε το PATH όπου θα εγκατασταθούν οι επιπλέον βιβλιοθήκες > .libPaths("/mnt/scratchdir/home/<username>/.R/3.3")
  •     Για να εγκαταστήσουμε την βιβλιοθήκη τρέχουμε την εντολή > install.packages("<library>")
Το πεδίο <library> αναφέρετε στην εκάστοτε επιθυμητή βιβλιοθήκη.Για το παράδειγμα μας είναι η poweRlaw
Υποβολή παράλληλης εργασίας σε πολλαπλά threads

Τα scripts του παραδείγματος βρίσκονται εδώ.

Υποβάλουμε την εργασία με την εντολή $ qsub submit.sh

 

Για έλεγχο της εξέλιξης της εργασίας $ qstat

Απεικόνιση αποδοτικότητας χρήσης πολλαπλών threads

Στο παρακάτω γράφημα παρουσιάζεται η μείωση του χρόνου εκτέλεσης του απλού παραδείγματος που δίνεται εδώ, με την αύξηση του αριθμού των threads.

 
Με εικόνες