Πώς το Twitter δίνει στους επιστήμονες ένα παράθυρο στην ανθρώπινη ευτυχία και υγεία

Από τη δημόσια κυκλοφορία του πριν από 10 χρόνια, το Twitter έχει χρησιμοποιηθεί ως πλατφόρμα κοινωνικής δικτύωσης μεταξύ φίλων, μια υπηρεσία ανταλλαγής άμεσων μηνυμάτων για χρήστες smartphone και ένα εργαλείο προώθησης για εταιρείες και πολιτικούς.

Αλλά ήταν επίσης μια ανεκτίμητη πηγή δεδομένων για ερευνητές και επιστήμονες - όπως εγώ - που θέλουν να μελετήσουν πώς αισθάνονται και λειτουργούν οι άνθρωποι μέσα σε πολύπλοκα κοινωνικά συστήματα.

Αναλύοντας τα tweets, καταφέραμε να παρατηρήσουμε και να συλλέξουμε δεδομένα σχετικά με τις κοινωνικές αλληλεπιδράσεις εκατομμυρίων ανθρώπων «στη φύση», εκτός ελεγχόμενων εργαστηριακών πειραμάτων.

Μας επέτρεψε να αναπτύξουμε εργαλεία για την παρακολούθηση του συλλογικά συναισθήματα μεγάλων πληθυσμών, βρες το πιο χαρούμενα μέρη στις Ηνωμένες Πολιτείες και πολλά άλλα.

Λοιπόν, πώς ακριβώς έγινε το Twitter ένας μοναδικός πόρος για υπολογιστικούς κοινωνικούς επιστήμονες; Και τι μας επέτρεψε να ανακαλύψουμε;


εσωτερικά εγγραφείτε γραφικό


Το μεγαλύτερο δώρο του Twitter για ερευνητές

Στις 15 Ιουλίου 2006, ο Twittr (όπως ήταν τότε γνωστό) δημοσίως ξεκίνησε ως "υπηρεσία κινητής τηλεφωνίας που βοηθά ομάδες φίλων να αναπηδούν τυχαίες σκέψεις με SMS". Η δυνατότητα αποστολής δωρεάν ομαδικών κειμένων 140 χαρακτήρων οδήγησε πολλούς πρώτους υιοθετούντες (συμπεριλαμβανόμενοι και εγώ) να χρησιμοποιήσω την πλατφόρμα.

Με τον καιρό, ο αριθμός των χρηστών εξερράγη: από 20 εκατομμύρια το 2009 σε 200 εκατομμύρια το 2012 και 310 εκατομμύρια σήμερα. Αντί να επικοινωνούν απευθείας με φίλους, οι χρήστες θα έλεγαν απλώς στους οπαδούς τους πώς ένιωθαν, ανταποκρίνονταν θετικά ή αρνητικά σε ειδήσεις ή αστεία.

Για τους ερευνητές, το μεγαλύτερο δώρο του Twitter ήταν η παροχή μεγάλων ποσοτήτων ανοιχτών δεδομένων. Το Twitter ήταν ένα από τα πρώτα μεγάλα κοινωνικά δίκτυα που παρείχε δείγματα δεδομένων μέσω κάτι που ονομάζεται Application Programming Interfaces (APIs), τα οποία επιτρέπουν στους ερευνητές να ρωτούν το Twitter για συγκεκριμένους τύπους tweets (π.χ. tweets που περιέχουν συγκεκριμένες λέξεις), καθώς και πληροφορίες για τους χρήστες .

Αυτό οδήγησε σε έκρηξη ερευνητικών έργων που εκμεταλλεύονται αυτά τα δεδομένα. Σήμερα, μια αναζήτηση του Μελετητή Google για το "Twitter" παράγει έξι εκατομμύρια επιτυχίες, σε σύγκριση με πέντε εκατομμύρια για το "Facebook". Η διαφορά είναι ιδιαίτερα εντυπωσιακή δεδομένου ότι το Facebook έχει περίπου πέντε φορές περισσότεροι χρήστες από το Twitter (και είναι δύο ετών μεγαλύτερος).

Η γενναιόδωρη πολιτική δεδομένων του Twitter οδήγησε αναμφίβολα σε εξαιρετική δωρεάν δημοσιότητα για την εταιρεία, καθώς ενδιαφέρουσες επιστημονικές μελέτες πήραν τα κύρια μέσα.

Μελετώντας την ευτυχία και την υγεία

Με τα παραδοσιακά δεδομένα απογραφής να είναι αργά και δαπανηρά στη συλλογή, οι ανοιχτές ροές δεδομένων όπως το Twitter έχουν τη δυνατότητα να παρέχουν ένα παράθυρο σε πραγματικό χρόνο για να δουν αλλαγές σε μεγάλους πληθυσμούς.

Το Πανεπιστήμιο του Βερμόντ Υπολογιστικό Εργαστήριο Ιστορίας ιδρύθηκε το 2006 και μελετά προβλήματα στα εφαρμοσμένα μαθηματικά, την κοινωνιολογία και τη φυσική. Από το 2008, το Story Lab έχει συλλέξει δισεκατομμύρια tweets μέσω της ροής "Gardenhose" του Twitter, ένα API που μεταδίδει ένα τυχαίο δείγμα του 10% όλων των δημόσιων tweets σε πραγματικό χρόνο.

Πέρασα τρία χρόνια στο Computational Story Lab και ήμουν τυχερός που συμμετείχα σε πολλές ενδιαφέρουσες μελέτες χρησιμοποιώντας αυτά τα δεδομένα. Για παράδειγμα, αναπτύξαμε ένα οδόμετρο που μετρά την ευτυχία του Twittersphere σε πραγματικό χρόνο. Εστιάζοντας σε γεωγραφικά tweet που στέλνονται από smartphone, καταφέραμε να το κάνουμε χάρτη τα πιο χαρούμενα μέρη στις Ηνωμένες Πολιτείες. Ίσως αναπάντεχα, βρήκαμε Η Χαβάη είναι η πιο ευτυχισμένη πολιτεία και η αμπελουργική Νάπα, η πιο ευτυχισμένη πόλη για 2013. 

Ένας χάρτης 13 εκατομμυρίων γεωγραφικών tweet στις ΗΠΑ από το 2013, χρωματισμένος από ευτυχία, με κόκκινο που δείχνει ευτυχία και μπλε που δείχνει θλίψη. PLOS ONE, παρέχεται συντάκτηςΈνας χάρτης 13 εκατομμυρίων γεωγραφικών tweet στις ΗΠΑ από το 2013, χρωματισμένος από ευτυχία, με κόκκινο που δείχνει ευτυχία και μπλε που δείχνει θλίψη. PLoS ONE, Συγγραφέας παρέχεται.Αυτές οι μελέτες είχαν βαθύτερες εφαρμογές: Η συσχέτιση της χρήσης λέξεων Twitter με δημογραφικά στοιχεία μας βοήθησε να κατανοήσουμε τα υποκείμενα κοινωνικοοικονομικά πρότυπα στις πόλεις. Για παράδειγμα, θα μπορούσαμε να συνδέσουμε τη χρήση λέξεων με παράγοντες υγείας όπως η παχυσαρκία, έτσι δημιουργήσαμε ένα λεξικοκολομέτρο για τη μέτρηση του «θερμιδικού περιεχομένου» των δημοσιεύσεων στα μέσα κοινωνικής δικτύωσης. Τα tweets από μια συγκεκριμένη περιοχή που ανέφεραν τρόφιμα με υψηλή περιεκτικότητα σε θερμίδες αύξησαν το «θερμιδικό περιεχόμενο» αυτής της περιοχής, ενώ τα tweets που ανέφεραν δραστηριότητες άσκησης μείωσαν τη μέτρησή μας. Βρήκαμε ότι αυτό το απλό μέτρο συσχετίζεται με άλλες μετρήσεις υγείας και ευεξίας. Με άλλα λόγια, τα tweets μπόρεσαν να μας δώσουν ένα στιγμιότυπο, σε μια συγκεκριμένη στιγμή, της συνολικής υγείας μιας πόλης ή περιοχής.

Χρησιμοποιώντας τον πλούτο των δεδομένων του Twitter, καταφέραμε επίσης δείτε τα καθημερινά μοτίβα κίνησης των ανθρώπων με πρωτοφανή λεπτομέρεια. Η κατανόηση των μοτίβων ανθρώπινης κινητικότητας, με τη σειρά της, έχει την ικανότητα να μεταμορφώσει τη μοντελοποίηση των ασθενειών, ανοίγοντας το νέο πεδίο της ψηφιακή επιδημιολογία.

Για άλλες μελέτες, εξετάσαμε εάν οι ταξιδιώτες εκφράζουν μεγαλύτερη ευτυχία στο Twitter από εκείνους που μένουν στο σπίτι (απάντηση: το κάνουν) και εάν χαρούμενα άτομα τείνουν να κολλάνε σε ένα κοινωνικό δίκτυο (και πάλι, το κάνουν). Πράγματι, η θετικότητα φαίνεται να είναι ψημένη στη γλώσσα, με την έννοια ότι έχουμε πιο θετικές λέξεις από αρνητικές λέξεις. Αυτό δεν συνέβη μόνο στο Twitter αλλά σε μια ποικιλία διαφορετικών μέσων (π.χ. βιβλία, ταινίες και εφημερίδες) και γλώσσες.

Αυτές οι μελέτες - και χιλιάδες άλλοι σαν αυτούς από όλο τον κόσμο - ήταν δυνατές μόνο χάρη στο Twitter.

Τα επόμενα 10 χρόνια

Τι μπορούμε λοιπόν να περιμένουμε να μάθουμε από το Twitter τα επόμενα 10 χρόνια;

Μερικές από τις πιο συναρπαστικές εργασίες περιλαμβάνουν αυτήν τη στιγμή τη σύνδεση δεδομένων κοινωνικών μέσων με μαθηματικά μοντέλα για την πρόβλεψη φαινομένων σε επίπεδο πληθυσμού, όπως εκδηλώσεις ασθενειών. Οι ερευνητές είχαν ήδη σημειώσει κάποια επιτυχία στην αύξηση μοντέλων ασθενειών με δεδομένα Twitter για την πρόβλεψη της γρίπης, ιδίως της FluOutlook πλατφόρμα που αναπτύχθηκε από το Πανεπιστήμιο Northeastern και το Ινστιτούτο Επιστημονικής Ανταλλαγής.

Ακόμα, παραμένουν ορισμένες προκλήσεις. Τα δεδομένα των μέσων κοινωνικής δικτύωσης υποφέρουν από πολύ χαμηλή «αναλογία σήματος προς θόρυβο». Με άλλα λόγια, τα tweets που σχετίζονται με μια συγκεκριμένη μελέτη συχνά πνίγονται από άσχετο «θόρυβο».

Επομένως, πρέπει συνεχώς να γνωρίζουμε τι έχει χαρακτηριστεί «μεγάλα δεδομένα"Κατά την ανάπτυξη νέων μεθόδων και να μην είμαστε υπερβολικοί αυτοπεποίθηση για τα αποτελέσματά μας. Συνδεδεμένο με αυτό θα πρέπει να είναι ο στόχος για την παραγωγή ερμηνεύσιμων προβλέψεων «γυάλινο κουτί» από αυτά τα δεδομένα (σε αντίθεση με τις προβλέψεις «μαύρου κουτιού», στις οποίες ο αλγόριθμος είναι κρυμμένος ή μη σαφής).

Τα δεδομένα των κοινωνικών μέσων μαζικής ενημέρωσης συχνά επικρίνονται (δίκαια) επειδή είναι μικρά, μη αντιπροσωπευτικό δείγμα του ευρύτερου πληθυσμού. Μία από τις σημαντικότερες προκλήσεις για τους ερευνητές είναι να καταλάβουν πώς να λαμβάνουν υπόψη αυτά τα παραμορφωμένα δεδομένα σε στατιστικά μοντέλα. Ενώ περισσότερα άτομα χρησιμοποιούν κοινωνικά μέσα κάθε χρόνο, πρέπει να συνεχίσουμε να προσπαθούμε να κατανοήσουμε τις προκαταλήψεις σε αυτά τα δεδομένα. Για παράδειγμα, τα δεδομένα τείνουν να υπερεκπροσωπούν τα νεότερα άτομα εις βάρος των ηλικιωμένων πληθυσμών.

Μόνο μετά την ανάπτυξη καλύτερων μεθόδων διόρθωσης προκατάληψης, οι ερευνητές θα μπορούν να κάνουν απόλυτα σίγουρες προβλέψεις από tweets.

Σχετικά με το Συγγραφέας

Lewis Mitchell, Λέκτορας Εφαρμοσμένων Μαθηματικών, Πανεπιστήμιο της Αδελαΐδας

Αυτό το άρθρο δημοσιεύθηκε αρχικά στις Η Συνομιλία. Διαβάστε το αρχικό άρθρο.

Σχετικά βιβλία

at InnerSelf Market και Amazon