Computer-mediated communication is arguably prevailing over face-to-face. However, many of the subtleties that make in-person communication personal, cues such as an ironic tone of voice or an effortless posture, are inherently impossible to render through a screen. The context vanishes from the conversation - what is left is therefore mostly text, enlivened by occasional multimedia. At least, this seems the dominant opinion of both industry and academia, that recently focused considerable resources on a deeper understanding of natural and visual language. I argue instead that richer cues are missing from online interaction only because current applications do not acknowledge them -- indeed, communication online is already infused with nonverbal codes, and the effort needed to leverage them is well worth the amount of information they carry. This dissertation therefore focuses on what is left out of the traditional definition of content: I refer to these aspects of communication as content-agnostic. Specifically, this dissertation makes three contributions. First, I formalize what constitutes content-agnostic information in computer-mediated communication, and prove content-agnostic information is as personal to each user as its offline counterpart. For this reason, I choose as a venue of research the web forum, a supposedly text-based, impersonal communication environment, and show that it is possible to attribute a message to the corresponding author solely on the basis of its content-agnostic features -- in other words, without looking at the content of the message at all. Next, I display how abundant and how varied is the content-agnostic information that lies untapped in current applications.To this end, I analyze the content-agnostic aspects of one type of interaction, the quote, and draw conclusions on how these may support discussion, signal user status, mark relationships between users, and characterize the discussion forum as a community. One interesting implication is that discussion platforms may not need to introduce new features for supporting social signals, and conversely social networks may better integrate discussion by enhancing its content-agnostic qualities. Finally, I demonstrate how content-agnostic information reveals user behavior. I focus specifically on trolls, malicious users that disrupt communities through deceptive or manipulative actions. In fact, the language of trolls blends in with that of civil users in heated discussions, which makes collecting irrefutable evidence of trolling difficult even for human moderators. Nonetheless, I show that a combination of content-agnostic and linguistic features sets apart discussions that will eventually be trolled, and reactions to trolling posts. This provides evidence of how content-agnostic information can offer a point of view on user behavior that is at the same time different from, and complementary to, that offered by the actual content of the contribution. Popular up and coming platforms, such as Snapchat, Tumblr, or Yik Yak, are increasingly abandoning persistent, threaded, text-based discussion, in favor of ephemeral, loosely structured, mixed-media content. Although the results of this dissertation are mostly drawn from discussion forums, its research frame and methods should apply directly to these other venues, and to a broad range of communication paradigms. Also, this is but a preliminary step towards a fuller understanding of what additional cues can or should complement content to overcome the limitations of computer-mediated communication.

Interagiamo sempre più attraverso uno schermo, al costo di perdere tutti quei dettagli che caratterizzano la comunicazione di persona: un tono di voce ironico o una posa nonchalant sono impossibili da digitalizzare. Le conversazioni digitali si spogliano del contesto: quel che rimane è prevalentemente testo, arricchito al più dall'occasionale contenuto multimediale. Almeno, questa sembra essere l'opinione prevalente di industria ed accademia, le quali hanno concentrato le proprie attenzioni sull'estrarre significato da linguaggio scritto e visivo. La mia tesi, invece, è che questi dettagli non siano presenti nelle nostre interazioni attraverso lo schermo solo perché non messi a frutto, e quindi nascosti, dalle attuali applicazioni -- la comunicazione online è caratterizzata da un proprio linguaggio nonverbale, e la quantità di informazione che esprime ben ripagherebbe lo sforzo necessario per estrarla. Questa tesi si concentra su ciò che viene escluso dalla tradizionale definizione di contenuto: mi riferirò a questi aspetti della comunicazione come "agnostici rispetto al contenuto". Nel dettaglio, questa tesi porta tre principali contributi alla letteratura esistente. Il primo è una formalizzazione di "agnostico rispetto al contenuto" nel contesto delle comunicazioni informatiche, ed una prova del fatto che le informazioni "agnostiche rispetto al contenuto" siano caratteristiche individuali, così come accade nel mondo fisico. Per far ciò, fornisco un'analisi delle comunicazioni su web forum, una piattaforma di comunicazione considerata prevalentemente impersonale e testuale, e dimostro che è possibile identificare l'autore di un messaggio usando esclusivamente informazioni "agnostiche rispetto al contenuto" -- in altre parole, senza leggere il messaggio. Il secondo contributo è una dimostrazione del fatto che le attuali applicazioni per comunicare tramite schermo ignorino una quantità e varietà di informazioni "agnostiche rispetto al contenuto", e che queste abbiano significato convenzionale. A tal fine concentro i miei studi su una particolare caratteristica della dialettica online, la citazione, e mostro come questa sia in stretta relazione con segnali sociali, quali l'amicizia tra gli utenti del forum, l'autorità che gli utenti hanno nel forum, e la struttura dell'intera comunità del forum. Questi risultati permettono di migliorare e raccordare comunicazione e socializzazione nel mondo virtuale. In ultimo, il terzo contributo è uno studio che rivela come informazioni "agnostiche rispetto al contenuto" rispecchino il comportamento degli utenti. In particolare analizzo i troll, utenti che tramite mendacia e manipolazione causano gravi danni alle comunità virtuali. Infatti, i troll usano un linguaggio che ben si nasconde nelle conversazioni che essi portano al parossismo, rendendo difficile per i moderatori raccogliere prove certe che li smascherino. Nonostante ciò, mostro che è possibile individuare le discussioni che saranno colpite dai troll, e le reazioni degli altri utenti ai loro messaggi, tramite una combinazione di informazioni "agnostiche rispetto al contenuto" e lessicali. Questo studio in particolare sottolinea come le informazioni "agnostiche rispetto al contenuto" possano fornire un punto di vista alternativo e complementare al contenuto dei messaggi. Applicazioni emergenti come Snapchat, Tumblr, e Yik Yak stanno vieppiù abbandonando il paradigma della comunicazione informatica come discussione persistente, lineare, e testuale, preferendo contenuto effimero, destrutturato, e multimediale. Sebbene i risultati presentati si basino principalmente su web forum, l'impianto teorico e metodologico della tesi generalizza a queste nuove piattaforme, e ad una vasta gamma di paradigmi di comunicazione. Questa tesi vuol essere un passo verso una comprensione più approfondita del non detto nell'interazione virtuale, e di come sia possibile superare i suoi limiti.

Online discussions through the lens of interaction patterns / Samory, Mattia. - (2017 Jan 31).

Online discussions through the lens of interaction patterns

Samory, Mattia
2017

Abstract

Interagiamo sempre più attraverso uno schermo, al costo di perdere tutti quei dettagli che caratterizzano la comunicazione di persona: un tono di voce ironico o una posa nonchalant sono impossibili da digitalizzare. Le conversazioni digitali si spogliano del contesto: quel che rimane è prevalentemente testo, arricchito al più dall'occasionale contenuto multimediale. Almeno, questa sembra essere l'opinione prevalente di industria ed accademia, le quali hanno concentrato le proprie attenzioni sull'estrarre significato da linguaggio scritto e visivo. La mia tesi, invece, è che questi dettagli non siano presenti nelle nostre interazioni attraverso lo schermo solo perché non messi a frutto, e quindi nascosti, dalle attuali applicazioni -- la comunicazione online è caratterizzata da un proprio linguaggio nonverbale, e la quantità di informazione che esprime ben ripagherebbe lo sforzo necessario per estrarla. Questa tesi si concentra su ciò che viene escluso dalla tradizionale definizione di contenuto: mi riferirò a questi aspetti della comunicazione come "agnostici rispetto al contenuto". Nel dettaglio, questa tesi porta tre principali contributi alla letteratura esistente. Il primo è una formalizzazione di "agnostico rispetto al contenuto" nel contesto delle comunicazioni informatiche, ed una prova del fatto che le informazioni "agnostiche rispetto al contenuto" siano caratteristiche individuali, così come accade nel mondo fisico. Per far ciò, fornisco un'analisi delle comunicazioni su web forum, una piattaforma di comunicazione considerata prevalentemente impersonale e testuale, e dimostro che è possibile identificare l'autore di un messaggio usando esclusivamente informazioni "agnostiche rispetto al contenuto" -- in altre parole, senza leggere il messaggio. Il secondo contributo è una dimostrazione del fatto che le attuali applicazioni per comunicare tramite schermo ignorino una quantità e varietà di informazioni "agnostiche rispetto al contenuto", e che queste abbiano significato convenzionale. A tal fine concentro i miei studi su una particolare caratteristica della dialettica online, la citazione, e mostro come questa sia in stretta relazione con segnali sociali, quali l'amicizia tra gli utenti del forum, l'autorità che gli utenti hanno nel forum, e la struttura dell'intera comunità del forum. Questi risultati permettono di migliorare e raccordare comunicazione e socializzazione nel mondo virtuale. In ultimo, il terzo contributo è uno studio che rivela come informazioni "agnostiche rispetto al contenuto" rispecchino il comportamento degli utenti. In particolare analizzo i troll, utenti che tramite mendacia e manipolazione causano gravi danni alle comunità virtuali. Infatti, i troll usano un linguaggio che ben si nasconde nelle conversazioni che essi portano al parossismo, rendendo difficile per i moderatori raccogliere prove certe che li smascherino. Nonostante ciò, mostro che è possibile individuare le discussioni che saranno colpite dai troll, e le reazioni degli altri utenti ai loro messaggi, tramite una combinazione di informazioni "agnostiche rispetto al contenuto" e lessicali. Questo studio in particolare sottolinea come le informazioni "agnostiche rispetto al contenuto" possano fornire un punto di vista alternativo e complementare al contenuto dei messaggi. Applicazioni emergenti come Snapchat, Tumblr, e Yik Yak stanno vieppiù abbandonando il paradigma della comunicazione informatica come discussione persistente, lineare, e testuale, preferendo contenuto effimero, destrutturato, e multimediale. Sebbene i risultati presentati si basino principalmente su web forum, l'impianto teorico e metodologico della tesi generalizza a queste nuove piattaforme, e ad una vasta gamma di paradigmi di comunicazione. Questa tesi vuol essere un passo verso una comprensione più approfondita del non detto nell'interazione virtuale, e di come sia possibile superare i suoi limiti.
31-gen-2017
Computer-mediated communication is arguably prevailing over face-to-face. However, many of the subtleties that make in-person communication personal, cues such as an ironic tone of voice or an effortless posture, are inherently impossible to render through a screen. The context vanishes from the conversation - what is left is therefore mostly text, enlivened by occasional multimedia. At least, this seems the dominant opinion of both industry and academia, that recently focused considerable resources on a deeper understanding of natural and visual language. I argue instead that richer cues are missing from online interaction only because current applications do not acknowledge them -- indeed, communication online is already infused with nonverbal codes, and the effort needed to leverage them is well worth the amount of information they carry. This dissertation therefore focuses on what is left out of the traditional definition of content: I refer to these aspects of communication as content-agnostic. Specifically, this dissertation makes three contributions. First, I formalize what constitutes content-agnostic information in computer-mediated communication, and prove content-agnostic information is as personal to each user as its offline counterpart. For this reason, I choose as a venue of research the web forum, a supposedly text-based, impersonal communication environment, and show that it is possible to attribute a message to the corresponding author solely on the basis of its content-agnostic features -- in other words, without looking at the content of the message at all. Next, I display how abundant and how varied is the content-agnostic information that lies untapped in current applications.To this end, I analyze the content-agnostic aspects of one type of interaction, the quote, and draw conclusions on how these may support discussion, signal user status, mark relationships between users, and characterize the discussion forum as a community. One interesting implication is that discussion platforms may not need to introduce new features for supporting social signals, and conversely social networks may better integrate discussion by enhancing its content-agnostic qualities. Finally, I demonstrate how content-agnostic information reveals user behavior. I focus specifically on trolls, malicious users that disrupt communities through deceptive or manipulative actions. In fact, the language of trolls blends in with that of civil users in heated discussions, which makes collecting irrefutable evidence of trolling difficult even for human moderators. Nonetheless, I show that a combination of content-agnostic and linguistic features sets apart discussions that will eventually be trolled, and reactions to trolling posts. This provides evidence of how content-agnostic information can offer a point of view on user behavior that is at the same time different from, and complementary to, that offered by the actual content of the contribution. Popular up and coming platforms, such as Snapchat, Tumblr, or Yik Yak, are increasingly abandoning persistent, threaded, text-based discussion, in favor of ephemeral, loosely structured, mixed-media content. Although the results of this dissertation are mostly drawn from discussion forums, its research frame and methods should apply directly to these other venues, and to a broad range of communication paradigms. Also, this is but a preliminary step towards a fuller understanding of what additional cues can or should complement content to overcome the limitations of computer-mediated communication.
interaction pattern, content-agnostic, quotes, troll, social computing
Online discussions through the lens of interaction patterns / Samory, Mattia. - (2017 Jan 31).
File in questo prodotto:
File Dimensione Formato  
samory_mattia_tesi.pdf

accesso aperto

Tipologia: Tesi di dottorato
Licenza: Creative commons
Dimensione 3.92 MB
Formato Adobe PDF
3.92 MB Adobe PDF Visualizza/Apri
Pubblicazioni consigliate

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11577/3425728
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact