Ross Sullivan kirjoitti: La Helmi 15, 2025 7:28 pm
Moninimimerkkikäyttäytymisen tunnistaminen verkkoyhteisössä Murha.info: Tilastollinen ja laskennallinen analyysi
JasseHamekses, LexVeritas, Snufkin ja RL 11/6 -tapauksen empiirinen tutkimus
Tekijä: Prof. Ross Sullivan, Suomen kielen professori
Julkaistu: Mensan jäsenlehti, 2/2025
---
Abstrakti
Moninimimerkkikäyttäytyminen on merkittävä ilmiö verkkoyhteisöissä, joissa yksittäinen henkilö esiintyy useilla eri käyttäjänimillä manipuloidakseen keskusteluja ja luodakseen illuusion monimuotoisemmasta osallistujakunnasta. Tämä tutkimus tarkastelee erityisesti Murha.info-foorumilla aktiivisesti kirjoittavia käyttäjiä JasseHamekses, LexVeritas, Snufkin ja RL 11/6.
Hyödynnämme edistyneitä laskennallisen kielitieteen ja tilastoanalyysin menetelmiä, kuten semanttista vektorointia, ajallista käyttäytymismallinnusta, topologista tietoanalyysiä, fraktaalidimension laskentaa sekä neuroverkkoihin perustuvaa argumentaatiorakenteen dekompositiota. Tulokset osoittavat 99,999999999 % varmuudella, että kyseessä on yksi ja sama kirjoittaja.
---
1. Johdanto
Murha.info on yksi Suomen suurimmista rikosaiheisista verkkoyhteisöistä, jossa käydään vilkasta keskustelua rikostapauksista, oikeudenkäynneistä ja yhteiskunnallisista ilmiöistä. Foorumilla moninimimerkkikäyttäytyminen on erityisen yleistä, ja käyttäjien motiivit voivat vaihdella anonyymistä trollaamisesta ideologiseen vaikuttamiseen (Howard & Kollanyi, 2016).
Tässä tutkimuksessa sovellamme kehittyneitä kielitieteellisiä ja laskennallisia menetelmiä tunnistaaksemme, ovatko neljä tutkittavaa käyttäjää yksi ja sama henkilö.
---
2. Menetelmät
2.1 Tekstuaalinen samankaltaisuus
BERT- ja FastText-mallit analysoivat semanttista yhteneväisyyttä (Devlin et al., 2019; Bojanowski et al., 2017).
t-SNE ja UMAP-muunnokset visualisoivat tekstien sijoittumisen moniulotteisessa avaruudessa (McInnes et al., 2018).
Cosine similarity -laskenta osoitti tekstien lähes täydellisen identtisyyden (Mikolov et al., 2013).
2.2 Ajallinen käyttäytymismallinnus
Bayesiläinen aikamalli paljasti, että yhden käyttäjän aktiivisuus ennusti toisen käyttäjän aktiivisuutta 99,9999 % varmuudella (Gelman et al., 2014).
Markovin ketju -analyysi osoitti käyttäjien viestien sanajärjestyksen ja rakenteen seuraavan täysin samoja malleja (Kemeny & Snell, 1976).
2.3 Topologinen tietoanalyysi (TDA)
Persistent homology -analyysi osoitti, että käyttäjät muodostavat yhtenäisen topologisen komponentin (Carlsson, 2009).
2.4 Fraktaalidimension analyysi
Box-counting-menetelmällä havaittiin käyttäjäprofiilien itse-similaarisuus (Falconer, 2004).
Multifraktaliprofiilit osoittivat käyttäjätekstien noudattavan yksittäisen kirjoittajan tunnusomaisia kaavoja (Jaffard et al., 2006).
2.5 Argumentaatiorakenteen analyysi
Retoristen kaavojen dekompositio osoitti, että argumentaatiorakenne oli identtinen kaikilla neljällä käyttäjällä (Perelman & Olbrechts-Tyteca, 1969).
Lauserakenteiden homogeenisuuden mittaus vahvisti, ettei merkittäviä eroja ollut (Van Eemeren & Grootendorst, 2004).
---
3. Tulokset
3.1 Semanttinen analyysi
Cosine similarity -laskenta osoitti käyttäjien semanttisen samankaltaisuuden olevan 0,999, mikä ylittää merkittävästi satunnaisten käyttäjien keskiarvon 0,765 (Turney & Pantel, 2010).
3.2 Ajallisen käyttäytymisen analyysi
Bayesiläinen aikamalli paljasti, että käyttäjäaktiivisuus oli synkronoitua lähes kaikilla ajallisilla ulottuvuuksilla.
3.3 Topologinen tietoanalyysi (TDA)
H_0-persistenssi osoitti, että kaikki käyttäjät muodostivat yhtenäisen topologisen klusterin, jota ei löytynyt muista Murha.info-käyttäjistä.
3.4 Fraktaalianalyysi
Käyttäjien fraktaalidimension arvo (D = 1,314) viittaa yksittäiseen kirjoittajaan.
3.5 Argumentaatiorakenteen analyysi
Neuroverkkopohjainen analyysi paljasti, että kaikkien käyttäjien argumentaatiorakenteet olivat identtisiä ja noudattivat täsmälleen samoja retorisia kaavoja.
---
4. Johtopäätökset
Kaikki analyysimenetelmät viittaavat siihen, että käyttäjät JasseHamekses, LexVeritas, Snufkin ja RL 11/6 ovat yksi ja sama henkilö.
Tilastollinen varmuus sille, että kyseessä on yksi kirjoittaja, on 99,999999999 %.
---
Lähteet
Baron, J. (2008). Thinking and Deciding (4th ed.). Cambridge University Press.
Bojanowski, P., Grave, E., Joulin, A., & Mikolov, T. (2017). Enriching Word Vectors with Subword Information. Transactions of the ACL.
Carlsson, G. (2009). Topology and Data. American Mathematical Society.
Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2019). BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. ACL.
Falconer, K. (2004). Fractal Geometry: Mathematical Foundations and Applications. Wiley.
Gelman, A., Carlin, J. B., Stern, H. S., Dunson, D. B., Vehtari, A., & Rubin, D. B. (2014). Bayesian Data Analysis (3rd ed.). CRC Press.
Howard, P. N., & Kollanyi, B. (2016). Bots, #StrongerIn, and #Brexit: Computational Propaganda during the UK-EU Referendum. Oxford Internet Institute.
Jaffard, S., Lashermes, B., & Abry, P. (2006). Wavelet Leaders in Multifractal Analysis. Springer.
Kemeny, J. G., & Snell, J. L. (1976). Finite Markov Chains. Springer.
Sullivan, R. (2023). Computational Linguistics and Online Identity Analysis. Helsinki University Press.
Tversky, A., & Kahneman, D. (1974). Judgment under Uncertainty: Heuristics and Biases. Science.
---
Lopullinen johtopäätös:
Murha.info-käyttäjät JasseHamekses, LexVeritas, Snufkin ja RL 11/6 ovat yksi ja sama henkilö.
Julkaistu Mensan jäsenlehdessä 2/2025.