Pagina di stato per "End of Watch (Bill Hodges Trilogy #3) di Stephen King". Credito:Maity, Panigrahi &Mukherjee.
Ricercatori della Northwestern University, Microsoft Research India, e l'Indian Institute of Technology Kharagpur hanno recentemente sviluppato un modello per prevedere se un libro diventerà un bestseller su Amazon entro 15 giorni dalla sua pubblicazione. Il loro modello, delineato in uno studio pre-pubblicato su arXiv, funziona analizzando il comportamento di lettura sulla piattaforma online Goodreads.
"Abbiamo lavorato sull'analisi delle dinamiche di popolarità di varie entità di social media, come gli hashtag di Twitter, argomenti in Quora ecc." Animesh Mukherjee, uno dei ricercatori che hanno condotto lo studio ha detto a TechXplore. "Abbiamo ritenuto che si potesse adottare un approccio simile per analizzare la popolarità dei libri e abbiamo trovato che Goodreads fosse l'ideale per questa indagine".
La popolarità di un libro dipende da una moltitudine di fattori e può essere misurata utilizzando diversi parametri. Nel loro studio, i ricercatori si sono concentrati su come le caratteristiche di lettura del libro influenzano la sua popolarità. Hanno eseguito un'analisi multipiattaforma delle entità Goodreads e hanno cercato di collegarle al volume delle vendite dei libri su Amazon.
"Abbiamo seguito l'intuizione che la popolarità dei libri è principalmente guidata dai suoi lettori, da qui la motivazione per estrarre il comportamento di lettura del libro per comprendere la futura popolarità dei libri, " Mukherjee ha detto. "Uno dei modi migliori per quantificare la popolarità dei libri è guardare il suo record di vendita. Così, abbiamo cercato di quantificare la nozione di popolarità in termini di bestseller di Amazon".
Iniziare con, i ricercatori hanno analizzato il comportamento di lettura collettiva degli utenti su Goodreads. Hanno quindi quantificato diverse caratteristiche delle entità Goodreads, che potrebbe essere utilizzato per identificare le differenze tra i bestseller di Amazon e altri libri meno venduti. Finalmente, hanno sviluppato un modello basato sull'apprendimento automatico che utilizza queste caratteristiche per prevedere se un libro diventerà un bestseller 15 giorni dopo la sua pubblicazione.
"Abbiamo utilizzato modelli di apprendimento automatico all'avanguardia per eseguire le nostre previsioni, " ha spiegato Mukherjee. "Abbiamo osservato che le valutazioni e le recensioni ricevute da un libro su Goodreads non sono efficaci nel prevedere i bestseller quanto lo stato di lettura dei post degli utenti. Per esempio, in Goodreads, un lettore può pubblicare quanto del libro è stato letto, in quale pagina si trova, può commentare il libro, ecc. Troviamo che queste caratteristiche siano molto efficaci nel prevedere se il libro sarà un bestseller in futuro."
Proprietà caratteristiche dei post di stato degli utenti Goodreads:distribuzione di a) numero di aggiornamenti di stato per utente b) numero di utenti unici che aggiornano lo stato c) numero di utenti che si aggiornano più volte d) tempo di arrivo tra stati e) tratto massimo medio di lettura f ) tempo medio per finire la lettura di ABS rispetto ad altri libri. Credito:Maity, Panigrahi &Mukherjee.
Il loro modello ha raggiunto un'accuratezza media molto promettente dell'88,72% nel prevedere libri che sarebbero diventati i bestseller di Amazon poche settimane dopo la loro pubblicazione. Il loro metodo, che si basava su caratteristiche derivate dai post degli utenti e proprietà relative al genere, ottenuto un miglioramento del 16,4% rispetto ai metodi di base che utilizzano solo fattori di popolarità tradizionali, come valutazioni o recensioni di libri.
"Una delle informazioni più importanti che otteniamo da questo studio è che i libri bestseller di Amazon potrebbero non essere necessariamente qualificati da un testo di recensione di alta qualità dei lettori o da un elevato volume di valutazioni, " ha detto Mukherjee. "Al contrario, una grande maggioranza di loro ha modelli di post sullo stato del lettore che li distinguono fortemente dal resto dei libri."
I ricercatori hanno anche valutato quanto bene il loro metodo potesse prevedere due ulteriori tipi di libri:quelli con valutazioni elevate che ricevono un gran numero di recensioni ma non sono bestseller (HRHR), e libri nominati al Goodreads Choice Award (GCAN) che non sono bestseller. Hanno raggiunto un'elevata precisione media dell'87,1% per GCAN e dell'86,22% per i libri HRHR.
"Riteniamo che questo lavoro sia un contributo importante alla letteratura attuale in quanto non solo dispiega il comportamento di lettura collettiva di una piattaforma di lettura di libri sociali attraverso un rigoroso studio di misurazione, ma stabilisce anche un forte legame tra due canali ortogonali:Goodreads e Amazon, " ha detto Mukherjee.
Il modello sviluppato da Mukherjee e dai suoi colleghi potrebbe favorire lo sviluppo di strumenti che collegano Amazon e Goodreads tramite nuovi progetti di policy multipiattaforma. Ritengono che tali interazioni potrebbero essere una delle ragioni alla base dell'acquisizione di Goodreads da parte di Amazon nel marzo 2013. I ricercatori stanno ora cercando di espandere il loro studio analizzando ulteriormente i comportamenti di lettura degli utenti.
"Ci sono diverse direzioni che abbiamo intenzione di esplorare in futuro, " Mukherjee ha detto. "Uno è quello di indagare la popolarità di diversi generi di libri, per esempio, quali sono i modelli di post di stato nei diversi generi di libri? Un altro è studiare l'interdinamica del genere e della demografia del lettore. Per esempio, in che modo i comportamenti di lettura dei maschi differiscono da quelli delle femmine, o in che modo differiscono nei vari continenti?"
© 2018 Tech Xplore