Alex Goldiș – Pentru o cercetare literară mai transparentă și mai democratică

Un nume de neevitat în câmpul studiilor literare cantitative sau al practicilor din sfera Digital Humanities a devenit, în ultimii ani, Andrew Piper, profesor la McGill University din Montreal și director al publicației științifice Journal of Cultural Analytics. Volumul lui din 2018, Enumerations. Data and Literary Studies (University of Chicago Press) era o pledoarie polemică – cu multe exemple convingătoare – că în literatură (și implicit în studiile literare) cantitatea contează enorm. Spun polemică, pentru că ea mergea contra unei întregi tradiții hermeneutice și chiar de producție artistică în virtutea cărora singurele valori care intră în sfera de interes a criticului sunt individualitatea, subiectivitatea sau singularitatea (stilistică) a operelor, punând astfel între paranteze analiza unor mecanisme textuale ample precum repetiția, materia lexicală totală, punctuația etc. Constatând: că scrisul și cititul țin de ample procese de redundanță care au rămas până acum nestudiate, Piper pledează pentru reconstituirea a ceea ce el numește „istoria de substrat a acelor caracteristici literare elementare…adesea invizibile, pentru că sunt atât de banale” (“the deep story of elementary literary features…often invisible, because so common”). Când avem în vedere investigația unor categorii ample ale literarului precum poezie, roman, ficționalitate, personaj etc., trăsăturile care constituiau până acum doar un fel de „zgomot de fond” din care hermeneutica desprindea faptele „excepționale” trebuie introduse neapărat în sfera de interes a criticii.

Nu mai puțin ambițios e ceva mai recentul studiu Can We be Wrong? The Problem of Textual Evidence in a Time of Data, apărut la Cambridge University Press*. Cartea e o cercetare cantitativă care încearcă să elucideze problema generalizărilor în disciplinele umaniste – și în special, în studiile literare. Cum se formulează generalizările în studiile umaniste? Care este materialul avut în vedere de cercetători în momentul în care enunță legități cu privire la anumite fenomene? Câte tipuri de generalizări există? sunt, toate, întrebări legitime pe care și le-au mai pus și alți cercetători, fără a se apleca prin metode cantitative asupra subiectului. În Macroanalysis. Digital Methods and Literary History (2013), Matthew L. Jockers atrăgea atenția asupra faptului că volume constitutive pentru evoluția formelor occidentale, precum Mimesis-ul lui Erich Auerbach sau The Rise of the Novel a lui Ian Watt, formulează axiome ale evoluției genului pornind de la eșantioane foarte reduse de text. Cred, în aceeași măsură, că o astfel de observație ar putea fi valabilă pentru majoritatea sintezelor critice ale literaturii române, de la Arca lui Noe a lui Nicolae Manolescu până la Istoria poeziei românești a lui Mircea Scarlat, pentru a le numi doar pe cele mai reprezentative.

Andrew Piper preia această provocare și o supune unui foarte interesant experiment în care sunt angrenați șapte cercetători din domenii diverse (studii literare, istoria artei, etică biomedicală, studii culturale, lingvistică, istorie și informatică), un corpus de 230 de texte din 9 reviste de specialitate din 2016 din domeniile: studii literare, istorie, sociologie. În urma unor deliberări științifice complexe care au vizat organizarea/adnotarea materialului și analiza lui computațională prin mecanisme de machine learning (toate, expuse foarte detaliat), studiul lui Piper ajunge la niște concluzii surprinzătoare: una din două-trei fraze din incipit-urile sau concluziile studiilor literare (sunt luate drept mostre primele 1500 de cuvinte și ultimele 1000 ale fiecărui articol) constituie generalizări. Și mai interesant e că, plasate în aceleași grafice cu domenii precum istoria sau sociologia – în câmpul cărora factualitatea sau evidențele cantitative sunt mai prezente –, studiile literare oferă rezultate comparabile: dacă în istorie sau sociologie rata frazelor generalizatoare se plasează (în funcție de indici de calcul diferiți) între 38 % și 54 %, în studiile literare ea e doar puțin mai mică, variind între 30% și 49%. Studiul, foarte detaliat,  identifică și alte recurențe greu de sesizat cu ochiul liber: dacă în frazele care conțin generalizări sunt frecvente trimiterile temporale (cele trei domenii aflate sub lupă ilustrează ceea ce Piper numește temporally oriented language), în schimb o specificitate a studiilor literare constă în frecvența unor unități de măsură temporale fie foarte largi („medieval”, „epocă”, „secol”), fie foarte reduse („zi”), în comparație cu sociologia sau istoria, unde unitatea temporală predominantă e anul. Ceea ce îl face pe Piper să concluzioneze că „studiile literare sunt bifocalizate din unghi temporal, întrucât cercetătorii par să comute permanent perspectiva între unități foarte mici și cele foarte mari” (“literary studies has a bifocal temporal perspective that is worth further investigating, as researchers appear to shift between very small scales to very large ones”).

De ce sunt relevante experimente precum cele menționate mai sus? Pentru că ele atrag atenția asupra unei etici a cercetării literare care a fost prea puțin luată în seamă. Dincolo de discuțiile privitoare la raportul dintre „științificitate” și „creativitate” în câmpul investigației literare, care eșuează aproape toate în clișee sau aporii, studiul lui Andrew Piper atrage atenția asupra unor problematici cruciale pentru cercetătorul literar care vrea să ofere garanții – dincolo de simpla autoritate subiectivă – cu privire la validitatea propriilor afirmații. Faptul că, deși studiile literare au fost prea puțin preocupate până acum de cantitatea sau de reprezentativitatea corpusului, ele au operat totuși cu generalizări în proporții comparabile cu domenii pentru care evidențele și statisticile sunt fundamentale (sociologia), este în măsură să stârnească susceptibilități. Într-un excurs teoretic care nu poate fi rezumat aici, Piper se situează pe o poziție anti-diltheyană, conform căreia separarea tipului de investigație al disciplinelor umaniste de cel al științelor naturale nu este insurmontabil, în ciuda unor specificități. Colectarea datelor și precizarea materialului de observație, transparentizarea metodelor, precizarea resursei umane implicate, expunerea limitelor și a variabilelor experimentului sunt practici care ar trebui avute în vedere și în studiile literare, dacă acest câmp își dorește sporirea legitimității sociale și construirea unei comunități de cercetători construită nu în jurul unei ierarhii a autorității subiective, ci în numele unor principii de relativitate, de deschidere și de colaborare. În cuvintele lui Piper, „aceste principii oferă premisele necesare pentru înlocuirea unui model bazat pe adevăruri absolute – acelea bazate pe superioritatea morală (sau intelectuală) a sursei unei afirmații (e adevărat pentru că spun eu) – spre un model al adevărului ca funcție a încrederii sociale – e adevărat pentru că noi credem că e posibil să fie așa” (“these ideals offer the blueprint for how to move from a model of exemplary truths – those based on the moral (or intellectual) superiority of the statement s source (this is right because I say so) – to a model of truth as a function of social confidence – this is right because we believe it is likely the case”.

Este această chemare spre transparentizare și spre construirea unui câmp democratic al colaborării științifice o pledoarie pentru a diminua sau subestima creativitatea studiilor literare? A doua parte a studiului lui Piper formulează un NU hotărât, demonstrat prin alt experiment de analiză computațională. Luând corpusul de articole literare menționat în prima parte și comparându-l cu alt corpus care ține de științele așa-zis tari (biologie moleculară) din unghiul specificităților lexicale ale discursului științific, Can We be Wrong demonstrează – printr-o metodă computațională care are în vedere densitatea semantică –  că repetiția unor termeni grupați în jurul unor concepte centrale ale domeniilor este mult mai mare în câmpul biologiei. În schimb, studiile literare sunt mai îndatorate valorilor deschiderii conceptuale, fapt dovedit de inventivitatea și de diversitatea lexicală asociate acestor termeni centrali.

Faptele care pot suscita în continuare întrebări în această pledoarie-experiment sunt convențiile care au stat la baza procesului de machine learning operat de Piper și de echipa din jurul său: e decupajul din incipitul/finalul articolelor luate în calcul suficient pentru a studia frecvența totală a generalizărilor, sunt tiparele textuale luate drept norme pentru recunoașterea de către computer a unei fraze generalizatoare exacte? În fine, e măsurarea concentrării semantice din jurul unor cuvinte-cheie ale unei discipline (studii literare, biologie moleculară) un criteriu suficient pentru măsurarea „creativității” sporite a unei discipline în raport cu alta? Sunt, acestea, întrebări legitime pe care orice cititor al studiului și le poate formula pentru că în sfârșit avem de a face cu o cercetare literară care, în loc să „rezolve” dilemele prin camuflarea în retorică și prin plasarea lor pe seama unor experți a căror autoritate nu poate fi clintită, le expun deschis, supunându-le unor dezbateri sau rectificări ulterioare, în spiritul științei deschise.

____________________

*Andrew Piper, Can We Be Wrong? The Problem of Textual Evidence in a Time of Data, Cambridge University Press, 2020, 82 p.

[Vatra, nr. 9/2023, pp. 15-16]

Lasă un comentariu

Acest site folosește Akismet pentru a reduce spamul. Află cum sunt procesate datele comentariilor tale.