Puteți spune diferența dintre trezirea finlandeză și prostiile totale?

Dacă nu sunteți familiarizați cu lanțurile Markov, atunci nu vă bateți. Concluzia lor simplă este foarte simplă („un caz care poate fi îndepărtat imediat din fostul său stat, datorită Wikipedia!), Dar, în același timp, este foarte dificil de aplicat în viața reală. Nu prea mult între ele. Au fost în jur de ceva vreme, dar au găsit recent o recunoaștere majoră, deoarece puterea de calcul devine în sfârșit mai ieftină decât datele „apatride” pentru a calcula cazuri enorme, cu adevărat interesante.

Un mod incredibil de a calcula statul Markov este motorul de șah „Pink Pink”: a fost antrenat doar prin „urmărirea” a miliarde de mișcări de șah. Folosind acestea pentru a prezice „următoarea stare” a jocului de șah, el a devenit un jucător de șah foarte bun, niciodată programat să înțeleagă cum se mișcă fiecare piesă. Tehnic nu știe ce este șahul, este bine să știi cum va fi tabla de șah în continuare.

O altă utilizare a lanțurilor Markov este crearea de limbi naturale. Puteți alimenta câteva texte către generatorul de limbaj inspirat de Markov (la fel de bun), și „prezice” orice cantitate de cuvinte, propoziții sau paragrafe care ar putea „să apară în continuare”. t este imprevizibil, deoarece creatorii de text pot analiza acum doar sintaxa, gramatică și vocabular; sensul se pierde complet la computer, așa că apare în filmul care sună ca limbaj uman, dar este în mare parte supărat. Asta mă duce la Finnegans Wake ...

Dacă nu sunteți familiarizat cu Finnegans Wake, nu vă învingeți. A fost scris de romancierul de renume James Joyce din 1922-1939, iar specialiștii englezi pierd în continuare nopți de somn și încearcă să-și dea seama dacă înseamnă de fapt ceva. Și vreau să spun, pentru unii subiectivisti, „Aceasta înseamnă ceva?” Asta în condițiile în care profesorii universitari poartă ceainicele scufundate în coate desculte; Trebuie să spun că încă nu există un consens între academic sau altceva dacă este vorba despre o prostie de 600 de pagini.

O piesă tipică de la Finnegans Wake

Poate că Joyce a jucat o glumă în comunitatea literară sau poate a schimbat definiția exactă a romanului. Nu știm. Și dacă blocăm vreo nouă revelație personală, nu vom putea niciodată. M-am bazat personal pe Joyce: Citesc câteva pasaje din Wake mă supără întotdeauna, dar prin aceasta găsesc stabilitate care nu poate fi remediată. Paragraful poate avea două cuvinte separate, dar mereu părea că fiecare pagină trebuie să spună ceva mai profund, iar eu eram gata să ofer autorului avantajul îndoielii.

Până când am început să folosesc generator de text Markov.

Când am găsit acest simplu generator de text Markov acum câteva zile, aproape că știam că trebuie să-l antrenez în Finnegans Wake. Când analizează Wake, oamenii se lipesc de lucruri precum încercarea de a scrie una din cele patruzeci și cinci de scrisori ale lui Joyce cu optsprezece Z. Cu toate acestea, generatorul de text al lui Markov a fost înregistrat și mutat pur și simplu, ceea ce înseamnă că este mai probabil să apară cuvinte lungi cu prea multe cuvinte Z. Am început să citesc „Renașterea” lui Markov, analizând rezultatele și apoi prezicând mai mult din textul său pe baza întregii sale gramatici, sintaxă și vocabular. O astfel de analiză ar fi nevoie de câteva minute, odată ce era imposibil.

Și când am văzut rezultatele, aproape că nu am crezut. Încercați să spuneți diferența:

În cele mai multe cazuri, generatorul de limbă are mai mult sens decât textul inițial. Rezultatul pare să se potrivească atât textului original, cât și stilului, ceea ce nu are niciun sens. Am văzut rezultate - nu pot spune diferența dintre original și producția mea cu mai mult de 80% - într-o stare de nesiguranță. Puteți așeza cu ușurință munca computerului pe cele 600 de pagini ale lui Wake și aproape nimeni din lume nu poate spune asta.

Puteți spune care dintre acestea este site-ul Wake și care este computerul?

Deci, se rezolvă asta? Joyce a fost o fraudă? Acum, că textul său nu poate fi separat de gibberish (pentru mine oricum), este o poveste precum codul programului meu? Nu este atât de rapid.

Nu sunt un expert englez, dar știu unele lucruri pe care nu le pot scoate de la Wake. În primul rând, un fascinant dicționar exploratoriu aparținea în totalitate lui Joyce. Desigur, programul meu ar putea să îl dubleze, dar nu l-a inventat niciodată. Chiar dacă romanul în sine nu are sens, dacă găsești sensul unui cuvânt, această onoare este în întregime în cea a lui Joyce.

În al doilea rând, chiar dacă intențiile artistului sunt într-un fel dovedite a fi duplicate în mașină, acesta îi diminuează puterea. Putem construi o mașină de vopsit pentru Van Gogh (sau ca Pollock), dar aceasta nu diminuează influența vreunei piese de artă individuale. Poate o parte din intenția artistului este de a transmite haos sau chiar duplicarea mașinii! Știu că, dacă Joyce s-ar fi ridicat de la mormânt și a văzut rezultatele aplicației mele Markov, ar fi putut zâmbi, ar fi editat subiectul ușor și l-ar fi publicat ca parte a Renașterii Finnegans: Chiar și Wakier. Și îi surprinde pe toți?

Să fiu clar: ce piesă este care; Nu prea știu pentru ce au fost create Joyce și Markov.

În al treilea rând, doar pentru că nu pot spune că este în jur de 80% din timp, nu înseamnă că nimeni nu poate. De multe ori există studenți de literatură care pot spune diferența. Și deși acest lucru nu afectează opinia mea personală asupra cazului, înseamnă că universitățile mai educate pot ajunge la o concluzie complet diferită, chiar dacă am aceleași informații.

În cele din urmă, trebuie să recunosc că din acest motiv părerea mea despre Wake s-a schimbat. Accept pe deplin că armonia ei interioară nu este mai puțin dificil de creat decât prostii. Dar l-am admirat cu adevărat și, desigur, pe Joyce.

Dacă nimic altceva, a fost un generator al limbii Markov cu 80 de ani înainte de invenția sa.

[Acest articol a apărut inițial pe Union.io]