En aquest article només pretenem presentar les dades completes i aclarir alguns detalls sobre com funciona la plataforma i com les hem recollit per tal d’ajudar a entendre-les. I en tot cas, fer alguna observació a primer cop d’ull, però en cap cas trobar explicacions profundes.
Per tal d’entendre la primera taula (i les següents), la primera cosa que cal aclarir per a qui no conegui Dictapp és la classificació de faltes amb què treballem. La nostra és una plataforma creada per a treballar l’ortografia de manera personalitzada i poder-li dir a cada usuari/ària en què falla més i en què falla menys. És per això que el nostre motor de correcció detecta i identifica cada falta d’ortografia comesa i la classifica segons quinze categories.
Seguint aquestes categories, en aquesta primera taula hi teniu enumerat quin tant per cent faltes correspon a cada tipus de falta sobre el total de les 1.082.651:
Un parell d’aclariments sobre les categories triades. Calaix de sastre és una categoria que recull tot de faltes (confusió entre q/c, i/y o r/rr…) que no tenen prou entitat per constituir una categoria pròpia. I Juntes o separades? inclou qüestions com perquè/per què, des de, etc.)
Com veieu, les faltes relacionades amb l’accentuació representen més d’una de cada tres faltes comeses.
Comparació dels blocs dialectals
Tenim dues versions diferents de les locucions dels dictats a disposició dels centres, una per al català occidental i una per al català oriental. D’aquesta manera hem pogut separar les dades d’un i altre bloc dialectals per tal de poder-les comparar. En el bloc oriental s’hi inclouen la part oriental del Principat i les Balears. Al bloc occidental no s’hi inclou el País Valencià perquè encara no en tenim dades significatives.
Com és d’esperar, si comparem percentatges la diferència més gran es troba en allò tocant a la neutralització vocàlica. La categoria de la vocal neutra, que en el bloc occidental passa a la desena posició de la llista i quasi té la meitat d’incidència, i la categoria de la O/U àtones, que també experimenta un descens en la part occidental, per bé que no tan acusat.
Malgrat això, cal dir també que en el bloc occidental hi ha algunes faltes particulars en vocals neutres a final de paraula que no trobem al bloc oriental, com per exemple el nom de la mateixa capital del Segrià escrit com Lleide.
Influències entre llengües
Lògicament s’observen grafies errònies fruit de la contaminació (de vegades ortogràfica, però també lèxica o gramatical) entre català i castellà, tant en un sentit com en l’altre. En català veiem casos típics com accentuar erròniament paraules planes com si fossin hiatos castellans (tenía, coneixía, havía…).
En la versió castellana de Dictapp (utilitzada al Principat i les Balears) hi trobem també errades provocades per la influència del català. Aquests són només alguns dels casos recollits: d’arrel ortogràfica, en trobem casos com pressión per presión, leies per leyes, interferències per interferències o hablar-le per hablarle; d’arrel més lèxica, obrió per abrió, acceptación per aceptación, judjarte per juzgarte, síntesi per síntesis o augmentan per aumentan.
Per zones geogràfiques
Els alumnes de diferents zones del domini lingüístic català s’equivoquen en coses diferents? Sembla que no a grans trets però sí en algunes coses concretes, que poden ser consistents amb les serves variants dialectals, com per exemple la neutralització vocàlica, com ja hem vist abans. A banda d’això, destaca el percentatge de faltes que tenen a veure amb la representació gràfica dels sons postalveolars (g, j, etc.) que hi ha a les terres gironines, que potser pot tenir a veure amb la diferent pronúncia que es fa en els parlars gironins en alguns casos. En els mateixos parlars, potser algú podria esperar més errades amb els accents oberts i tancats, però no és així. Pot sorprendre també la gran incidència que té la categoria Accentuació general a Tarragona, amb un percentatge força més elevat que a la resta malgrat que a totes les zones està en primera posició.
Etapes educatives
La comparació de les diferents etapes no descobreix grans diferències, per bé que sí que hi ha alguns tipus de faltes que canvien significativament la seva posició a la llista i el seu percentatge d’incidència. Passa amb categories com La lletra H, Accents diacrítics o La vocal neutra. Cal recordar que el valor numèric no és absolut, sinó que correspon al percentatge d’aquella categoria sobre el total de faltes. Per exemple, si mirem el percentatge d’incidència de la categoria Accentuació general, al Batxillerat és bastant més alt. Això ens podria fer pensar que els alumnes de Batxillerat fan més faltes d’accentuació que els d’ESO, però potser la resposta és que fan menys faltes de les altres categories i per això puja el percentatge. I aleshores una possible explicació seria que han solucionat altres faltes però no encara l’accentuació. En aquest cas el lector pot estar pensant que la dada útil seria la mitjana de faltes que fan, per veure si efectivament han baixat. Però aleshores cal recordar també que Dictapp té 5 nivells diferents de dificultat i és plausible pensar que els cursos de Primària (de 4t a 6è), ESO i Batxillerat treballin majoritàriament en nivells diferents.
L’aventura de predir
Si voleu posar-vos a la pell d’un docent quan corregeix textos, aquest és el vostre apartat. El motor de correcció de Dictapp funciona predictivament: intenta predir totes les possibles maneres en què es podria escriure una paraula per poder-ne categoritzar les errades, sigui en una de les 15 categories d’errades ortogràfiques o sigui com a errada no ortogràfica. Això pot semblar que són faves comptades (“en aquesta paraula podrien deixar-se l’accent, posar una s en lloc d’una c… i para de comptar”). Però els docents saben que de vegades la llista de les diferents maneres com un alumne pot escriure una paraula pot ser molt més llarga del que hom pot imaginar. De fet, en alguns casos la llista de possibles escriptures d’una mateixa paraula pot ajudar els filòlegs a entendre el concepte matemàtic de tendir a infinit. Mireu, si no, aquests dos casos: les 56 maneres diferents com el motor de correcció ha registrat una paraula de 4 lletres com això o les 136 de barrejar (ordenades alfabèticament):
acho |
aio |
aíxo |
aixor |
axo |
ello |
hajo |
aicho |
aisxo |
aìxo |
aixos |
axó |
eso |
haxo |
aigo |
aixà` |
áixo |
ajo |
axò |
Exo |
heixò |
aiguxu |
aixio |
àixo |
ajò |
eijo |
Exó |
hexo |
aiho |
aixió |
aixoa |
ashó |
eijò |
Exò |
hexò |
aijo |
aixo |
aixóa |
axio |
eixo |
haigo |
iaixo |
aijó |
AIXO |
aixòa |
axió |
eixò |
haixo |
sho |
aijò |
aixó |
aixòn |
axiò |
ejo |
haixò |
so |
avarregar |
baregár |
baretjar |
barreijar |
barretllar |
beregar |
varega |
varrejar |
bagreixar |
baregiar |
barjeijar |
barreixar |
barretxar |
bereigar |
varegar |
varrellar |
bairregar |
bareguar, |
barraga |
barreixat |
barrexar |
bereijar |
vareicha |
varresar |
baraga |
bareigar |
barraixar |
barreja |
barrexiar |
bereixar |
vareigar |
varretjar |
baragar |
bareijant |
barraja |
barrejà |
barrezar |
berejar |
vareijá |
varrexar |
baraia |
bareixar |
barrajà |
barrejàr |
barrgar |
berrajar |
vareijar |
veirrajar |
baraigar |
barejà |
barrajar |
bárrejar |
barrjar |
berregar |
vareixar |
veragar |
baraixa |
barejar |
barralla |
bàrrejar |
barrjear |
berreigar |
varejar |
veraija |
baraja |
barejas, |
barrallar |
barrejat |
barrregar |
berreixar |
varexar |
verajar |
barajar |
barejat |
barrasha |
barrejer |
barrreja |
berrejà |
variga |
veregar |
barajat |
barejiar |
barraxa |
barrejr |
barrrejar |
berrejar |
varragar |
vereigar |
barallar |
barejjar |
barreejar |
barrelar |
beraga |
braxejar |
varraixar |
verejar |
baratjar |
barellar |
barregar |
barrellar |
beragar |
darrejar |
varrajar |
verèjar |
baraxa |
barellàr |
barreges |
barrenar |
beraiga |
varaga |
varregar |
verregar |
baraxar |
barellat |
barreguer |
barretgar |
beraixar |
varagar |
varreigar |
verrejar |
baregar |
baretga |
barreigar |
barretjar |
beraja |
varaje |
varreijar |
verrella |
BAREGAR |
baretgar |
barreiguar |
barretjat |
berajar |
varalla |
varreixar |
vreja |
Abans de fer-ne qualsevol anàlisi, cal tenir present que això és un recull de faltes comeses per alumnat de totes les edats i amb tot tipus de casuística pel que fa a possibles dificultats d’aprenentatge i tot tipus de nivell de coneixement del català. Per tal de ser estrictes en la protecció de dades, registrem les paraules de manera anònima, així que no podem distingir etapes educatives, ni edats, ni nivells de dificultat ni zones, la qual cosa en alguns casos segurament ens donaria claus per explicar algunes escriptures.
Si mirem detingudament les llistes, amb l’ànim de fer una primera aproximació i no pas una anàlisi a fons ni encara menys establir explicacions, hi veurem tipologies d’errades diferents. D’entrada les més esperables, com ara bé treure o afegir un accent o posar-lo al revés (aixo, això / barrejàr), confondre l’escriptura d’una vocal neutra (eixò / barrajar, berrejar, berrajar) o equivocar-se en grafies “sospitoses habituals” com ix (ajò, axò) o j (barreixar, barregar, barretjar). D’altres amb solucions més allunyades d’allò esperable (aigo, aisxo / barreiguar, barretllar). També algunes que denoten contaminacions d’altres llengües (aicho, acho, ashó / vareicha, barrasha). D’altres que proposen solucions més impensades i que no tenen cap explicació fonètica raonable (aixóa, aixà, aixòn / varaje, braxejar) i que en alguns casos potser no són sinó errades de picatge. Dins d’aquestes solucions fonèticament inviables, hi ha un subgrup interessant que són els accents posats en vocals que no són la tònica (àixo, aíxo, aìxo / bárrejar). De vegades també hi ha solucions gràfiques que semblen molt allunyades però que fonèticament encaixen (aixor, heixò / barrejà, varrajar).
Per acabar, una curiositat per a aquelles persones interessades en el funcionament intern del llenguatge. Una altra manera com alguns usuaris van escriure barrejar és remenar. L’àudio del dictat diu la paraula barrejar, però un cop processada pel cervell de l’usuari/a es va transformar en el sinònim remenar. Aquest és un fenomen que es repeteix en molts altres casos.
Sens dubte, una anàlisi més profunda podria trobar més conclusions i possibles explicacions. Aquestes dades i les que anem recollint tenen molt camp d’anàlisi per recórrer per davant i creuat amb món universitari. I a més en el futur es creuaran amb dades similars de gramàtica, etc.
Com hem recollit aquestes dades? Aclariments metodològics
La nostra és una plataforma creada per a treballar l’ortografia de manera personalitzada a partir de dictats i activitats. El nostre motor de correcció detecta i identifica cada falta d’ortografia comesa i la classifica segons quinze categories.
No guardem cap dada personal, només guardem els totals de cada tipus de falta classificats per zones i per etapes educatives. No podem saber qui ha fet cada falta, ni tan sols de quina escola és. El que sabem és a quina etapa està assignat i a quina zona està el centre.
Accentuació general |
G / J / TG / TJ |
La lletra H |
Accents oberts/tancats |
La B i la V |
Consonants finals |
Accents diacrítics |
S/C/Ç/SS/SC… |
Juntes o separades? |
Apòstrof i guionet |
La dièresi |
Les majúscules |
La vocal neutra |
O/U àtones |
Calaix de sastre (un compendi d’altres faltes) |
3 comentaris
Vigileu: “En aquest cas el lector pot està pensant que…”. Cap sabater calça bé…
Gràcies. Ho corregim.
Hola, coneixeu alguna manera de registrar faltes perquè l’alumne pugui tenir clares quines fa i abordar-ho de manera concreta i personalitzada per ajudar-los? Xavier Breil, podría parlar amb tu?