Pentru o primă și scurtă analiză a datelor de la Bacalaureat 2011, să vedem câți elevi* au fost prinși copiind la nivelul întregii țări și apoi, mai în amănunt, pe județe și școli.
Ca imagine globală, deși există uscături aproape** în fiecare județ, sunt în fapt câteva județe care conduc detașat în topul elevilor prinși copiind. Același lucru se poate observa și dacă mergem mai în amănunt, la nivelul școlilor: există anumite instituții unde hoția e mult mai frecventă. Dar să vedem concret, unde anume?
În majoritatea județelor, mai puțin de 0.5% din elevi au fost eliminați din examen. Ceea ce nu înseamnă chiar puțini (în București de exemplu tot au fost 108 de astfel de elevi, chiar dacă procentual reprezintă doar 0.49%). Totuși, 1 hoț la fiecare 200 elevi pare să fie aproape suportabil în comparație cu județele fruntașe în top: Caraș-Severin (8 hoți la fiecare 200 de elevi), Hunedoara (5 hoți la fiecare 200 de elevi), Timiș (3 hoți la fiecare 200 de elevi) și Mehedinți (2 hoți la fiecare 200 de elevi). Lucru pe care-l puteți admira în grafic, mai jos:
Aceeași situație, a concentrării numărului de elevi prinși copiind în anumite focare, se poate observa și la nivelul școlilor, deși nu la fel de puternic. Din totalul celor 306 de școli în care cel puțin un elev a fost eliminat, în 72 de școli a fost prins 1 hoț la fiecare 200 de elevi, în alte 120 școli au fost prinși 2, iar în alte 108 școli între 2 și 20 de hoți la fiecare 200 de elevi. Iar dacă 20 din 200 sună totuși foarte prost, abia în restul de 6 școli fruntașe, e situația de-a dreptul jalnică: de la 50 până la 133 de hoți prinși la fiecare 200 de elevi. Altfel spus, de la un sfert până la două treimi dintre elevi au fost prinși încercând să fraudeze! Mai jos, puteți admira primele zece școli în topul hoției (cel puțin cea expusă) la Bacalaureat 2011.
Legenda:
A - Colegiul tehnic agricol "Alexandru Borza" Geoagiu, județul Hunedoara
B - Grup școlar agricol Biled, județul Timiș
C - Liceul teoretic Periam, județul Timiș
D - Grupul școlar industrial construcții de mașini Caransebeș, județul Caraș-Severin
E - Grupul școlar forestier Caransebeș, județul Caraș-Severin
F - Grupul școlar de transporturi auto Caransebeș, județul Caraș-Severin
G - Grup școlar "Romulus Paraschivoiu" Lovrin, județul Timișoara
H - Colegiul tehnic "Lorin Sălăgean", județul Mehedinți
I - Seminarul teologic liceal ortodox "Sf. Ioan Gură de Aur" Slobozia, județul Ialomița
J - Seminarul teologic liceal ortodox "Episcop Ioan Popasu" Caransebeș, județul Caraș-Severin
E interesant de remarcat faptul că în topul pe școli, apare pe locul 9 o instituție dintr-un județ care altminteri e abia pe locul 15. Dovadă (în cazul în care mai era nevoie) că problema hoției nu depinde în fapt de o entitate relativ arbitrar definită precum județul, ci direct de fiecare om în parte și indirect de asocierile pe care le stabilește și din care face parte.
Update: în urma discuțiilor din comentarii, adaug graficele complete pentru procentele de elevi eliminați în fiecare județ respectiv școală (pentru școli, figurează pe grafic doar cele unde a fost eliminat cel puțin un elev).
* Menționez că pentru analiza asta am considerat toți elevii eliminați din examen, indiferent de proba la care au fost eliminați.
** Excepția notabilă este județul Olt - singurul județ unde n-a fost eliminat nici măcar un elev.
Comments feed: RSS 2.0
Hoţul neprins, negustor cinstit. Doar minciuna şi hoţia trebuiesc dovedite, nu onestitatea. Dacă Oltul nu a eliminat elevi pentru copiat, înseamnă că nu au existat dovezi. :)
@mitzaabiciclista Ce-i drept. Dar pana la dovada contrara (care e posibil sa vina, daca e cazul, din datele pe anii trecuti sau din alte analize), elevii din Olt au fost onesti :)
Asta e dovada că oltenii trebuie să fie mereu mai cu moț decât ceilalți. Ha ha ha!
Asa privint ochiometric mie imi pare foarte suspecta diferenta de amplitudine. Deci, la masura hoti/judet ai un zipf foarte hotarit care decade in = 1 (unitatea de masura) in 3 pasi. La hoti/scoala ai o functie cvasi-liniara. Paidece ?!
Hotii nu-s acolo unde i-au prins la copiat, ci acolo unde nu i-au prins...
Hotii sunt acolo unde distributia notelor are un spike intre nota 5-6 si lipsa intre 4-5. Daca o sa iei datele de la bacalaureatul din 2006 o sa-l vezi foarte clar la romana, unde i-au trecut profesorii pe toti dobitocii (inclusiv pe mine) care au scris comentarii aiurea.
@Cristian Cum se zice, inca nu-i clar care-i motul. Dar speram in unul bun.
@Mircea Popescu E greu de estimat dupa graficele astea doar, daca vrei sa vorbesti clar de distributii, trebuie calculate. Chestia cu comparatul direct al distributiei pe astea doua grafice e ca ele dau un top al primelor 10 pozitii, dar in fapt sunt mai multe scoli decat judete (deci pe graficul complet, iti va parea "mai hotarata" si curba de la scoli). Pragurile semnificative in fapt la scoli sunt marcate in text (la primele 6 scoli e primul prag, deci chiar mai "focare").
@gheorghe Hotii sunt si astia care au fost prinsi, si cei care n-au fost prinsi. Pe acestia i-am pus aici la insectar, pe ceilalti ii vom gasi in episodul urmator, cand o sa compar distributiile cu gauss.
Nu doar anomalia de o zici tu e la o adica semn de hotie, ci orice anomalie fata de gaussiana.
A rose by any other name, totusi. De acord cu tine ca pentru a compara distributii tre' calculate distributii, da' explicatia oferita nu-mi satisface ochiu'.
@Mircea Popescu Ca totusi sa nu discutam complet in aer, am adaugat graficele complete. Zic ca-i cel mult pe dos: la scoli se vede clar distributia, pe cand la judete e mai degraba liniara pentru cele cu putini si respectiv ceva dubios/lipsa in zona de mijloc.
supravegherea s-a facut pe centre. daca un centru a fost supravegheat bine atunci au prins probabil de la mai multe scoli proportional cu numarul de absolventi.
@Dr A Hmmmm, din pacate n-am nici un fel de date privind centrele. O sa incerc sa sap un pic dupa ele, poate sunt totusi pe undeva (ma gandesc ca ceva organizare ar trebui sa fie publicata).
in principiu la lista rezultate apareau centrle de corectare.
Mie mi se pare ca se vad destul de clar doua chestii
I. Prinderea hotilor nu-i aplicata uniform, ci hei-rupistic, aici ii prindem, colo nu-i.
II. Heirupismul prinderii hotilor e mai discret [in sens de non-continuu] la nivel de judet decit la nivel de liceu, unde-i mai continuu.
Ca atare, responsabilitatea pentru frauda cade in sarcina inspectoratelor in primul rind, si al centrelor de corectare in al doilea rind (si nu invers, de exemplu).
in caz ca are cineva scula cu care sa faca automatizarea aveam intentia sa scot urmatorul clasament:
topul liceelor pe tara functie de medie si procentul de promovare (inlocuit cu 1 Reusit si 0 restul).
ar fi interesant de facut media si promovabilitatea pe specialitati in cadrul liceelor si eventual scos un top pe profile.
Un exemplu de tratament:
media promovabilitatea
AB COLEGIUL ECONOMIC DIONISIE POP MARTIAN ALBA IULIA 6.37 53.8%
AB COLEGIUL ECONOMIC DIONISIE POP MARTIAN ALBA IULIA Organizator banqueting 10.7%
AB COLEGIUL ECONOMIC DIONISIE POP MARTIAN ALBA IULIA Tehnician in activitati de comert 0.0%
AB COLEGIUL ECONOMIC DIONISIE POP MARTIAN ALBA IULIA Tehnician in activitati economice 98.2%
AB COLEGIUL ECONOMIC DIONISIE POP MARTIAN ALBA IULIA Tehnician in gastronomie 0.0%
AB COLEGIUL ECONOMIC DIONISIE POP MARTIAN ALBA IULIA Tehnician in turism 75.5%
AB COLEGIUL MILITAR LICEAL MIHAI VITEAZUL ALBA IULIA Matematica-informatica 8.20 100.0%
AB COLEGIUL NATIONAL DAVID PRODAN CUGIR 7.07 74.5%
AB COLEGIUL NATIONAL DAVID PRODAN CUGIR Filologie 7.86 92.3%
AB COLEGIUL NATIONAL DAVID PRODAN CUGIR Matematica-Informatica 8.07 93.3%
AB COLEGIUL NATIONAL DAVID PRODAN CUGIR Stiinte ale Naturii 5.63 36.7%
AB COLEGIUL NATIONAL DAVID PRODAN CUGIR Stiinte Sociale 6.77 82.6%
In lipsa unor scule care sa automatizeze actiunea (am doar excel aici) eu declar forfait.
@Dr. A: adică ceva de genul ăsta?
SELECT
judet, scoala, specializare,
SUM(CASE rezultat_final WHEN 'Reuşit' THEN 1.0 ELSE 0.0 END) / COUNT(*) AS rata_de_promovare,
AVG(((CASE rezultat_final WHEN 'Reuşit' THEN d_romana_scris_nota ELSE NULL END) +
(CASE rezultat_final WHEN 'Reuşit' THEN d_profil_scris_nota ELSE NULL END) +
(CASE rezultat_final WHEN 'Reuşit' THEN d_alegere_scris_nota ELSE NULL END)) / 3) AS medie
FROM rezultate2010
GROUP BY judet, scoala, specializare
ORDER BY rata_de_promovare DESC, medie DESC, judet, scoala, specializare;
SJ COLEGIUL NATIONAL "SILVANIA" ZALAU Filologie 1 9.74388888888889
IS COLEGIUL NATIONAL "EMIL RACOVITA" IASI Filologie 1 9.64642857142857
DJ COLEGIUL NATIONAL "FRATII BUZESTI" CRAIOVA Stiinte ale Naturii 1 9.55166666666667
DJ COLEGIUL NATIONAL "CAROL I" CRAIOVA Stiinte ale Naturii 1 9.53697916666667
DJ COLEGIUL NATIONAL "FRATII BUZESTI" CRAIOVA Filologie 1 9.53548387096774
...
PH LICEUL TEORETIC "BRANCOVEANU VODA" URLATI Matematica-Informatica 0.273809523809524 7.78115942028986
TR GRUPUL SCOLAR AGRICOL ROSIORII DE VEDE Tehnician ecolog si protectia calitatii mediului 0.272727272727273 7.10555555555556
...
Trăiască SQLite!
@cristian
vad ca nu s-au schimbat multe in baze de date in ultimii 15 ani (ultima oara cand am folosit asa ceva era fox pro).
Daca ai reusit sa scoti rezultatele ai putea sa le si publici.
Coroborat cu informatii despre seriozitatea supravegherii (a fost camere video sau nu) s-ar putea obtine niste topuri interesante.
@Dr A Pai se poate face relativ usor. Daca ai un pic de rabdare, o sa scriu azi scriptul in R si scot rezultatele de care zici.
In lista de rezultate eu n-am vazut centrul - doar daca zici ca e sub "unitatea de invatamant", dar eu am zis ca asta e scoala elevului, nu centrul de corectare. Gresesc?
@Mircea Popescu Cam este, da, dar ar trebui coroborat cu date despre supraveghere (si inca n-am ajuns sa caut asa ceva - daca stie careva pe unde sunt, ar fi util).
http://bacalaureat.edu.ro/2011/rapoarte/CJ/unitati_arondate/index.html cred ca asta e genul de pagina la care se ajunge
@Dr A. Merci pentru link, o sa iau datele si de acolo (vad ca-s consecventi in ce priveste formatul, dar ma ajuta Cristian cu astea). Am pus si topul.
@Dr.A: le-am extras și pe alea.
Mie nu mi-a plăcut Fox Pro niciodată. În liceu foloseam pe cât posibil SQL în locul instrucțiunilor sale native, asta spre disperarea profesoarei (și ce profesoară!!!). Totuși în ultimii ani am ajuns să-l apreciez pentru ce-a fost la vremea lui. În fond permitea crearea cu ușurință a unor aplicații care să lucreze cu baze de date și care să fie și prietenoase cu utilizatorul.
Eu aș publica ce am, dar nu prea am unde. Între timp eu aș zice să testezi SQLite (vezi și „website-ul” meu). Apropo vezi că rezultatele alea erau pentru 2010.
$ sqlite3 /tmp/import.sqlite
sqlite> CREATE TABLE rezultate(d_profil_scris_nota_contestatie varchar(70), d_romana_scris_nota varchar(70), d_romana_competente varchar(70), forma_invatamant varchar(70), d_limba_materna_competente varchar(70), d_profil_scris_nota_finala varchar(70), scoala varchar(70), d_profil_scris_nume varchar(70), d_competente_digitale varchar(70), judet varchar(70), d_profil_scris_nota varchar(70), d_alegere_scris_nota varchar(70), nume varchar(70), d_limba_materna_nume varchar(70), specializare varchar(70), d_alegere_scris_nume varchar(70), d_romana_scris_nota_finala varchar(70), d_alegere_nota_scris_contestatie varchar(70), d_alegere_nota_scris_finala varchar(70), d_limba_moderna_nota varchar(70), d_limba_materna_scris_nota_contestatie varchar(70), d_limba_materna_scris_nota_finala varchar(70), promotie_anterioara varchar(70), rezultat_final varchar(70), d_limba_materna_scris_nota varchar(70), d_romana_scris_nota_contestatie varchar(70), d_limba_moderna_nume varchar(70));
sqlite> .separator ;
sqlite> .import items2011_python_all.csv rezultate
sqlite> DELETE FROM rezultate WHERE d_profil_scris_nota_contestatie='d_profil_scris_nota_contestatie';
sqlite> UPDATE rezultate SET scoala=replace(trim(scoala, '"'), '""', '"');
sqlite> .headers on
sqlite> select * from rezultate limit 1;d_profil_scris_nota_contestatie;d_romana_scris_nota;d_romana_competente;forma_invatamant;d_limba_materna_competente;d_profil_scris_nota_finala;scoala;d_profil_scris_nume;d_competente_digitale;judet;d_profil_scris_nota;d_alegere_scris_nota;nume;d_limba_materna_nume;specializare;d_alegere_scris_nume;d_romana_scris_nota_finala;d_alegere_nota_scris_contestatie;d_alegere_nota_scris_finala;d_limba_moderna_nota;d_limba_materna_scris_nota_contestatie;d_limba_materna_scris_nota_finala;promotie_anterioara;rezultat_final;d_limba_materna_scris_nota;d_romana_scris_nota_contestatie;d_limba_moderna_nume
;3.1;Utilizator avansat;Frecvenţă redusă;;1.35;COLEGIUL TEHNIC "TRANSILVANIA" BAIA MARE;Matematica T2;Utilizator nivel mediu;MM;1.35;3.8;ZVUNCA S. RODICA;;Tehnician in turism;Geografie;3.1;;3.8;A2---A2-A2;;;NU;Respins;;;Limba franceza
Pentru orice eventualitate: varchar(70) -> varchar(100). Pentru 2010 există un câmp de 85 de caractere.
@Cristian
Eu am "studiat" fox pro prin 92-94. Sub DOS. Si nu m-am mai "atins" de atunci nici de el nici de altceva (db gen).
Păi ăla vechi de sub DOS îl și lăudam. Și ăla putea crea meniuri, formulare și alte minuni din câte știu eu. În afară de clasa a XII-a nici eu n-am mai avut vreo tangență cu el.
Vezi că mă acuză Diana că te transform din Dr.A în DBA (DataBase Administrator). Oricum cu mai mult decât am făcut deja, nu mai am cu ce să te ajut. Am cam uitat SQL și mi-a luat o groază până am scris interogarea de mai devreme. Noroc cu documentația de pe diverse site-uri.
oltenii pe ultimul loc la furat? :))
Explicabil: oltean prost si rata inecata nu o sa vezi niciodata. Aia prinsi, probabil erau ardeleni adusi de cine stie ce vanturi prin Mehedinti.
@morom3t3 Zic ca daca e asa, se va vedea la analiza statistica mai amanuntita. Dar pana cand n-am dovezi, eu nu zic nimanui ca ar fi hot. Chit ca unii or lua-o drept compliment.
[...] sugestia unui comentator, am calculat topul liceelor la Bacalaureat 2011, pe baza ratei de promovabilitate și a notei [...]
[...] le-am si publicat aici. Dupa care s-a apucat sa calculeze diverse chestiuni de interes precum topul hotilor prinsi sau topul liceelor (dintr-o perspectiva zic eu mai degraba institutionala). Chestie care-a dus la [...]
[...] Un top rusinica(desi prinsul hotilor e mai degraba o mandrie): Topul hoților (prinși) la Bacalaureat [...]
[...] priveşte cazul României: analize foarte interesante au fost efectuate de Diana Coman (aici, aici şi aici), precum şi de colegul meu de Ad-Astra Lucian Ancu. Mã mãrginesc sã vi le recomand cu [...]
[...] analiză a fraudei depistate anul acesta în fiecare unitate de învățământ (Diana [...]