Pogledaj jedan post
Old 27.06.2017., 11:44   #25
Quote:
Zoran Oštrić kaže: Pogledaj post
Slažem se, rezulatz je jasan. Vdio sam ovo jadovanje već prije, i solidno je pokazalo, da je popus puno pouzdaniji, nego što bi to apriori moglo procijeniti.

za mnoge rome se zaista ne znaju podaci. Jednostavno, bilo ih je u nekom naselju nekoliko stotina, onda su došle ustaške jedinice i sve ih odvele, to je zabilježeno, a nitko se od njihnikad nije vratio.

Ima deset slučajeva, kod kojih je očito tipfelerom unesena pogrešna godina rođenja.

Više osoba istog imena i prezimena iz istog mjesta nije nimalo neobično. Ranije sam u diskusiji na temi o Grupi logora Jasenovac spomenuo primjer, da danas u mjestašcu BLIZNA DONJA u telefonskom imeniku postoje četiri muškarca koji se zovu OŠTRIĆ ANTE, a pritom čak trojica imaju i istu adresu, vrlo neinventivnu: "Oštrići b.b.".

U diskusije o programskim alatima ne ulazim, ne znam o tome ništa.
Ono u što treba ući je nestručnost i neodgovornost onih koji rade jedan takav popis.

Jer sam pokretač teme je objasnio da se ispravnim postavkama u bazi unaprijed mogu spriječiti tipfeleri prilikom unošenja. Pojedini podaci se moraju unositi u odgovarajuća polja koja ne dozvoljavaju unos slova pod polja gdje dolaze brojevi. Veze između pojedinih polja (tipova podataka) se također moraju ispravno postaviti.

Da je baza podataka napravljena kako treba onda se analizom takvih podataka može puno toga doznati i zaključiti.

Što bi državni statistički ured napravio da su mu takve baze podataka na osnovu kojih radi svoja izvješća?

Ono što je najgore što se na osnovu tako loše napravljene baze podataka rade razne znanstvene publikacije koje onda fabriciraju netočne podatke i donose krive zaključke.

Ovo samo pokazuje da odgovorni za spomen područje nisu kompetentni za posao koji rade. Žrtve Jasenovca nisu zaslužile da se o njima brinu ovako nestručne i aljkave osobe koje rad taj posao.

I nije samo to pitanje na ovom primjeru, ista je stvar da se konačno napravi baza podataka sa žrtvama WWII na našim područjima ili rata 91'-95'.

Ako je baza napravljena na stručni način, samom postavkom baze i polja za unos se mogu izbjeći tipfeleri, dvostruki ili trostruki upisi. A ispravnom vezom svih podataka koji se unose u bazu mogu se vršiti znanstvene analize koji bi pokazale neke stvari kojih nismo ni svjesni jer iz postojećih podataka koje imamo sada na puno mjesta ne može se izvući ono što se može iz jedne baze koja je cjelovita i kvalitetno struktuirana sa ispravnim vezama između unešenih podataka.

Nisam uopće stručnjak za baze podataka, ali toliko znanja imam koja sam stekao na nastavi iz EOP i matemataike odnosno statistike u toku mojeg školovanja na fakultetu tehničke struke a i kasnije u svojem radu u struci.

Tako da stručnjak koji se samo bavi tim područjem vjerojatno bi to daleko bolje elaborirao kao što je to ovdje na temi u uvodu izneseno.

Ako se baza podataka postavi stručno i kvalitetno, kontrola unosa podataka može se sama po sebi odraditi dobrim djelom samim struktuiranjem baze i ograničavanjem nekih veličina kod unosa. A statističke kontrole pojedinih nizova podataka mogu također ukazati na greške kod unosa koje se nisu mogle spriječiti prvim mjerama.

Ovako kako je pokretač teme opisao da je baza napravljena je problem da sve što je krivo unijeto i dalje će ostati krivo kao podatak.

Ispravljati nešto što je koncepcijski od početka loše napravljeno je veći posao nego sve to napraviti ispočetka sa pravilno postavljenim parametrima za konfiguraciju baze podataka. Manje vremena će treba da se to sve ponovo napravi iz početka nego među postojećim unešenim podacima tražiti greške i tipfelere.

Kvalitetna baza podataka pruža znanstvenicima mogućnosti za kvalitetan rad i analizu. a postojeći načini kako se to do sada radilo zahtijevaju puno rada da bi se prikupio mali broj informacija koje su onda teško provjerljive od ostalih znanstvenika.

I zato se onda događa da jedan odradi posao kako zna i umije, a onda se ostali nadovezuju na njegovo istraživanje, dopunjuju ga, ispravljau i sl. ali dali je prvi koji je u nizu napravio kvalitetnu analizu nije nitko provjerio, već se samo citiraju jedan drugoga, a pogreške se u tome cijelom ciklusu mogu samo gomilati.


Jedan banalan primjer kako to ide je slijedeći.

Ljudevit Gaj se vodi u povijesnim knjigama kao osoba od značaja i za njega postoji životopis. U tom životopisu se vrte neki faktografski podaci. Prvi u nizu koji je pisao te podatke je naveo neke konkretne činjenice. Svi iza u nizu su citirali tog prvog autora i nitko više nije provjeravao stvarne fakte.

Onda se pojavio amater istraživač koji je ponovo prokopao podatke iz arhiva i ustanovio da neke činjenice o pohađanju škole nisu točne jer je dotični završio sasvim druge škole i da postoje dokumenti koji to potvrđuju, školski dnevnik i svjedodžba.

Sada ovu logiku primjenite na podatke s popisa i doći ćete do zaključka da je vjerojatno samo prvi u nizu baratao sa stvarnim podacima i dokumentima, a svi ostali su samo citirali i prepisivali uz dodavanje novih podataka ili dopunu starih.

Ono što današnje baze podataka omogućuju je da se uz stvarno navedeni podatak u bazi veže i slika izvornog dokumenta ili dokumenata iz kojih se može provjeriti unešeni podatak ili podaci. A ako ne slika onda barem link na takav dokument, i da se ti dokumenti mogu također nalaziti u bazi koja se može pretraživati i analizirati što može također pokazati dali su ti dokumenti vjerodostojni ili ne.

Pokretač ove teme o tome nije prozborio niti riječi, ali evo ovdje mu skrećem pažnju i na tu mogućnost.

Inače zahvaljujem pokretaču teme na trudu jer za tako nešto treba imati znanja a i volje. Ljudi ovdje na forumu vole raspravljati i pozivati se na neke podatke, a da se nikada nisu zapitali koliko su ti podaci koji se iznose i na koje se pozivvaju pouzdani i realni.

Postoje metode i načini kojima se može utvrditi pouzdanost nekog niza podataka, samo treba imati kvalitetno struktuiranu bazu nad kojom se te metode mogu primjeniti. To je danas znanstveni pristup, sve ostalo je nestručnost, nekompetencija i neodgovornnost.
krekre is offline  
Odgovori s citatom