Pozdrav,
Prvo jezik nije bitan, u svima je jednostavno lako to napravit
Dakle imam teksutalni file sa puno redova i puno knjiga u njemu, format ide ovako, i uglavnom cijeli file prati taj format:
Code:
<h>Ormar 1</h>
Težak Stjepko, Babić Stjepan : ”Gramatika hrvatskoga jezika - priručnik za osnovno jezično obrazovanje” , Školska knjiga, Zagreb, 1992.
Vončina Josip : “Jezična baština”, Književni krug, Split, 1988.
.
.
.
<h>Ormar 2</h>
Kvesić: “ Uvod u Peru K”, Zagreb, 1975.
Remarque: “Noć u Lisabonu”, 1966.
“Suvremena hrvatska novela 1 ”, Zora, Zagreb, 1971.
“Suvremena hrvatska novela 2 ”
Vojnović: “Dubrovačka trilogija”
Puškin: “Kapetanova kći”
Imam super izraz ako bi sve pratilo strukturu
Code:
([^,].*)\”(.*)\”\,([^,]*)\,([^,]*)\,([^,][[:digit:]]*).$
E sad di je problem, kao sto na primjerima u Ormaru 2, knjige(neke) prestaju pratiti standardnu strukturu, amo reć da nema ništa iza naslova, super samo napravim konstruktor sa "nepoznato" ili tako nešto, ali je problem šta neke kao "Kvesić: “ Uvod u Peru K”, Zagreb, 1975." imaju, na mjestu di je izdavač ime grada
dakle za dohvatit ime autora nema problema vise manje:
(ako ih je više podjeljeno zarezom, isto mogu iskombinirat, nije veliki problem)
Za dohvatiti naslov laganini
Za dohvatit izdavača i grad
i onda to kasnije podjelim na dva, mozda može lakše al nije toliki problem
Za dohvatit godinu