View Single Post
Staro 26.12.2015., 17:14   #1
OuttaControl
Premium
Moj komp
 
OuttaControl's Avatar
 
Datum registracije: Feb 2007
Lokacija: Dalmacija
Postovi: 5,779
C#/C++/PHP, regex, string u objekt

Pozdrav,
Prvo jezik nije bitan, u svima je jednostavno lako to napravit
Dakle imam teksutalni file sa puno redova i puno knjiga u njemu, format ide ovako, i uglavnom cijeli file prati taj format:
Code:
<h>Ormar 1</h>
Težak Stjepko, Babić Stjepan :  ”Gramatika hrvatskoga jezika - priručnik za osnovno jezično obrazovanje” , Školska knjiga, Zagreb, 1992.
Vončina Josip : “Jezična baština”, Književni  krug, Split, 1988.
.
.
.
<h>Ormar 2</h>
Kvesić: “ Uvod u Peru K”, Zagreb, 1975.
Remarque: “Noć u Lisabonu”, 1966.
“Suvremena hrvatska novela 1 ”, Zora, Zagreb, 1971.
“Suvremena hrvatska novela 2 ”
Vojnović: “Dubrovačka trilogija”
Puškin: “Kapetanova kći”
Imam super izraz ako bi sve pratilo strukturu
Code:
([^,].*)\”(.*)\”\,([^,]*)\,([^,]*)\,([^,][[:digit:]]*).$
E sad di je problem, kao sto na primjerima u Ormaru 2, knjige(neke) prestaju pratiti standardnu strukturu, amo reć da nema ništa iza naslova, super samo napravim konstruktor sa "nepoznato" ili tako nešto, ali je problem šta neke kao "Kvesić: “ Uvod u Peru K”, Zagreb, 1975." imaju, na mjestu di je izdavač ime grada

dakle za dohvatit ime autora nema problema vise manje:
Code:
^.*:
(ako ih je više podjeljeno zarezom, isto mogu iskombinirat, nije veliki problem)
Za dohvatiti naslov laganini
Code:
\”.*\”
Za dohvatit izdavača i grad
Code:
\”\,.*\,
i onda to kasnije podjelim na dva, mozda može lakše al nije toliki problem
Za dohvatit godinu
Code:
[[:digit:]]+.$

Zadnje izmijenjeno od: OuttaControl. 26.12.2015. u 17:50.
OuttaControl je offline   Reply With Quote