|
26.12.2015., 17:14 | #1 |
Premium
Datum registracije: Feb 2007
Lokacija: Dalmacija
Postovi: 5,204
|
C#/C++/PHP, regex, string u objekt
Pozdrav, Prvo jezik nije bitan, u svima je jednostavno lako to napravit Dakle imam teksutalni file sa puno redova i puno knjiga u njemu, format ide ovako, i uglavnom cijeli file prati taj format: Code:
<h>Ormar 1</h> Težak Stjepko, Babić Stjepan : ”Gramatika hrvatskoga jezika - priručnik za osnovno jezično obrazovanje” , Školska knjiga, Zagreb, 1992. Vončina Josip : “Jezična baština”, Književni krug, Split, 1988. . . . <h>Ormar 2</h> Kvesić: “ Uvod u Peru K”, Zagreb, 1975. Remarque: “Noć u Lisabonu”, 1966. “Suvremena hrvatska novela 1 ”, Zora, Zagreb, 1971. “Suvremena hrvatska novela 2 ” Vojnović: “Dubrovačka trilogija” Puškin: “Kapetanova kći” Code:
([^,].*)\”(.*)\”\,([^,]*)\,([^,]*)\,([^,][[:digit:]]*).$ dakle za dohvatit ime autora nema problema vise manje: Code:
^.*: Za dohvatiti naslov laganini Code:
\”.*\” Code:
\”\,.*\, Za dohvatit godinu Code:
[[:digit:]]+.$ Zadnje izmijenjeno od: OuttaControl. 26.12.2015. u 17:50. |
27.12.2015., 20:40 | #2 |
only fool, not a horse
Datum registracije: Apr 2008
Lokacija: near zgb
Postovi: 1,276
|
http://ex-parrot.com/~pdw/Mail-RFC822-Address.html Lol A sad što je točno problem? Ako se može dogoditi da fali ili grad ili izdavač, teško ćeš rješit, ako znaš da je onaj koji nedostaje izdavač nema problema. S druge strane, ako se snalaziš u više programskih jezika, zašto pobogu išta pokušavaš napravit sa tim jednostavnim super preglednim i jasnim regularnim izrazom? |
|
|
Oglas
|
|
28.12.2015., 20:46 | #3 |
Premium
Datum registracije: Feb 2007
Lokacija: Dalmacija
Postovi: 5,204
|
Odlučio sam to rješit manualno, iako mogu uspoređivat sa listom imena gradova, al nema smisla, pošto možda 50tak unosa ima takav oblik, pa ih se može i ručno bez velikog problema A nezz, meni su nekako dragi regularni izrazi , i lako ga prebacim u bilokoji drugi jezik jer svi u stdlib imaju regex funkciju. Al nije problem ni napisat nesto sa separatorima. Ali sam primjetio jos jedan problem, ukoliko knjiga ispod ima slicno ime i istog izdavača: “Suvremena hrvatska novela 1 ”, Zora, Zagreb, 1971. “Suvremena hrvatska novela 2 ” A ne piše na drugom primjerku, trebao bih provjeriti koliko je jedan string sličan drugom stringu, našao sam neki "Levenshtein Distance","Bitap"... algoritam, al oni nisu default ni u .NET ni u PHP, pa ako postoji koja metodica u nekom jeziku koja mi može vratit numeričku vrijednost sličnosti, bilo bi super Još radim na istraživanju pa ću jedan dan-dva kad uvatim vrimena sve to istipkat |
28.12.2015., 23:23 | #4 |
only fool, not a horse
Datum registracije: Apr 2008
Lokacija: near zgb
Postovi: 1,276
|
Pa #net i php nisu baš prvi izbor za takve stvari. Ja bih osobno išao na pythoon za takve stvari što se tiče broja biblioteka i slično. Python nltk ima obe te metrike i još trilijun toga, i općenito je puno jednostavniji za rad sa stringom i tekstom nego c/java etc.. |
29.12.2015., 03:59 | #5 |
Premium
Datum registracije: Feb 2007
Lokacija: Dalmacija
Postovi: 5,204
|
A bas u pythonu nisam nikad radio :/, a s obzirom da kasnije moram migrirat podatke u sql i napravit koliko toliko pristupačnu aplikaciju, draze mi je radit u nekom jeziku kojeg znam, iako pretpostavljam da su principi pythona slični c-u, al nema veze usporedjivat cu char po char, old skul hvalq na savjetima |
29.12.2015., 09:08 | #6 |
only fool, not a horse
Datum registracije: Apr 2008
Lokacija: near zgb
Postovi: 1,276
|
Sto se tice pythona i mysql-a tu isto nema problema, ali razumijem da radije ideš na poznato. Nebih rekao da je sličan c-u jer je skriptni jezik, puno jednostavniji od c-a, meni je trebalo tjedan dva da postanem produktivan u pythonu s c like podlogom. |
|
|
Oglas
|
|
|
|