![]() |
C#/C++/PHP, regex, string u objekt
Pozdrav,
Prvo jezik nije bitan, u svima je jednostavno lako to napravit Dakle imam teksutalni file sa puno redova i puno knjiga u njemu, format ide ovako, i uglavnom cijeli file prati taj format: Code:
Code:
([^,].*)\”(.*)\”\,([^,]*)\,([^,]*)\,([^,][[:digit:]]*).$ dakle za dohvatit ime autora nema problema vise manje: Code:
^.*: Za dohvatiti naslov laganini Code:
\”.*\” Code:
\”\,.*\, Za dohvatit godinu Code:
[[:digit:]]+.$ |
http://ex-parrot.com/~pdw/Mail-RFC822-Address.html
Lol A sad što je točno problem? Ako se može dogoditi da fali ili grad ili izdavač, teško ćeš rješit, ako znaš da je onaj koji nedostaje izdavač nema problema. S druge strane, ako se snalaziš u više programskih jezika, zašto pobogu išta pokušavaš napravit sa tim jednostavnim super preglednim i jasnim regularnim izrazom? |
Odlučio sam to rješit manualno, iako mogu uspoređivat sa listom imena gradova, al nema smisla, pošto možda 50tak unosa ima takav oblik, pa ih se može i ručno bez velikog problema
A nezz, meni su nekako dragi regularni izrazi :D, i lako ga prebacim u bilokoji drugi jezik jer svi u stdlib imaju regex funkciju. Al nije problem ni napisat nesto sa separatorima. Ali sam primjetio jos jedan problem, ukoliko knjiga ispod ima slicno ime i istog izdavača: “Suvremena hrvatska novela 1 ”, Zora, Zagreb, 1971. “Suvremena hrvatska novela 2 ” A ne piše na drugom primjerku, trebao bih provjeriti koliko je jedan string sličan drugom stringu, našao sam neki "Levenshtein Distance","Bitap"... algoritam, al oni nisu default ni u .NET ni u PHP, pa ako postoji koja metodica u nekom jeziku koja mi može vratit numeričku vrijednost sličnosti, bilo bi super :) Još radim na istraživanju pa ću jedan dan-dva kad uvatim vrimena sve to istipkat |
Pa #net i php nisu baš prvi izbor za takve stvari. Ja bih osobno išao na pythoon za takve stvari što se tiče broja biblioteka i slično. Python nltk ima obe te metrike i još trilijun toga, i općenito je puno jednostavniji za rad sa stringom i tekstom nego c/java etc..
|
A bas u pythonu nisam nikad radio :/, a s obzirom da kasnije moram migrirat podatke u sql i napravit koliko toliko pristupačnu aplikaciju, draze mi je radit u nekom jeziku kojeg znam, iako pretpostavljam da su principi pythona slični c-u, al nema veze usporedjivat cu char po char, old skul :D hvalq na savjetima :)
|
Sto se tice pythona i mysql-a tu isto nema problema, ali razumijem da radije ideš na poznato. Nebih rekao da je sličan c-u jer je skriptni jezik, puno jednostavniji od c-a, meni je trebalo tjedan dva da postanem produktivan u pythonu s c like podlogom.
|
Sva vremena su GMT +2. Sada je 08:30. |
Powered by vBulletin®
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
© 1999-2024 PC Ekspert - Sva prava pridržana ISSN 1334-2940
Ad Management by RedTyger