Pa #net i php nisu baš prvi izbor za takve stvari. Ja bih osobno išao na pythoon za takve stvari što se tiče broja biblioteka i slično. Python nltk ima obe te metrike i još trilijun toga, i općenito je puno jednostavniji za rad sa stringom i tekstom nego c/java etc..