Cześć,
wiem, że nie ma 100% metody na rozpoznanie jak zakodowane są znaki w pliku (przynajmniej w plikach bez BOM).
Chciałem się więc zapytać jak wy sobie z tym radzicie? Czy korzystacie z jakiś bibliotek do rozpoznawania kodowania? Możecie coś polecić? Głównie zależy mi na rozpoznawaniu polskich formatów takich jak windows-1250, mazovia, UTF-8 itd. (czyli tam, gdzie występują polskie znaki).
W przypadku kodowania znaków na jednym bajcie rozpoznanie wydaje się całkiem proste - wystarczy zliczać polskie znaki i odpowiednio je zliczać - wygrywa ten format, który ma najwięcej punktów. Gorzej z kodowaniem na wielu bajtach takich jak UTF-8.