Witam
Dodaje tutaj prosty pythonowy skrypt który zamienia polskie znaki (ąćśżź itp) na ich angielskie odpowiedniki (acszz itp) znaki są zamieniane z utf-8 do standardowych. Według tablicy Kodowania polskich znaków. Z tego co wiem, to nie ma wbudowanej funkcji do takiej operacji. encode(‘ascii’,’ignore’) nie działa do końca tak jak powinno. Ja rozwiązałem to tak:
def odkoduj(tekst): polskie = {"\xc4\x84":"A","\xc4\x86":"C", "\xc4\x98":"E","\xc5\x81":"L","\xc5\x83":"N","\xc3\x93":"O", "\xc5\x9a":"S","\xc5\xb9":"Z","\xc5\xbb":"Z","\xc4\x85":"a", "\xc4\x87":"c","\xc4\x99":"e","\xc5\x82":"l","\xc5\x84":"n", "\xc3\xB3":"o","\xc5\x9b":"s","\xc5\xba":"z","\xc5\xbc":"z"} for x in polskie.keys(): tekst = string.replace(tekst,x,polskie[x]) return tekst
Nice work. Keep it going man.
>>> unicodedata.normalize(“NFKD”, u”kópa”).encode(‘ascii’, ‘ignore’)
‘kopa’
dzięki, najlepsze rozwiązanie po 4 latach;)
This solution does not for polish letter “ł”