UTF-8 odpowiedniki polskich liter

Witam
Dodaje tutaj prosty pythonowy skrypt który zamienia polskie znaki (ąćśżź itp) na ich angielskie odpowiedniki (acszz itp) znaki są zamieniane z utf-8 do standardowych. Według tablicy Kodowania polskich znaków. Z tego co wiem, to nie ma wbudowanej funkcji do takiej operacji. encode(‘ascii’,’ignore’) nie działa do końca tak jak powinno. Ja rozwiązałem to tak:

def odkoduj(tekst):
    polskie = {"\xc4\x84":"A","\xc4\x86":"C",
"\xc4\x98":"E","\xc5\x81":"L","\xc5\x83":"N","\xc3\x93":"O",
"\xc5\x9a":"S","\xc5\xb9":"Z","\xc5\xbb":"Z","\xc4\x85":"a",
"\xc4\x87":"c","\xc4\x99":"e","\xc5\x82":"l","\xc5\x84":"n",
"\xc3\xB3":"o","\xc5\x9b":"s","\xc5\xba":"z","\xc5\xbc":"z"}
    for x in polskie.keys():
        tekst = string.replace(tekst,x,polskie[x])
    return tekst

4 thoughts on “UTF-8 odpowiedniki polskich liter”

Nice work. Keep it going man.

>>> unicodedata.normalize(“NFKD”, u”kópa”).encode(‘ascii’, ‘ignore’)
‘kopa’

tetek says:

April 25, 2013 at 13:11

dzięki, najlepsze rozwiązanie po 4 latach;)

Reply
Karol Konaszyński says:

July 18, 2013 at 22:19

This solution does not for polish letter “ł”

Reply

masteranza says:

October 17, 2009 at 17:52

Nice work. Keep it going man.

sprae says:

April 25, 2013 at 04:25

>>> unicodedata.normalize(“NFKD”, u”kópa”).encode(‘ascii’, ‘ignore’)
‘kopa’

- tetek says:
  
  April 25, 2013 at 13:11
  
  dzięki, najlepsze rozwiązanie po 4 latach;)
  
- Karol Konaszyński says:
  
  July 18, 2013 at 22:19
  
  This solution does not for polish letter “ł”

up the ladder of abstraction

UTF-8 odpowiedniki polskich liter

4 thoughts on “UTF-8 odpowiedniki polskich liter”

Leave a reply to masteranza Cancel reply

Share this:

Related

4 thoughts on “UTF-8 odpowiedniki polskich liter”

Leave a reply to masteranza Cancel reply