UTF-8 odpowiedniki polskich liter

Witam
Dodaje tutaj prosty pythonowy skrypt który zamienia polskie znaki (ąćśżź itp) na ich angielskie odpowiedniki (acszz itp) znaki są zamieniane z utf-8 do standardowych. Według tablicy Kodowania polskich znaków. Z tego co wiem, to nie ma wbudowanej funkcji do takiej operacji. encode(‘ascii’,’ignore’) nie działa do końca tak jak powinno. Ja rozwiązałem to tak:

def odkoduj(tekst):
    polskie = {"\xc4\x84":"A","\xc4\x86":"C",
"\xc4\x98":"E","\xc5\x81":"L","\xc5\x83":"N","\xc3\x93":"O",
"\xc5\x9a":"S","\xc5\xb9":"Z","\xc5\xbb":"Z","\xc4\x85":"a",
"\xc4\x87":"c","\xc4\x99":"e","\xc5\x82":"l","\xc5\x84":"n",
"\xc3\xB3":"o","\xc5\x9b":"s","\xc5\xba":"z","\xc5\xbc":"z"}
    for x in polskie.keys():
        tekst = string.replace(tekst,x,polskie[x])
    return tekst
About these ads

4 thoughts on “UTF-8 odpowiedniki polskich liter

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s