Tekenreeks converteren naar Unicode in Python

De programmeertaal Python heeft veel verschillende codering regelingen van tekenreeksen. Tekst moet worden gecodeerd, omdat computers gegevens als reeksen van 1s en 0s opgeslagen. Een coderingsschema koppelt een reeks van bits aan een letter, getal of symbool. De computerindustrie heeft een standaard coderingsschema Unicode, Python ondersteunding genoemd vormen aangenomen. U kunt profiteren van deze Unicode-ondersteuning door codering van uw snaren met behulp van een enkel commando ingebouwd in Python.

Instructies

1

Open de IDLE tekst-editor die meegeleverd met Python wordt. Het is in uw dossiers van het programma (of toepassingen voor de Macintosh), in de directory van de Python. Een lege broncode bestand wordt geopend.

2

Verklaren van een tekenreeks en sommige tekst opgeslagen in het. De standaardcodering regeling voor tekenreeksen is normaal ASCII. Als u wilt een ASCII-tekenreeks te declareren, door het volgende te schrijven:

Str = "tekst"

3

De tekenreeks met behulp van Unicode UTF-8 coderen. Dit kan worden bereikt met behulp van de codeer functie als volgt:

Str.Encode('utf-8')