Van XML naar ASCII-conversie

Een belangrijkste voordeel van XML is dat het u toestaat om tag gegevens en output (of transformeren) element inhoud in om het even wie van een aantal formaten met inbegrip van tekst zonder opmaak (ASCII). Hoewel dit kan worden gedaan via programmacode, is XSL-transformatie ontworpen specifiek voor dit doel. De belangrijkste uitdagingen in het creëren van een vlekkeloze conversie zijn tweeledig: verkrijgen van de juiste gegevens uit het XML-gelabeld document; en behandeling van speciale tekens.

XML-Schema

XML is door definitie gestructureerde informatie. Veel XML-documenten definiëren een formele schema dat beschrijft hoe uw XML-elementen kunnen worden gebruikt. In feite, het schema gedraagt zich als een stappenplan voor uw XML-document. Dus is de eerste stap om te analyseren uw schema en uw elementen toewijzen aan hun tegenhangers ASCII. Dit kan een eenvoudige zaak van trekken gegevens rechtstreeks uit de inhoud van een element. Worden zich ervan bewust, echter dat een elementkenmerken kunnen ook kritische gegevens bevatten, zoals een database record aantal die moet worden opgenomen in de conversie.

Impliciete Schema

Als geen formele schema beschikbaar is, wordt de structuur van het XML-document nog steeds geïmpliceerd. Dit maakt het mogelijk om te reconstrueren van het schema. Een goede strategie is in dit geval te onderzoeken van de elementen in uw document exemplaar en uitschrijven van een schema dat elke instantie in uw document behandelt.

Tekensets

Er zijn veel tekensets ter dekking van de speciale tekens die worden gebruikt in verschillende talen over de hele wereld. De ASCII-tekenset specifiek verwijzingen tekst voor de Engelse taal. Volgens Richard Ishida van het World Wide Web Consortium bevat"de Unicode-tekenset tekens voor de meeste van de levende talen en scripts in de wereld." (in http://www.w3.org/International/getting-started/characters.) Om te voorkomen dat potentiële problemen, is een goede gewoonte met de Unicode UTF-8-tekenset die bij het maken van uw conversies.

Entiteiten

XML definieert een kleine set van karakters, genaamd voorgedefinieerde entiteiten. Deze entiteiten zijn de tekens voor het en-teken en de puntkomma, die hebben specifieke toepassingen in XML en derhalve beperkt. Om rond dit, moet u deze tekens ontsnappen. Bijvoorbeeld, moet u "& amp;" voor het en-teken in XML. Zich bewust zijn van deze en andere speciale ontsnapte tekens in uw gegevens.