Tipul, crearea și structura unui fișier xml

XML este o extensie de fișier Extensible Markup Language utilizată pentru a crea informații generale formate și partajarea atât a formatului, cât și a datelor pe World Wide Web, pe intraneturi și în alte locuri, utilizând text ASCII standard. Acesta este un format universal pentru date și documente structurate cu o extensie XML. Ca și HTML, folosește etichete de cuvinte delimitate de caractere ">" и "<" pentru structurarea datelor într-un document. Dar ce intră în structura unui fișier XML?

O scurtă introducere în limbă

O scurtă introducere în limbajul XML

EXtensible Markup Language a început să fie dezvoltat în septembrie 1996, cu sprijinul W3C, cu scopul de a crea un instrument optimizat pentru web. structura unui fișier XML combină simplitatea HTML cu puterea de expresie a predecesorului său, SGML. Companii precum Microsoft, IBM, Sun Microsystems, Novell și Hewlett-Packard au contribuit la dezvoltarea sa. Versiunea 1.0 a fost ratificat de W3C la conferința SGML/XML care a avut loc la Washington, DC în decembrie 1997. În câțiva ani, XML a devenit limbajul care a avut cel mai mare impact asupra dezvoltării de aplicații pentru publicarea de conținut pe Internet.

Principalele caracteristici ale limbii sunt

Revizuirea documentelor are următoarele obiective:

  1. Distingerea conținutului și structurii unui fișier XML de pe hârtie sau de pe ecran.
  2. Clarificați structura și conținutul informativ.
  3. Crearea de documente care pot fi schimbate și prelucrate cu ușurință în sisteme informatice eterogene.
  4. Crearea de formate în care etichetele sunt stabilite în textul documentelor pentru a distinge părți sau elemente ale unei structuri de fișiere XML.

Principalele caracteristici ale limbii sunt:

  1. Posibilitatea de etichetare descriptivă, cu un set deschis de etichete. În HTML și XML, etichetele sunt intercalate în documente. Principala diferență între unul și celălalt este funcția acestor mărci.
  2. Funcția de diferențiere a conținutului informativ în documente, în comparație cu utilizarea în HTML, unde etichetele servesc pentru a indica modul în care conținutul trebuie vizualizat.
  3. Pe de altă parte, în timp ce HTML ne spune ce etichete pot fi folosite pentru a reda un document, limbajul studiat nu specifică un set valid de etichete. Dar oferă reguli pentru crearea XML care permit crearea de noi vocabulare și seturi de etichete pentru diferite tipuri.
  4. Aceasta stabilește o distincție clară între structura unui document și modul în care este reprezentat. Etichetele dintr-un document XML nu indică nimic despre, așa cum ar trebui să fie să fie reprezentată. Pentru a-l prezenta pe ecran sau pe hârtie, va trebui să creați o foaie de stil separată și să o legați ulterior de document.
O scurtă introducere în XML

Când un computer client se conectează la o bază de date, SQL este trimis la baza de date a asociației folosind un shell XML pentru a o accesa dintr-un fișier. Acestea sunt returnate computerului client sub formă de ca structură datele conținute într-un tabel relațional de rezultate.

XML poate fi utilizat pentru a cartografia datele dintr-o sursă externă într-o schemă relațională constând într-un set de aliasuri. Structura unui document este echivalentă din punct de vedere logic cu o schemă relațională, în care elementele repetitive și cele imbricate sunt modelate ca tabele separate cu chei externe.

Evoluția continuă a limbii

Evoluția continuă a limbii

De la lansarea sa inițială pe Internet, XML a generat un număr mare de inițiative care implică schimbul și codificarea de conținut și metadate. XML a devenit în unanimitate principala opțiune pentru gestionarea și recuperarea datelor. Lista inițiativelor este extinsă și, deși nu toate au atins același nivel de adoptare, există numeroase exemple de aplicații de succes ale limbii în mediul academic, de afaceri și instituțional.

În 2004 au fost publicate noi propuneri și inițiative legate de utilizarea limbii. Exemplele includ publicarea continuă de noi versiuni ale aplicațiilor informatice concepute pentru a să lucreze cu XML, dezvoltarea de noi vocabulare sau adoptarea limbajului în diverse domenii de activitate.

Extensible Markup Language se bucură de un mare sprijin din partea organismelor internaționale de standardizare, ceea ce a permis un nivel ridicat de standardizare în domeniul comerțului electronic între companii. Dovada acestui lucru este publicația ca Standard ISO specificațiile de limbaj și recenta actualizare a standardului UDDI (Universal Description of XML File Structure and Discovery). Aceste două standarde au trezit interesul pentru noi investiții în tehnologia informației, care a încetinit în anii precedenți din cauza lipsei de încredere în piețele de internet.

Limbajul de marcare extensibil

XML este similar cu HTML. Acestea conțin caractere de marcare pentru a descrie pagini sau fișiere. Cu toate acestea, HTML descrie conținutul unei pagini web în principal în termeni de text și grafică, doar în ceea ce privește modul în care acestea trebuie afișate și cu care se poate interacționa.

XML descrie în termeni de conținut ce date sunt descrise. De exemplu, cuvântul "phonenum" într-o etichetă de marcare ar putea indica, că următoarele date va fi numărul de telefon. Un fișier XML poate fi procesat de un program pur și simplu ca date, stocat cu similar pe un alt fișier XML calculator sau să fie afișat ca un fișier HTML. De exemplu, în funcție de modul în care aplicația de pe calculatorul destinatar procesează numărul de telefon, acesta poate fi stocat, afișat sau tastat.

XML este considerat extensibil deoarece, spre deosebire de HTML, caracterele de marcare sunt nelimitate și se definesc singure. XML este un subset mai simplu și mai ușor de utilizat al standardului SGML (Standard Generalized Markup Language) pentru structura documentelor. Se așteaptă ca HTML și XML să fie folosite împreună în multe aplicații web. De exemplu, un marcaj XML poate fi afișat pe o pagină HTML.

Potrivirea pseudonimelor

Potrivirea pseudonimelor

Aliasurile corespunzătoare unui document XML sunt organizate într-o structură arborescentă, în care aliasurile copil se referă la elementele corespunzătoare părintelui. În cazul în care acestea se repetă sau au identificatori diferențiați cu structuri complexe, pot fi specificate diferite pseudonime pentru fiecare element imbricate.

Aliasurile părinte și copil sunt legate prin chei primare și străine generate de shell. Expresiile XPath sunt utilizate pentru a corela un document XML cu o schemă relațională constând dintr-un set de alias-uri. XPath este un mecanism de adresare pentru identificarea unor părți dintr-un fișier XML, cum ar fi grupuri de noduri și atribute într-un arbore de documente XML.

Sintaxa sa de bază este similară cu adresarea sistemului de fișiere. Fiecare alias este definit printr-o expresie XPath care identifică elementele care reprezintă tuplele individuale și un set de expresii care specifică modul de extragere a valorilor coloanelor din fiecare element.

Un document XML este legat de un set de alias-uri, iar relațiile părinte-copil sunt stabilite cu ajutorul cheilor străine și primare. Expresiile XPath sunt utilizate pentru a defini tuple individuale și coloane în cadrul fiecărui element de document, precum și o modalitate de a efectua interogări într-un document XML odată ce acesta a fost înregistrat în sistemul de fuziune.

Structura arborescentă a unui document de probă

Structura arborescentă a unui document de probă

Documente XML trebuie să aibă un element rădăcină care să fie părintele tuturor celorlalți. Ele pot conține elemente imbricate, text și atribute. Arborele reprezentat de un astfel de document începe cu un element rădăcină și se ramifică până la cel mai mic nivel de elemente. Deși nu există un consens în ceea ce privește terminologia utilizată în arborii XML, W3C a publicat cel puțin două terminologii standard:

  1. Terminologie utilizată în modelul de date XPath.
  2. Terminologia utilizată în setul de informații XML.

XPath definește o sintaxă de expresie numită care identifică una sau mai multe componente interne ale elementelor și atributelor unui document XML. XPath este utilizat pe scară largă pentru a accesa date codificate XML.

Un set de informații XML descrie un model abstract de date pentru documente în termeni de elemente de informații. Este adesea utilizat în specificațiile proprii limbă pentru ușor de descris constrângerile asupra construcțiilor permise de acestea.

Schimbul de date

Capacitatea de a separa stocarea datelor de navigare înseamnă că, cu XML, puteți stoca datele într-un singur format și le puteți naviga în multe moduri diferite, fără a schimba modul în care este stocat. Limbajul poate descrie ceea ce reprezintă datele. Aceasta înseamnă că, care poate să descrie modul în care sunt afișate - culoare, font și formatare - și ce reprezintă, de exemplu, un semnal primit de la un osciloscop, valoarea unui indicator de alarmă și altele.

Împreună, aceste avantaje permit stocarea oricărei informații într-un format de stocare unic care poate fi definit pentru aplicații. De asemenea, este posibil să le accesați în orice altă aplicație pur și simplu știind că aceasta citește fișiere XML. Acest lucru este util pe un singur calculator pentru schimbul de date între aplicații, dar avantajul real este într-un mediu cu mai multe calculatoare.

Puteți utiliza următorul exemplu ca model de creare a unui fișier XML și de afișare a datelor din acesta. Să presupunem că un număr de puncte de date de pe o platformă de testare sunt completate și că se efectuează o analiză de bază a acestor date.

Va fi apoi necesar să se scrie toate aceste date brute împreună cu analiza într-un fișier. Pentru a le scoate într-un fișier, trebuie să planificați cum ar trebui să arate fișierul XML pe care doriți să îl creați. Toate datele și rezultatele analizei sunt scrise în fișierul XML folosind această schemă. Capacitatea de a personaliza câmpurile din fișier, cum ar fi "data", "average", "max" și "min", face parte din flexibilitatea și puterea XML.

Dezvoltarea aplicațiilor de testare

Dezvoltarea aplicațiilor de testare

Atunci când un utilizator are un fișier XML care conține date utile, mai devreme sau mai târziu va trebui să le aplice. Pentru a face acest lucru, le puteți afișa cu ușurință în orice editor de text sau le puteți deschide într-un browser compatibil cu XML, cum ar fi Microsoft Internet Explorer. Dacă aveți nevoie să afișați mai mult decât un simplu text, puteți folosi orice, de la aplicații de baze de date la browsere web.

Pentru a citi un fișier XML, aceste aplicații au nevoie de o foaie de stil. Cu ajutorul foilor de stil, puteți vizualiza aceleași date în moduri diferite. De exemplu, un tabel foi de stil pentru pentru a afișa informațiile clienților, iar altul pentru a prezenta informațiile specialiștilor care pot avea nevoie de informații specifice pentru a rezolva o problemă. De asemenea, puteți utiliza o a treia foaie de stil pentru a încărca toate datele în sistemul de baze de date comune al întreprinderii.

Atunci când se execută această sarcină, va trebui să se creeze în prealabil trei metode diferite de ieșire a datelor. Folosind XML și foi de stil, trebuie să creați un singur fișier de date, care poate fi vizualizat în mai multe formate, în funcție de sarcinile specifice. În plus, nu mai este nevoie să specificați tipul de aplicație care va vizualiza datele, deoarece utilizatorul final își poate crea propria foaie de stil pentru a se potrivi nevoilor aplicației sale, odată ce fișierul XML este pus la dispoziție.

XML va defini standardele de date la nivelul întregii companii, astfel încât dezvoltatorul trebuie să proiecteze doar un singur fișier de schemă care poate fi utilizat, aplicând părțile relevante ale schemei în funcție de nevoile aplicației sale. Apoi, tot ce rămâne de făcut este să dezvoltați o foaie de stil pentru fiecare vizualizare de date.

Cu ajutorul acestui sistem, programele de testare și măsurare pot face cu ușurință schimb de date cu orice aplicație din întreprindere și fiecare poate crea date și le poate afișa în cealaltă.

Mecanismul XDTO în 1C

Mecanismul XDTO în 1C

Creatorii 1C, stabilindu-și sarcina de a face schimb de date folosind un limbaj de învățare, au dezvoltat un mecanism - XDTO pentru a transmite structura fișierului XML 1C. Care sunt beneficiile? Versiunea de software 8.1 și mai sus vă permite să faceți schimb de informații cu sistemele fără a intra în subiectul creării XML, rezolvând majoritatea problemelor de la 1C. Și este, de asemenea, posibil să trimiteți doar informațiile necesare pentru a forma documentul. Pentru aceasta, programatorul va trebui să efectueze în prealabil câteva proceduri.

Pentru a încărca un fișier XML utilizând XDTO, trebuie să transferați structura fișierului 1C utilizând un set de scheme create într-un editor de text sau să utilizați un software special. Rezultatul ar trebui să fie un fișier care să descrie un tip și o structură unică folosind XML. Înainte de citirea sau scrierea ultimului fișier, programatorul încarcă configurația primită în zona "XDTO Packages". Pentru a recrea, utilizatorul trebuie să aibă un element principal și atașamente cu atributele. Schema rezultată este exportată într-un fișier XSD și trimisă împreună cu cea studiată, formând astfel pachetul XDTO.

Cea mai mare diferență între utilizarea acestuia pentru a afișa date pe web și alte tehnologii este că, înainte de a putea fi creat un fișier XML, acesta trebuie mai întâi utilizat pentru a afișa date pe o pagină web, ceea ce este similar cu utilizarea unei foi de calcul.

Erori comune

Limbajul XML este atât de simplu încât aproape oricine îl poate învăța. Accesul larg este un avantaj cheie al limbii. Un dezavantaj al XML este că regulile care există în limbaj sunt absolute. Analizoarele de sintaxă XML lasă puține spațiu pentru erori. Indiferent dacă dezvoltatorul este un începător sau lucrează cu limbajul de mulți ani, aceeași erori comune apar din nou și din nou. Luați-le în considerare pentru a evita.

Așadar, erori comune de structură a fișierelor XML:

  1. Trebuie să specificați limba cu declarația, astfel încât browserul să înțeleagă codul în care este scris.
  2. XML funcționează într-un stil ierarhic. Aceasta înseamnă că toate elementele copil trebuie să aibă un părinte, șirurile de date trebuie să fie între etichetele elementelor, comentariile trebuie să fie în interiorul etichetelor.
  3. XML cere ca toate etichetele să fie închise. În HTML puteți evita deschiderea accidentală a unei etichete, iar unele browsere chiar închid etichetele atunci când pagina este redată. Un document XML cu o etichetă deschisă va genera întotdeauna o eroare.
  4. Deoarece limba care trebuie învățată funcționează într-o structură arborescentă, fiecare pagină trebuie să aibă un element rădăcină în vârful arborelui. Numele elementului nu contează, dar acesta trebuie să fie acolo înainte de, cum se recuperează Structura fișierului XML. În caz contrar, etichetele ulterioare nu vor fi corect imbricate.
  5. XML interpretează 50 de spații în același mod în care interpretează un spațiu. Limbajul colectează mai multe spații, cunoscute sub numele de spații albe, și le compilează într-unul singur. Acest lucru nu are nimic de-a face cu afișarea vizuală sau cu designul. Spațiu utilizat pentru aliniere text, nu înseamnă nimic în codul XML, așa că, dacă un dezvoltator adaugă multe spații suplimentare pentru a încerca să demonstreze un aspect vizual sau un design, își pierde doar timpul.

XML oferă o soluție bună de schimb de date pentru o gamă largă de clienți interesați, într-un format ușor de utilizat și ușor de utilizat. Aplicații precum 1C continuă să integreze noi tehnologii, cum ar fi XML, pentru a oferi utilizatorului noi capacități de procesare.

Articole pe această temă