Computer Science in School - karakterek és karakterláncok

Szövegszerkesztés - az egyik leggyakoribb programozási feladatot. Ha azt szeretnénk, hogy feldolgozzuk a szöveges adatok ismerete nélkül az anyag, amely nem kerül az alábbiakban, egyszerűen nem lehet csinálni. Különösen, ha az adatokat nem keletkezik akkor, és minden harmadik féltől származó szoftvert, vagy egy másik személy.

A szimbólum - egy szövegben egységet. Ez a levél, egy szám, egy jel. Codebook szimbólum áll 256 pozíciókat, azaz minden karakter megvan a saját egyedi kód 0-tól 255-szimbólum egy kódot írva N: #N. Ahogy a karakterek, és szerepelnek a programkódot. Mivel a karakter kód egy szám kevesebb, mint 255, akkor nyilvánvaló, hogy a memória a karakter veszi 1 byte, és egy számkód összhangban ASCII kódtábla. Mint tudod, kevesebb, mint egy byte dimenzió nincs jelen. Pontosabban, ez - ez egy kicsit, de a munka a bitek nem tudjuk a programban: bájt - a legkisebb egység. Csak nézd meg a táblázatot a karakterek és azok kódjait, akkor használhatja a szabványos segédprogram „karakter táblázat” A Windows (parancsikon található a Start menü - Programok - Kellékek - Rendszereszközök). Vannak más karakterkészlet, amelyben az egyik karakter képviselteti nem egyetlen bájt, és két. Ez Unicode (Unicode). A Unicode táblázatban az összes világnyelven. Sajnos, a használata Unicode meglehetősen bonyolult, és az eddigi támogatásért csak helyi jellegű. 2 byte is hívják szó (word). Innen a neve a megfelelő numerikus adatok típusa - Word (a számok a memóriában elfoglaló 2 bájt, a értéke 0 és 65535 között). A számos „sejtek” a Unicode asztal 65.536, és ez elég ahhoz, hogy tárolja az összes világnyelven. Ha úgy dönt, hogy az „1 byte - 256 értékeket, majd a 2 byte - 2 * 256 = 512 értékeket”, azt tanácsolom, hogy emlékezzen az elvet a bináris rendszer és az adatok tárolása a számítógépen.

Húr. ő szöveg - egy sor karakterek, azok bármilyen sorrendben. Ennek megfelelően egy karakter - is sor szöveget is. Szöveget egy bizonyos hosszúságú. vonal hossza - a karakterek számát tartalmazza. Ha egy karakter 1 bájtos, a húr N szimbólumok, illetve vesz N bájt.

Row különleges formáját képviseli egydimenziós tömb karakter, amely jelentős különbség. karakter tömb van egy fix hosszúságú (elemek száma), amely meghatározott a leírás. A string hossza két fajta:

  • A teljes hossza a húr. amely jellemzi a memória kiosztott vonal a leírása;
  • Az aktuális sor hossza (mindig kisebb vagy egyenlő a teljes hossz), amely jelzi, hogy hány szemantikai karaktersorainak egyes alkalommal.

Együttműködik szimbólumok és vonalak léteznek a megfelelő adattípusok:

Char - egy karakter (azaz 1 byte);
Húr - egy karaktersorozatot, a szöveg (N bájt).

Hivatalosan, a vonal egyszerre csak 255 karakter. Vannak speciális típusú AnsiString és WideString adatok (ez utóbbi egyébként a két byte-os, azaz Unicode) tárolására nagy szövegek és speciális karaktereket.

Hozzászólások szimbólumokkal
  • A szöveg értékeket idézőjelek használják Pascal (nem dupla!). Ie ha szeretné rendelni egy string változó értéke, meg kell, hogy ez így: ch: = „k”;
  • A null karakter jelzi két egymást követő aposztróf állt. Példa: ''.
  • Ha egy aposztróf része egy string szó, megkétszerezi a felvételt. Példa: '' ''.
Opera és qi

Az eredmény - a jelképe. amelyek száma az ASCII tábla megfelel egy adott számot. Például,

Alapfelszerelés uu
Eljárások és függvények dolgozó szálakat.
  • Hossz (s: string): integer

A függvény egy értéket az aktuális sor hosszúságú paraméter

Funkció egyesíti sorok paramétereket, amely lehet egy tetszőleges szám. Minden paraméter egy kifejezés a string típusú. Ha a string hossza, az eredmény nagyobb, mint 255 karakter, akkor csonka 255 karakter. Ez a funkció megegyezik az operátor „+” és egy kicsit kevésbé hatékony, mint a műveletet.

A függvény a karaktersorozat kivont forrás s karakterlánc hosszú szám karaktereket kezdve a karakter index számát.

s: = 'A nyelvi Turbo Pascal';

Az eljárás eltávolítja a húr-s paraméter részstringjét hossz száma karakter kezdőbetűvel karakter index számát.

s: = 'Turbo Pascal rendszer';

Az eljárás célja a behelyezésre vonalforrás s karakterlánc, kezdve az index a szimbólum karakterlánc.

A függvény megkeresi az s karakterláncot részkarakterláncként substr. A függvény eredménye az a szám az első helyen részsztring az eredeti szöveg. Ha azt a rész nem található, akkor a függvény 0.

s: = 'A nyelvi Turbo Pascal';

Az eljárás átalakítja a numerikus kifejezést X karakterlánc képviselet és elhelyezi az eredményt st.

  • Val (s karakterlánc, u értéke, c egész ...), ahol s - a húr, u - a sorok száma, a - egy hibakód, ha a konverzió sikertelen.

Az eljárás átalakítja a húr, hogy a számszerű kifejezése.