KURZUS: Informatikai rendszerek alapjai

MODUL: Szöveg- és kiadványszerkesztés

2. lecke: A nyers szöveg begépelése és javítása

Cél/motiváció: Ebben a leckében a szöveg-, ill. kiadványszerkesztés első két fő munkafázisával, a nyers szöveg begépelésével, majd javításával, rendbetételével foglalkozunk. Bár sokan úgy gondolják, hogy ez a rész egyszerű és felesleges is vele foglalkozni, a tapasztalat azt mutatja, hogy a kész kiadványokban fellelhető hibák nagyjából fele az itt elkövetett lazaságból, figyelmetlenségből eredeztethető. Mindenki számára kiemelten fontos tehát, hogy pontosan tisztában legyen ezekkel a(z) - sokszor valóban nagyon egyszerűnek tűnő - ismeretekkel.

Emellett az is tipikus (és sajnos gyakran megfigyelhető még beszámolókon is), hogy a hallgatóság nem képes fejlett megoldásokat alkalmazni olyan valóban egyszerű műveletek végrehajtására, mint például a gyors mozgás, vagy nagyobb szövegrészek kijelölése. Leckénkben ezeket az ismereteket is megfelelő részletességgel tárgyaljuk.

A lecke talán legfontosabb része a csere funkció alkalmazását mutatja be a nyers szövegben tipikusan fellelhető hibák hatékony javítására. Itt áttekintjük a felesleges szóközök, üres bekezdések, hibás és egyéb felesleges karakterek eltávolításának, illetve helyes párjukra való kicserélésének lehetőségeit. A megoldások felépítése során megismerkedünk a reguláris kifejezésekkel. Mivel egyes részfeladatok többféle módon is megoldhatók, ezért hatékonysági elemzést is végzünk.

A lecke a helyesírás-ellenőrzés gépi végrehajtásának elemzésével és tényleges bemutatásával zárul. Ez utóbbival kapcsolatban fontos tudnunk, hogy nem várható tőle 100%-os biztonság, tehát emberi beavatkozás is szükséges!

Követelmények: Ön akkor sajátította el megfelelően a tananyagot, ha

  • Tisztában van azokkal a nyelvi, tipográfiai és technikai szabályokkal, amelyeket a szöveg begépelése során be kell tartani (beleértve a nem nyomtatható jelek használatát is, például bekezdésvégjel, tabulátorjel);
  • Fel tudja sorolni, és saját szavaival tudja jellemezni a vezérlőkaraktereket (nem nyomtatható jeleket), be tudja mutatni a használatuk eseteit;
  • Ismeri, és tudja is alkalmazni (Wordben) a gyors, hatékony mozgás és kijelölés lehetőségeit (billentyűzettel és egérrel egyaránt);
  • Csere funkció alkalmazásával el tudja távolítani a szövegből a felesleges szóközöket, üres bekezdéseket, és egyéb felesleges karaktereket;
  • Csere funkció alkalmazásával helyes párjukra ki tudja cserélni a szövegben található hibás karaktereket (például kalapos betűk);
  • Olyan karakterek esetén, amelyek lehetnek feleslegesek, megtartandók (szükségesek) vagy lecserélendők (például kézi sortörés) kereséssel és egyedi áttekintéssel döntést tud hozni a szükséges beavatkozásról és azt végre is tudja hajtani;
  • El tudja mondani, hogy milyen elemekből épül fel egy (keresésre használható) általános reguláris kifejezés;
  • Képes végrehajtani a gépi helyesírás-ellenőrzést, azaz végeredményben képes egy lényegében hibátlan nyers szöveg előállítására.

Időszükséglet: A lecke feldolgozása (a feladatok megoldásával együtt) hozzávetőlegesen 4 órát vesz igénybe.

Kulcsfogalmak

  • Vezérlőkarakterek, különleges karakterek, automatikus javítás;
  • Mozgás a dokumentumban, kijelölések, blokkműveletek;
  • Felesleges szóközök, üres bekezdések, kalapos betűk, egyedi elbírálás alá eső jelek;
  • Reguláris kifejezések, cseremaszkok;
  • Helyesírás-ellenőrzés.
A szöveg begépelése

A dokumentumok, kiadványok készítésének első lépése a szöveg begépelése. Bár mi választott eszközünkkel, a Word programmal dolgozunk, megjegyezzük, hogy erre a célra is sok különböző szoftvereszköz használható (például WordPad vagy LibreOffice Writer, de akár a Total Commander szerkesztője is megfelelő lehet). A nyers szöveg javítását értelemszerűen megelőzi a begépelés, ezért először ezt a munkafázist ismertetjük.

A szöveg természetesen sok esetben begépelés nélkül is megszerezhető, például letölthető az internetről. Ezekkel az egyéb - nyilvánvaló - lehetőségekkel jegyzetünkben nem foglalkozunk.

Ebben a szakaszban ügyeljünk a helyesírási és tipográfiai szabályok betartására, formai beállítást lehetőleg ne végezzünk. Minél pontosabban és gondosabban dolgozunk a gépelésnél, annál kevesebb hibát kell később javítanunk!

A következőkben általánosan, összefoglalóan bemutatjuk a begépelésnél alkalmazandó szabályokat. A Tipográfia leckében még minderre - konkrét írásjelek kapcsán - visszatérünk.

A magyar írás tükrözi a magyar nyelv rendszerét: az írásmóddal érzékeltetjük a tulajdonnevek különböző fajtáit; a külön- és egybeírás révén megkülönböztetjük egymástól a szókapcsolatokat és az összetételeket; az összetett szavak elválasztásakor tekintettel vagyunk a szóhatárokra stb. Az összefüggő szövegben egymás után következő szavakat - a közismert módon - szóközzel választjuk el, hogy az írott szöveg világosan áttekinthető legyen. Kötőjellel írjuk viszont a szókettőzéssel keletkezett összetételt (néha-néha), a mellérendelő összetételt (kezét-lábát) és az ikerszavakat (hébe-hóba).

A mondatok szerkezetét, tagolódását, részeik egymáshoz kapcsolódását az írásjelek tükrözik. Az írásjelek használatának szabályai nyelvenként eltérőek. Mi azonos méretű szóközt hagyunk az írásjellel lezárt mondatok és tagmondatok között, a zárójelek és az idézőjelek közé foglalt közlési egységek, valamint a gondolatjel előtt és után. Nincs viszont szóköz a pont, a kérdőjel, a felkiáltójel, a vessző, a kettőspont, a pontosvessző előtt; a kezdő zárójel és az idézőjel hozzátapad az utána következő, a berekesztő zárójel és idézőjel pedig az előtte álló szóhoz.

A kötőjel (diviz) általában tapad az előtte és utána álló szó utolsó, illetve első betűjéhez: használtautó-kereskedés. A nagykötőjel hosszabb és keskenyebb, mint a kötőjel, hosszúsága megegyezik a gondolatjelével. A nagykötőjel néhány kivételtől eltekintve mindig tapad az előtte és utána álló szóhoz vagy számjegyhez: GyőrBudapest, Apollo11. Szóköz akkor kerül a nagykötőjel elé és mögé, ha több szóból álló, bonyolultabb írásmódú szerkezeteket kapcsol össze: január 5. február 9. A gondolatjel és a nagykötőjel között az a különbség, hogy a gondolatjel mindig szóközzel kapcsolódik az előtte álló szó utolsó betűjéhez, és nem tapad a következő szó első betűjéhez. A párbeszédjel a gondolatjellel azonos hosszúságú és formájú írásjel, amely a bekezdés élén áll, utána pedig nem törhető szóköz következik.

Példák írásjelek helyes és helytelen használatára
HibásHelyes
zárójeles (rész ) példazárójeles (rész) példa
mondatvégi pont . Új mondat ...mondatvégi pont. Új mondat...
kettőspont : egy,kettőkettőspont: egy, kettő
"idézőjeles rész " és utána"idézőjeles rész" és utána

1. táblázat

A tulajdonneveket mindig nagybetűvel kezdjük. A közszavakat általában kis kezdőbetűvel írjuk, azonban az áttekinthetőség végett a mondatok elején ezeket is nagybetűvel kezdjük.

A folyószöveget - tartalmi szempontok alapján - címekkel, bekezdésekkel és kiemelésekkel tagoljuk. A gépelés során a programok többsége a szavakat automatikusan sorokba, azokat pedig oldalakra tördeli. A sor végén az Enter billentyűt csak akkor szabad leütni, ha új bekezdést kezdünk. Ha a következő szót új sorban, de még ugyanabban a bekezdésben szeretnénk elhelyezni, akkor használjunk kézi sortörést. A dokumentumban új oldalt rögzített oldalhatár beszúrásával kezdhetünk.

Előfordul, hogy két szónak feltétlenül egymás mellett kell lennie, mert nem akarjuk, hogy a sor vége széttörje őket (például 30km). Ilyen esetben a két szó közé nem törhető szóközt vagy nem törhető kötőjelet kell tennünk (a jel ezt jelöli). Az ilyen speciális jelek a szöveg- és kiadványszerkesztőkben a megfelelő menüpontból beszúrhatók (lásd még: speciális karakterek és szimbólumok alfejezet).

Lapozzon fel egy műszaki könyvet, és gondolja végig, hogy hol használna nem törhető szóközt, illetve nem törhető kötőjelet! Hasonlóan elemezze azt is, hogy hol lenne indokolt keskeny szóköz alkalmazása!

Folyamatos gépelésnél a szavak közé egy szóközt tegyünk. Szövegrészek pozicionálásához (például listák készítéséhez) szóközök helyett használjunk tabulátorkaraktert. A Tab billentyű megnyomását követően a beviteli pont a következő tabulátorpozícióra ugrik, és a szöveg ahhoz igazodik. Nagyobb terjedelmű listáknál alkalmazzunk táblázatokat.

Egyszerű javítások

Ha a gépelés során hibázunk, használjuk a Backspace, illetve a Delete billentyűket a törléshez (visszafelé, illetve előre törlés lehetséges). A Word programban (és az irodai alkalmazásoknál általában) a beviteli pontot (kurzort) megelőző szót a Ctrl+Backspace billentyűkombinációval egy lépésben is törölhetjük. Ha a kurzor egy szón belül helyezkedik el, a törlés csak a szónak az attól balra eső részét érinti. Hasonlóan használhatjuk a Ctrl+Delete billentyűkombinációt a beviteli pontot követő szó törlésére.

Véletlen (hibás) törlés vagy egyéb számunkra előnytelen művelet végrehajtása esetén a visszavonás funkcióval korrigálhatunk (Wordben a gyorselérési eszköztáron találjuk meg). Általában több művelet is visszavonható. Időnként szükséges, illetve kényelmes lehet az elgépelt szavak olyan javítása, amely az átírás (Ins billentyű, ez kétállapotú kapcsoló, váltás a beszúró és a felülíró üzemmód között) funkcióval hajtható végre.

Gépeljen be valamely könyvből egy-két választott bekezdést a Word programban. Gondosan tartsa be a fenti szabályokat (írásjelek)! Próbálja ki az utólagos javítás, törlés és átírás lehetőségeit.

Vezérlőkarakterek

Azokat a jeleket, amelyek a nyomtatásban nem jelennek meg, de a dokumentum szerkezetét, tördelését befolyásolják, vezérlőkaraktereknek nevezzük. A vezérlőkarakterek (mint például a bekezdésjel vagy az oldaltörés) halmaza alkalmazásonként esetleg eltérhet, de kezelésük és tárolásuk mindig a betűkhöz hasonlóan történik.

A szöveg begépelése és szerkesztése során gyakran van szükségünk arra, hogy lássuk a vezérlőkaraktereket. A megjelenítéshez vagy az elrejtéshez Wordben kattintsunk a Szokásos eszköztár bekezdéskaraktert () ábrázoló gombjára, illetve a beállításoknál kapcsoljuk be a szükséges formázási jeleket.

Az 1. ábrán bemutatunk több fontos vezérlőjelet.

Vezérlőjelek egy Word dokumentumban
1. ábra

Néhány további lehetőséget (Wordben) érdemes a Szimbólumtábla "Különleges karakterek" fülén megnézni és alaposan elemezni (például nem törhető szóköz, keskeny szóköz). (Az oldal- és szakasztörések is nem nyomtatható jelek, ezekkel még később is foglalkozunk.)

Az előző feladat folytatásaként próbálja ki egyes megismert vezérlőkarakterek és nem nyomtatható jelek hatását a begépelt szövegrészletre.

Automatikus javítás

Az automatikus javítás funkció a szöveg beírásakor a gépelési, helyesírási és nyelvtani hibák kijavítására, valamint gyakran használt szimbólumok, dokumentumelemek gyors beszúrására használható. Ez a funkció elsősorban az irodai alkalmazásokra jellemző (így természetesen a Wordben is használható), és nyilvánvalóan a felhasználói kényelem minél teljesebb biztosítása a cél.

Néhány tipikus hasznos automatikus javítási beállítás:

  • Angol-magyar billentyűzet felcseréléséből eredő elírások javítása, pl. "ay" helyett "az";
  • Gyakori, tipikus helyesírási hibák javítása, például "eggy" helyett "egy";
  • Véletlenül bekapcsolt CapsLock hatásának korrekciója;
  • Gépi idézőjel cseréje nyomdaira (ez Wordben az automatikus formázási panelen szerepel).
Automatikus javítási beállítások Wordben (részlet)
2. ábra

A szolgáltatás alkalmazásakor azonban fokozottan ügyelnünk kell arra, hogy az automatikus javítás nemcsak előnyökkel jár, esetenként a helyesen írt szöveget el is ronthatja. Ez történik például abban az esetben, amikor a program az ismeretlen rövidítés után nagykezdőbetűsre váltja a szót, vagy amikor a hüvelyk jelét (") kicseréli nyomdai idézőjelre (). Ezeket a hibákat a cserét követően visszavonással vagy az intelligens címkék segítségével korrigálhatjuk.

Speciális karakterek és szimbólumok

A dokumentum elkészítésekor a betűkön, számokon és írásjeleken kívül számos olyan karaktert kell használnunk, amely nem található meg a billentyűzeten. Ezeket a karaktereket menüből vagy párbeszédablakból kiválasztva (Wordben: Beszúrás/Szimbólum; itt "Szimbólumok" fül, illetve "Különleges karakterek" fül), illetve a hozzájuk rendelt gyorsbillentyűkkel illeszthetjük be a szövegbe, ezen lehetőségek mellett sok esetben használhatunk automatikus javítási szolgáltatást is.

A gyorsbillentyűk a Word programban sok jel esetén alapból hozzárendelve léteznek (például a fok jelre Alt+Ctrl+5), más esetekben a hozzárendelést - célszerűen gyakran használt jelekre - mi végezhetjük el a Billentyűparancs... gombra kattintva. A megadásnál figyeljünk arra, hogy ne használjunk fel olyan kombinációt, amely már más jelhez hozzá lett rendelve!

Speciális karakterek beszúrása Wordben
3. ábra

Szúrjon be Word dokumentumába próbaként néhány különleges karaktert. Hozzon létre egy új billentyűparancsot egy Ön által gyakran használt szimbólum részére.

Mozgás a dokumentumban

A mozgás és a szöveg kijelölése olyan alapvető műveletek, amelyek nélkül a szöveg szerkesztése elképzelhetetlen. A dokumentumban ezek a feladatok egérrel és billentyűzettel egyaránt elvégezhetők, mindig több elképzelhető megoldás közül választhatunk.

Különösen figyelnünk kell arra, hogy más-más eszköz használata lehet célszerű kis és nagy dokumentumok esetén! Munkánk hatékonyságát a megfelelő módszer alkalmazása nagymértékben meghatározza. (Néhány képernyőoldalas szöveg esetén a legegyszerűbb, mindenki által ismert megoldások is teljesen megfelelőek, de egy 200 oldalas dokumentum esetében már nyilván nem használható értelmesen például az egérrel történő lehúzás.)

Mozgás a billentyűzettel

A billentyűzet segítségével történő mozgás leggyakrabban használt műveleteit a 2. táblázat foglalja össze. Ezek a billentyűparancsok nemcsak a Word programban alkalmazhatók, hanem a többi szöveg- vagy kiadványszerkesztő alkalmazás esetén is (általában ugyanígy, de minimális különbségek előfordulhatnak).

A kurzor (beviteli pont) mozgatása billentyűzettel
BillentyűA mozgás iránya
, egy karakterrel balra/jobbra
, előző/következő sor
Ctrl+ , Ctrl+ előző/következő szó
Ctrl+ , Ctrl+ előző/következő bekezdés
Home, Endaz aktuális sor eleje/vége
Page Up, Page Downegy képernyővel fel/le
Alt+Ctrl+Page Up,
Alt+Ctrl+Page Down
ablak elejére/végére
Ctrl+Page Up,
Ctrl+Page Down
az előző/következő oldal tetejére
Ctrl+Home, Ctrl+Enddokumentum eleje/vége
Tab, Shift+Tabegy cellával jobbra/balra (táblázatban)
Shift+F5előző szerkesztési pont

2. táblázat

Ha a dokumentumban a billentyűzet segítségével mozgunk, a beviteli pont helyzete a mozgásnak megfelelően változik.

Nyisson meg egy nagyobb méretű (például 50 oldalas) dokumentumot, és próbálja ki a gyors mozgás lehetőségeit billentyűzettel. Mérje le, hogy mennyi idő alatt tud a dokumentum végére jutni, ha nem használhatja a Ctrl+End billentyűkombinációt!

Mozgás az egér segítségével

Az egér segítségével végrehajtható legegyszerűbb mozgási művelet a képernyőn történő pozicionálás. Emellett még a gördítősáv (görgetősáv) segítségével lehet egérrel mozogni a dokumentumban.

Minden dokumentumablaknak van egy vízszintes és egy függőleges görgetősávja, amikkel a dokumentumokat könnyen átlapozhatjuk. A rajtuk elhelyezkedő csúszkák a képernyőn látható rész függőleges és vízszintes helyét jelzik a dokumentumban. A görgetősávokkal végezhető műveleteket a 3. táblázat foglalja össze.

A görgetősávokkal végezhető műveletek
MűveletA görgetés iránya
kattintás a gombrafelfelé egy sornyit
kattintás a gombralefelé egy sornyit
kattintás a csúszka föléfelfelé egy képernyőnyit
kattintás a csúszka alálefelé egy képernyőnyit
csúszka húzása a megfelelő iránybaugrás a meghatározott oldalra
kattintás a gombrabalra
kattintás a gombrajobbra
kattintás a gombraelőző oldal (vagy objektum)
kattintás a gombrakövetkező oldal (vagy objektum)
kattintás a gombraadott típusú következő objektum

3. táblázat

Eltérés a billentyűzet segítségével végrehajtott navigációhoz képest, hogy ha a görgetősávokkal mozgunk, akkor a beviteli pont nem mozdul el. A beviteli pont áthelyezéséhez az I alakú egérmutatóval kattintsunk a dokumentumban a megfelelő helyre.

Az ugrás művelet

Hosszú dokumentumoknál a leggyorsabb és egyben leghatékonyabb mozgást az ugrás biztosítja (ezt a funkciót egyes programok esetén navigációnak hívják, például LibreOffice Writer). A Word programnál az ugrás lehetőségét a Kezdőlap menüszalagon, a Keresés funkció mellett találjuk meg. A párbeszédablakban az Előző és Következő gombokkal a kiválasztott típusú dokumentumelem beviteli pont előtti, illetve utáni példánya kereshető meg (például a következő címsor), de ha pontosan tudjuk a keresett elem nevét vagy számát közvetlenül is elérhetjük (például a 7. táblázat).

Az előző nagyobb méretű dokumentumon próbálja ki az egérrel történő pozicionálás és az ugrás lehetőségeit.

Kijelölések, blokkműveletek

A dokumentum egy részét (vagy akár egészét) akkor jelöljük ki, ha az ezután következő műveleteteket a megjelölt dokumentumrészen szeretnénk elvégezni. Sok parancs végrehajtási módja attól függően változik, hogy a dokumentum tartalmaz-e kijelölést.

Kijelölés billentyűzettel

Billentyűzettel csak egyetlen összefüggő rész (blokk) jelölhető ki. A kijelölt blokkot a programok inverz színekkel jelenítik meg. A kijelöléshez Wordben (és a legtöbb más programban is) a Shift és az F8 billentyű használható.

Kijelölés egérrel

Az egérrel a kijelölést elvégezhetjük közvetlenül a szövegmezőben, vagy a kijelölő sáv segítségével (a Wordben ez természetesen lehetséges, de megjegyezzük, hogy nem mindegyik alkalmazás támogatja ez utóbbi funkciót, például a LibreOffice Writer sem). A szövegmező a dokumentumablak azon része, ahol a begépelt szöveg elhelyezkedik. Itt az egérmutató I alakú. Kijelölő sávnak nevezzük a szövegmezőktől balra eső, külön meg nem jelölt területet, ahol az egérmutató alakja mindig felfelé mutató, jobbra dőlő nyíl.

A Wordben használható lehetőségeket a 4. táblázat foglalja össze.

Kijelölés az egér használatával
Kijelölendő részMűvelet
tetszőleges szövegrészaz egér bal gombjának nyomva tartása mellett húzzuk végig az egeret a kijelölendő szövegen
objektumkattintsunk a kijelölendő elemre
egy szókattintsunk duplán a szóra
egy mondattartsuk lenyomva a Ctrl billentyűt, és kattintsunk a mondaton belül
egy bekezdéskattintsunk triplán a bekezdésen belül vagy duplán a kijelölő sávra a bekezdés mellett
több bekezdéskattintsunk duplán a kijelölő sávra, majd az egér bal gombjának nyomva tartása közben húzzuk az egeret a sáv mentén
egy sorkattintsunk a kijelölő sávra a sor bal oldalán
több sora kijelölő sávban nyomjuk le az egér bal gombját, és annak nyomva tartása közben húzzuk az egeret a sáv mentén
teljes dokumentumkattintsunk triplán a kijelölő sávra
szövegoszlopkijelölés alatt tartsuk lenyomva az Alt billentyűt

4. táblázat

Hasonlítsa össze tételesen a Wordben és a LibreOffice Writerben használható kijelölési lehetőségeket (egérrel)! Készítsen jegyzeteket arról, hogy milyen hasonlóságokat, illetve eltéréseket tapasztal.

Blokkműveletek

A blokkműveletek a Wordben lényegében ugyanúgy használhatók, mint ahogy az Excelben is (például vágólap használata, "fogd és vidd" technika stb.). Az ismertetéstől ezért itt eltekintünk, emlékeztetőül utalunk az Informatika I. tananyag Excel alapismeretek részére.

Az előző nagyobb méretű dokumentumon próbálja ki a kijelöléseket és a blokkműveleteket. Ha szükséges, idézze fel az Informatika I. tantárgy Excel részében tanultakat.

A blokkműveletek sok esetben áttekintő jellegű dokumentum-manipulációhoz is jól felhasználhatók. Így lehet kialakítani például a dokumentum egyes részeinek helyes sorrendjét. Erre még később is visszatérünk (lásd: Áttekintő dokumentum-manipuláció alfejezet).

A nyers szöveg javítása cserével

Nyilvánvaló, hogy ha betartjuk a fentiekben ismertetett szabályokat, akkor jó minőségű, lényegében hibátlan nyers szöveget kaphatunk. Gyakran azonban nem mi állítjuk elő a nyers dokumentumot, hanem mástól, idegen forrásból kapjuk, így az sok hibát tartalmazhat. Ha figyelmesen elemzünk egy ilyen szöveget, akkor eljuthatunk a következő kategorizálásig (felesleges, illetve hibás írásjelek csoportjai):

  • Felesleges szóközök, üres bekezdések;
  • Egyéb felesleges jelek, esetleg dokumentumrészek (például több Tab egymás mellett vagy kézi oldalszámozás, kézzel készített tartalomjegyzék);
  • Hibás karakterek (például kalapos betűk);
  • Ismétlődő helyesírási hibák.

Ezek a szedési, gépelési hibák - egy-két nagyon egyszerű esettől eltekintve - tipikusan a csere funkcióval javíthatók hatékonyan. A következőkben részletesen bemutatjuk a javítás menetét.

A javítás megkezdése előtt mindig készítsünk másolatot az eredeti dokumentumról, hogyha valamit elrontunk (és csak később vesszük észre), akkor vissza tudjunk térni a kiinduló állapothoz!

Felesleges szóközök, üres bekezdések

Gondolja végig, hogyan definiálná önállóan a felesleges szóköz, illetve üres bekezdés fogalmát.

Mint tudjuk, a szóköz szavak elválasztására szolgál. Felesleges szóköz az, aminek nincs ilyen funkciója (lásd következő ábra).

Régebben, az írógépes korszakban esetleg lehetett értelme extra szóközöket használni a gépelésnél a manuális kiegyenlítés elérése céljából, de a modern szöveg- és kiadványszerkesztő programok ezt a feladatot a sorkiegyenlítés funkcióval már automatikusan megoldják.

Napjainkban felesleges szóközöket tipikusan vízszintes pozícionálásra használnak (egyesek), de ez az elképzelés alapvetően hibás. (Általában a hasonló okból beszúrt több TAB jelről is ugyanezt mondhatjuk, lásd 1. lecke 5. ábra.)

Kézi sorkiegyenlítés extra szóközökkel: illusztráció
4. ábra

Szintén tudjuk már, hogy a bekezdésjel lezár egy összetartozó logikai egységet. Üres bekezdés esetén a jelnek nincs ilyen funkciója, tehát a jel maga felesleges. Az üres bekezdéseket is sokan függőleges pozicionálásra használják napjainkban, de természetesen ez is rossz elgondolás. (Ilyen megoldások kicsi méretű, "egyszer használatos" dokumentumokban - például informális levél - esetleg tolerálhatóak, de komolyabb esetekben nem.)

Képzelje el, hogy valaki üres bekezdésekkel biztosítja azt, hogy az oldalak vége egyenletes legyen, illetve hogy a megfelelő bekezdések mindig a következő új oldal tetejére kerüljenek át. Indokolja meg, hogy miért hibás ez az elképzelés! (Képzelje el, hogy átállítjuk az oldal függőleges méretét, mi történik ezután?)

Jegyezzük meg: jól szerkesztett dokumentum alapvetően nem tartalmazhat felesleges szóközöket és üres bekezdéseket, ezek a dokumentumból törlendők!

Ez alól az "ökölszabály" alól nagyon kevés kivétel van, ilyenek lehetnek például a programbetétek, vagy ha szándékosan be akarjuk mutatni a jelek alkalmazását, mint fent is tettük.

A felesleges szóközöket és az üres bekezdéseket a nyers szövegből el kell távolítanunk. Rövid szöveg esetén ezt megtehetjük akár direkt átolvasással és törléssel is, hosszabb dokumentumoknál azonban ez a módszer pontatlansága és időigénye miatt nem megfelelő, itt a keresés és csere funkciót kell alkalmaznunk (Wordben ezek a Kezdőlap menüszalagon találhatók meg).

Mindkét jel esetén használható egyszerű megoldási módszer az iteratív csere. Ilyenkor a jelek egymás melletti dupla előfordulását cseréljük ki egy jelre, azaz többszöri ismétlődéseket minden végrehajtott "nagy" lépésben (teljes végignézés) megfelezzük. A szöveg teljes "megtisztításához" több végigmenetel szükséges, egészen addig, amíg már újabb cserék nem hajthatók végre. A beírásnál a megfelelő mezőbe a szóköz simán begépelhető, a bekezdésjelet viszont a speciális jelek közül szúrjuk be (ennek jele a mezőben "^p").

Belátható, hogy log 2 n végignézés kell, ahol n a szomszédos ismétlődő elemek maximális száma.

Ha egy végigmenetellel szeretnénk eltávolítani ezeket a jeleket, akkor behelyettesítéses cserét kell alkalmaznunk. A helyettesítésnél reguláris kifejezéseket építhetünk fel, ezek maszkok, amelyekre illeszkednek a megfelelő minták (lásd még később is).

A reguláris kifejezéseket először a Unix operációs rendszerben alkalmazták (maszkolási feladatokra), később sok más területen (főként: operációs rendszerek, programozás) is elterjedtek.

Üres bekezdések eltávolítása iteratív cserével (az ábrán a csere mezőbe beszúrható egyéb speciális jeleket is bemutatjuk)
5. ábra

Esetünkben a szóköz, illetve a bekezdésjel kettő vagy több egymás melletti példányát cseréljük ki egy darab előfordulásra (lásd 6. ábra; a szóközt a láthatóság kedvéért ponttal jelöltük).

Felesleges szóközök eltávolítása egy végigmenetellel (a reguláris kifejezések felépítéséhez használható eszköztárat is bemutatjuk)
6. ábra

Külön felhívjuk a figyelmet arra, hogy a Word rendszerben behelyettesítéses cserénél a "Keresett szöveg" mezőben a bekezdésjel "^p"-ként nem használható, ehelyett a megfelelő ASCII kódot ("^13", kocsi vissza jel) kell megadnunk.

Ahogy fent már említettük, a szöveg- és kiadványszerkesztésnél az egyes részfeladatokon belül sem mindegy, hogy milyen sorrendben dolgozunk. Vegyük észre, hogy üres bekezdések még a felesleges szóközök "kiirtása" után is keletkezhetnek (lehetnek a dokumentumban akár olyan "szerencsétlen" bekezdések is, amelyek csak szóközt tartalmaznak), tehát először az előbbi jeleket kell eltávolítanunk.

Saját példaszövegén próbálja ki a felesleges szóközök és az üres bekezdések eltávolítására tanult két módszert, az iteratív megoldást és az egy végigmenetellel történő eltávolítást. Figyelje meg, hogyan csökken lépésről-lépésre a felesleges jelek száma! (Ha szükséges, a kipróbálás előtt a szöveget szándékosan "rontsa el", írjon bele felesleges jeleket.)

Egy néhány oldalas szövegen mérje le, hogy mennyi időbe kerül, ha kézzel (csere nélkül) akarja eltávolítani a szövegből a felesleges szóközöket és az üres bekezdéseket! Mit mondhatunk ezek alapján egy 100 oldalas szövegről? (Adjon becslést a kézi eltávolítás és az iteratív módszer végrehajtási idejére!)

Egyik kollégánk el akarta távolítani a szövegből az üres bekezdéseket, de hibázott, és (cserével) az üres bekezdések elé szóközöket szúrt be (akár többet is). Segítsen neki a hiba kijavításában!

Hibás karakterek, egyéb felesleges jelek

A hibás karakterek egy része sima cserével, egy végigmenetellel eltávolítható a szövegből, illetve kicserélhető a megfelelő magyar ékezetes betűre. Ilyenek a kalapos betűk, a hullámos és fordított ékezetes betűk, például: (ezek a karakterek internetről letöltött szövegekben tipikusan kompatibilitási problémák - kódlap - miatt fordulhatnak elő). Az eredeti hibás betűk vágólap műveletek segítségével vihetők be a keresett szöveg mezőbe.

Kalapos betűk eltávolítása (csere megfelelő magyar ékezetes betűre)
7. ábra

Az egyszerű csere teljesen hasonló módon ismételten előforduló helyesírási hibák javítására is felhasználható. (Gyakran előfordulhat, hogy a szöveg készítője nem használta az automatikus javítás lehetőségét, ilyenkor nekünk kell utána "takarítani".) Például: "un." helyett "ún.", "ú.n." helyett "ún.", "Kr.e." helyett "Kr. e.", ", stb." helyett " stb.".

Az "összes cseréje" gombbal legyünk mindig nagyon körültekintőek, mert a megadott minta olyan helyen is előfordulhat, amire esetleg nem gondolunk!

Szintén ugyanez a módszer alkalmazható, ha olyan felesleges jeleket kell eltávolítani, amelyekből egy példányt sem akarunk megtartani (ez esetben a "Csere erre" mezőt üresen hagyjuk). Ilyen például a kézi oldalszámozás (ez biztosan hibás!), és szinte mindig törlendők a feltételes kötőjelek. Sok esetben felesleges a TAB jel is (ha a készítő sorozatosan, vízszintes pozícionálásra használta).

Nagyon figyelni kell azonban ennél a lépésnél, mert nem mindig nyilvánvaló, hogy egy jel valóban felesleges-e. Lehet ugyanis a jelnek olyan funkciója, amiről nekünk kezdetben még nincs tudomásunk (ilyen lehet a szöveg készítője által elhelyezett - később végrehajtandó - formázási utasítás, például *, lásd következő lecke).

Bizonyos jelek esetén minden előfordulásnál egyedi döntést kell hozni a szükséges beavatkozásról, ilyen például a kézi sortörés. Ez a jel ugyanis lehet megtartandó (ha valóban csak új sort akarunk kezdeni), lehet bekezdésjelre cserélendő (ha tartalmi egységet kell lezárni), és lehet törlendő. Hasonló elbírálás alá esik a kézi oldaltörés is. (Erről még később is lesz szó, amikor a dokumentum szerkezetéről tanulunk.)

További, cserével megoldható javítási feladatok

Dokumentumok elemezésével (illetve sorozatos javításával) bizonyos idő után eljuthatunk addig a felismerésig, hogy sok más olyan típusú hiba is előfordulhat a szövegben, amely cserével javítható hatékonyan. Tipikusan ilyenek a következők (megfelelő magyarázattal, több esetben a megoldást is közöljük; a szóközt most is ponttal jelöljük):

  • Bekezdés végén és bekezdés elején levő szóköz eltávolítása (pl. "^p." helyett "^p");
  • Három pont helyett három pont karakter ("..." helyett "...");
  • Szóközök közti kötőjel helyett gondolatjel (közbevetett mondat);
  • Szóköz követő és vessző előtti kötőjel helyett gondolatjel (".-," helyett ".-,"; közbevetett mondat);
  • Bekezdés elején található "-." helyett "-." (vagy "-"; párbeszédjel; ez utóbbi megoldás azért jobb, mert a nem törhető szóköz mérete mindig fix);
  • Számjegyek közötti kötőjel helyett - ha szükséges (!) - gondolatjel.

Az utolsó feladatnál figyelnünk kell arra, hogy becsléseknél (mint például 2-3 darab), megtartandó a kötőjel, míg intervallumoknál (például 1989-90-es tanév) nagykötőjel kell, tehát kézi átnézés is szükséges lehet.

Próbálja ki az alfejezetben bemutatott javításokat egy internetről letöltött, nagyobb méretű dokumentumon (például szépirodalmi munka)!

Letölthető regények a Magyar Elektronikus Könyvtár oldalán
8. ábra
Egyszerűbb vs. bonyolultabb maszkok

Már az eddigiek alapján is érezhetjük, hogy sok olyan feladat is létezik, amelyek csak bonyolultabb cseremaszkok használatával oldhatók meg. Ha egy-egy új típusú kihívással találkozunk, akkor érdemes a súgót tanulmányozni. A reguláris kifejezések témakörével jegyzetünkben nem tudunk részletesen foglalkozni, de megemlítjük, hogy egy ilyen kifejezés - általánosan - a következő fontosabb alapelemekből épülhet fel (részletesebben lásd: súgó).

  • Literális (szó szerint értelmezett) karakter: betű vagy szám
  • Számszerűsítő: ?, * (egy, illetve több karakter)
  • Mennyiség: {n}, {n;} {n; m} (alsó, illetve felső korlát az előfordulások darabszámára, Wordben pontosvessző, LibreOffice Writerben vessző a szeparáló jel)
  • Illeszkedési pozíció: Wordben <, > (szó eleje és vége)
  • Vezérlőkarakter: Wordben a ^ (LibreOffice Writerben a \)
  • Karaktercsoport: [karakterlista vagy karaktertartomány] (a megadott karakterek közül egy, illetve a tartományból egy jel)
  • Inverz karaktercsoport: Wordben [!karakterlista vagy karaktertartomány]
  • Karakterosztály: Wordben #, $ (számjegy, betű)
Reguláris kifejezések felépítése (részlet) a Word súgóban
9. ábra

Tanulmányozza a Word és a LibreOffice Writer súgóját, és készítsen további jegyzeteket a reguláris kifejezések felépítéséről és használatáról!

A LibreOffice Writer reguláris kifejezései valamelyest eltérnek a Wordben használatosaktól, ugyanakkor jobban hasonlítanak a programnyelvekben használt "szabványokra", mint a Word kifejezései.

Tervezze meg a következő feladat megoldását (cseremaszk): a dokumentum készítője hibásan Entert ütött egyes mondatok közepén, így széttört egybetartozó bekezdéseket. Segítség: a javítás úgy képzelhető el, hogy ha nem mondatzáró írásjel van egy bekezdés végén, akkor az a bekezdésvégjel törlendő.

Megjegyezzük még, hogy nem kell mindig mindent feltétlenül teljesen általános módon felépíteni, egyszerűbb maszk is megfelelő lehet egy konkrét feladat megoldására. Figyeljünk a megtervezés idejére, és érdemes erre vonatkozóan egy felső korlátot húzni! (A részletek természetesen nagyon függenek a készítő felkészültségétől!)

Illusztrációként tekintsük a következő problémát. Egy olyan 50 oldal körüli dokumentumot kell javítanunk, amelyben a készítő kézi oldalszámozást alkalmazott, konkrétan az oldalak aljára beírta, hogy 1. oldal, 2. oldal stb. Nyilvánvalóan az összes ilyen bejegyzés hibás, mindet ki kell törölni (ezt a feladatot helyesen mező beszúrásával kell megoldani, élőláb, lásd a Dokumentumelemek leckében). A megfelelő általános cseremaszk úgy épül fel, hogy "egy vagy kettő számjegy karakter után pont, aztán szóköz, végül pedig az oldal szó". Ehelyett azonban a jóval egyszerűbb "pont szóköz oldal" maszk is megfelelő lehet (a törlést ezek után nyilván kézzel, egyesével kell elvégezni), mert a dokumentum más részein ritkán szerepelhet ilyen speciális minta. Így természetesen a tényleges cserével tovább kell dolgoznunk, de összidőben nem biztos, hogy végül rosszul jövünk ki.

Oldja meg önállóan a most ismertetett feladatot! Próbálja ki az egyszerűbb és a bonyolultabb maszkot is.

A cserét formázási feladatok megoldására is fel lehet használni, erről később szólunk majd.

Helyesírás-ellenőrzés

A nyers szöveg javításának utolsó szakasza a dokumentum gépi helyesírás-ellenőrzése. A szöveg- és kiadványszerkesztők - az egyszerűbb esetektől eltekintve - ehhez beépített ellenőrző programot nyújtanak.

A Word helyesírás-ellenőrzője működés közben
10. ábra

A helyesírás-ellenőrzők általános működéséről annyit érdemes tudnunk, hogy ezek a programok szintaktikai és szemantikai ellenőrzést is végeznek. Az első szabálycsoport főként a helyesírás egyszerű ellenőrzését jelenti (például együtt vs. eggyütt) - kombinálva akár pl. a többesszám-képzés vagy a ragozás szabályaival. Ez egy - megfelelően nagy - szótárprogram felhasználásával többé-kevésbé mechanikusan végrehajtható. Ezzel szemben a második kategória már jóval finomabb vizsgálatokat tartalmaz. Itt a programok nyelvhelyességi elemzést végeznek, ehhez nyelvi szabályok gyűjteménye és kivételszótár áll rendelkezésre a háttérben (így végrehajtható például az egyes szám - többes szám egyeztetés ellenőrzése, de sok esetben kiderül akár a tárgyas egyeztetési probléma vagy az állítmány hiánya is).

A Word program alapértelmezett beállításai szerint a szintaktikai hibákat piros, a szemantikai problémákat pedig zöld aláhúzásokkal jelzi. (Ez a jelzés természetesen kikapcsolható.)

A nyelvi ellenőrzés idegen nyelvű dokumentum(rész) esetében is végrehajtható, amennyiben a megfelelő szótárfájl telepítve van a szövegszerkesztőben. A magyar Word program alapszolgáltatásként biztosítja az angol és a német ellenőrzést is (de például a franciát vagy az olaszt már nem).

Az ellenőrző a hibásan beírt szavak javítására javaslatot is tesz (a szótár alapján). Ilyenkor eltérések alapján hoz döntést, és szinte minden olyan hibát korrekt módon kezel, ha egy betűt elütünk, vagy két betűt véletlenül felcserélünk. Két vagy több eltérő karakternél azonban már nem működik ez a javító algoritmus (tehát például a "szabáylok" szóra megkapjuk a helyes javaslatot, de a "tratlamzó" szónál már nem).

Próbálja ki, hogy bizonyos szavakat szándékosan elront, illetve hibásan gépel be Wordben. Tesztelje a helyesírás-ellenőrzőt, hogy mely esetekben tudja a rendszer helyesen felismerni és kijavítani ezeket a hibákat.

A helyesírás-ellenőrzők rendkívül hasznos programok, sokat segítenek a munkánkban, azonban nem tökéletesen megbízhatóak. A gépi ellenőrzés nem vesz (nem vehet) észre minden hibát, és időnként tesz hibás módosítási javaslatokat. Ez tehát egy olyan terület, ahol a szakértő emberi közreműködés vélhetően még jó ideig nem lesz nélkülözhető. Ha belegondolunk, hogy egy természetes nyelv mennyire bonyolult, akkor ezen nem is csodálkozhatunk.

A magyar nyelvű ellenőrzés hibázhat többszörösen összetett szavaknál, szócsoportoknál (például közlekedés-gazdaságtan), itt ugyanis olyan szabályok döntenek, amelyhez jelentésbeli értelmezés szükséges.

Hasonlítsa össze egyes "problémás szavakra" a régebbi és az újabb Word verziók helyesírás-ellenőrzését! (Például 2003-as és 2010-es vagy 2013-as Word.) Tapasztal eltérést? (Érdemes más szöveg-, ill. kiadványszerkesztő programokkal is vizsgálódni.)

(Erről a témáról több érdekes cikk is megjelent az utóbbi években, javasolt, hogy keresgéljen az interneten!)

Ritkábban a helyesírás-ellenőrzés egyéb korlátaiba is belefuthatunk. Egy ilyen például a következő: nagyon sok hibát tartalmazó dokumentum esetén járhatunk úgy, hogy a további hibakijelzés "összeomlik", a dokumentumban észlelt hibák már nem jeleníthetőek meg. Ez esetben a dokumentumot célszerű kisebb részekre bontatnunk, és így ellenőrizni.

Önellenőrző kérdések
1. Válassza ki a következő tevékenységek közül azokat, amelyeket tipikusan más eszközzel hajtunk végre egy kis méretű (pl. 1 oldal) és egy nagy méretű (100-200 oldal) szöveg esetén!
Ismétlődő gépelési hibák javítása.
Munkakörnyezet beállítása.
Menükezelés.
Megnyitás.
Mozgás/pozícionálás a szövegben.
Mentés.
Dokumentum kijelölése.
2. Döntse el az alábbi állításokról, hogy igazak vagy hamisak!
A klaviatúrán nem megtalálható matematikai jelek egy része a dokumentumba beszúrható.
A csere funkcióval a dokumentumban ismétlődő helyesírási hibák is javíthatók.
A magyar nyelvű Word csak magyar nyelvű szöveg helyesírás-ellenőrzését végzi el.
3. Egészítse ki az alábbi mondatokat!

Azokat a jeleket, amelyek a nyomtatásban nem jelennek meg, de a dokumentum szerkezetét, tördelését befolyásolják, -nek nevezzük.

Szóközök közti kötőjel helyett a folyószövegben -et kell alkalmazni.

4. Válassza ki a következők közül azokat a cseremaszkokat, amelyek alkalmasak/amelyeket fel tudunk használni a dokumentum felesleges szóközeinek eltávolítására! (A szóköz helyett a mintákban a "." jel szerepel, a kérdések a Word programra vonatkoznak.)
".." "."
"^p^p" "^p"
".{2;}" "."
".{2,}" ""
"^$" "."
"^t" "."
5. Rakja sorrendbe a hatékony munkavégzésnek megfelelően a szöveg-, illetve kiadványkészítés most áttekintett szakaszának megadott munkafázisait!

1.
2.
3.
4.
5.