Összefoglaló
Az IntraText egy "lexikális
hipertext" formátumba konvertált szöveg, vagyis
egy interaktív hipertext rendszer, mely az alábbi részekből
áll:
- szöveg,
amely elérhető az index
vagy a konkordancia
alapján. Amennyiben a szövegben lábjegyzetek is vannak,
ezek a szövegoldal alján jelennek meg és az általános
index szintén tartalmazza a lábjegyzetek mutatóját;
- szavak
listái: ezek abc, előfordulási
gyakoriság, szóvég szerinti abc, vagy hosszúság szerint rendezettek.
A listákban levő szavak a konkordanciákhoz vannak
linkelve;
- konkordanciák:
ezekben a listákban az adott szó minden előfordulása
megtalálható. Mindegyik előfordulás egy
rövid szövegkörnyezet közepében jelenik meg;
- statisztikák:
szó- és előfordulási statisztikák
és a szöveg egyéb jellemzői.
Az IntraText különböző
verziókban érhető el. További információkért
lásd az IntraText honlapot.
Az IntraText HTML lapokra formázva
jelenik meg, így a legtöbb böngészővel megtekinthető
(lásd a kompatibilitásról
szóló részt).
A szöveget megjelenítő
oldalak egymáshoz vannak linkelve. Az oldalak tetején pedig
a fontos lapokra mutató linkek találhatók.
Minden oldal úgy van tervezve, hogy a böngészőből
közvetlenül kinyomtatható legyen.
Alkalmazások
Az IntraText CT használható
hagyományos olvasásra és hipertext-szerű böngészésre
egyaránt. A konkordanciák, a szavak listái és
a statisztikák nagyszerű eszközök az olvasás
elmélyítéséhez és a szöveg jobb
megértéséhez.
A szöveg olvasása közben bármikor elérhető
bármelyik kiegészítő funkció, mert
a szöveg szavai hozzá vannak kapcsolva a konkordancia listájukhoz.
Továbbá
a böngészőprogram keresési és segítő
funkciói is kihasználhatók.
Az IntraText ST verziójában
a böngészés a szó- és konkordancia-listákra
korlátozódik, a teljes szöveg nem tekinthető meg,
ehhez egy nyomtatott kiadást kell használni.
Index
Az index lapról minden adat elérhető.
Megtalálható rajta a szöveg tartalomjegyzéke és
(a bal oldali rovatban) a statisztikai összesítések és
a szöveganyagra mutató linkek.
Az index közvetlenül a szöveghez van kapcsolva: bármelyik
kék linkre kattintva a szöveg megfelelő részére
ugorhatunk.
Amennyiben a szövegben
lábjegyzetek is vannak, az index lapon egy "lábjegyzet
index" menüpont is megjelenik. Ez a mutató a lábjegyzetek
listáját tartalmazza, valamint linkeket a szöveg rájuk
hivatkozó mondataira. A lábjegyzet index egyes sorai a lábjegyzet
szövegének elejéből, valamint a teljes lábjegyzetre
mutató hivatkozásból állnak. A szövegbe
visszautaló link pedig arra a pontra mutat, ahol a lábjegyzet
be van szúrva.
Szöveg
A Szöveg egymáshoz
kapcsolt oldalakra oszlik
A szöveg szavai a konkordancia listájukra vannak linkelve:
csak rá kell kattintani bármelyik szóra.
Kétféle módon
navigálhatunk a szövegben:
- használhatjuk a "previous"
és "next" gombokat a lapok tetején vagy alján,
vagy
- rákattinthatunk az "Index"
szóra a lapok bal felső sarkában és kiválaszthatjuk
az olvasni kívánt szövegrészt.
Az éppen olvasott oldalon
való kereséshez:
- nyomjuk meg a CTRL+F billentyűt.
Ekkor megjelenik a böngésző belső keresője.
Ide beírhatjuk a keresett szót és kattintsunk a
"Következő" gombra. (Ennek különböző
nevei lehetnek a különböző böngészőkben:
"Search", "Find Next", stb.)
A teljes szövegben való kereséshez:
- menjünk az abc szerint rendezett
szómutatóra
- kattintsunk a keresett szó
kezdőbetűjére
- nyomjuk meg a CTRL+F billentyűt
- gépeljük be a keresett
szót
- kattintsunk a "Következő"
gombra.
Ha a szövegben lábjegyzetek
vannak, ezek az oldalak alján, egy vízszintes vonal alatt
jelennek meg, a fő szövegtől eltérő betűtípussal
(ez a böngésző és az operációs rendszer
függvényében változó lehet).
A lábjegyzet sorszáma
felső indexben jelenik meg a szövegen belül, mint ahogy
ebben a példában is:
ennek a szónak1
van egy "1"-es sorszámú lábjegyzete
A felső indexbe tett számra
kattintva a lap aljára ugrunk, ahol a jegyzet szövege kezdődik.
A lábjegyzet szövege mellett látható a jegyzet
sorszáma is. Erre kattintva a lap visszagördül arra a
helyre, ahol a jegyzetre való hivatkozás található
a szövegben.
A jegyzetekben levő
szavak ugyanúgy feldolgozásra kerültek, mint maga a
fő szöveg, így megtalálhatók a szójegyzékekben,
a statisztikákban és a konkordancia listákban.
Néhány
esetben azonban egyes jegyzetek szavai (pl. azok, amelyeket nem a szerző
írt) kimaradnak az elemzésből, ezért ezek nem
kerülnek be a statisztikákba és a konkordancia listákba.
Ily módon autentikusabb képet kapunk az író
nyelvéről, elkerülve a hamis értelmezések
lehetőségét.
Listák:
Abc, gyakoriság, szóvég szerinti abc és hossz szerint rendezve
Ezek a listák alapvető
eszközök a szöveg tanulmányozásához,
kutatásához és kivonatolásához, s a szókészlet
tömörített képét adják.
Minden listában megtekinthető
a szavak ('tokenek') száma
és az előfordulások összesítése
is.
A listákban levő szavak
a saját konkordancia listájukhoz vannak kapcsolva, kivéve
a lexikai jelentést nem hordozó "üres szavakat"
(elöljárók, névelők, névmások
stb.) valamint a hapax legomena
eseteit. Ezekhez a szavakhoz nincs konkordancia lista, így link
sincs rajtuk.
A listában való kereséshez használjuk a CRTL+F
gombot (lásd fenn).
Minden lista első oldalának
tetején olvasható egy részletes leírás
és útmutató.
Konkordanciák
A konkordanciák a
szöveg összes szavára megnézhetők (kivéve
a lexikai jelentés nélküli "üres szavakat"
és az egyetlen előfordulású
hapax legomena eseteit).
(Az IntraText Lite verziójában
a konkordancia listák a www.intratext.com
szerveren vannak, míg a szöveg, a szójegyzékek
és egyéb funkciók a felhasználó saját
gépén. Ezért az IntraText
Lite használatakor is szükség van Internet kapcsolatra,
amennyiben a konkordanciákat is böngészni akarjuk.)
A konkordancia lapok
szerkezeti elemei és funkciói az alábbi ábrán
láthatók:
A hapax legomena
kezelése
A "hapax legomena" olyan
szót jelent, amely csak egyetlen egyszer fordul elő a szövegben.
Ezek egy abc-be rendezett listába kerültek kigyűjtésre.
Ennek a listának
ugyanolyan a formája, mint a konkordancia listáké.
A szövegen belül a hapax
legomena nem hordoz linket , mivel ilyenkor
a konkordancia lista csak az éppen olvasott szövegrészt
tartalmazná.
A hapax
legomena eseteit tartalmazó listát úgy tudjuk
megnézni, hogy egy olyan szóra kattintunk a szójegyzékben,
amelynek a gyakorisága 1, vagy a gyakorisági listában
az 1-es számra kattintunk.
A lábjegyzetekben előforduló
szavak konkordanciája
A konkordanciák a lábjegyzetek
szavait is tartalmazzák. Ez esetben a szöveg vonatkozó
szakaszára mutató linkben a lábjegyzet sorszáma
vastagítva jelenik meg.
A konkordanciák nyomtatása
A konkordancia listák úgy
vannak kialakítva, hogy könnyen kinyomtathatók legyenek
a böngésző program nyomtatási funkciójával.
Nincs szükség egyéb előkészítő
műveletre. Néhány tipp:
- állítsuk a papír
helyzetét fekvő módba: így jobban áttekinthető
eredményt kapunk;
- a konkordancia listák sorszámozva
vannak, és ezek a számok hasznos egyedi azonosítók
lehetnek, ha többen dolgoznak ugyanazon a szövegen.
Statisztikák
A statisztikai oldalak egy
áttekintést és az adatokból rajzolt grafikonokat
tartalmaznak.
A statisztikák számszerűsítik a szöveg jellemzőit
és a hipertextté való alakítás eredményét.
Minden grafikon x tengelye a megfelelő
szójegyzékre van linkelve.
Ötletek az IntraText olvashatóságának
megkönnyítésére
Az IntraText
gyakorlatilag bármilyen böngészővel
olvasható. A könnyebb olvasás céljából:
- használjunk 800x600-as
vagy nagyobb képernyőfelbontást; (a Windowsban
ez a Vezérlőpult "Képernyő" funkciójával
állítható be).
- úgy állítsuk
be a böngészőt, hogy ne húzza alá
a linkeket. Az IntraText oldalain minden link kék színű,
így könnyen felismerhetők aláhúzás
nélkül is, és mivel a szavak nagy részén
van ilyen hivatkozás, sokkal könnyebben olvasható
a szöveg, ha a linkek nincsenek aláhúzva.
Az aláhúzás kikapcsolásához válasszuk
a böngésző Opciók vagy Beállítások
menüpontját. (A Netscape-ben: Szerkesztés/Beállítások/Megjelenés/Szinek;
az Internet Explorerben: Eszközök/Internet beállítások/Speciális).
- a szöveg a böngészők
alap betűkészletével jelenik meg. Amennyiben a
konkordancia listák sorai nem esnek egymás alá,
akkor válasszunk egy másfajta, fix szélességű
betűtípust, például (a Windowsban:) "Courier
New" .
Kompatibilitás a különböző
böngészőkkel
Az IntraText minden navigációs programmal és digitális olvasóeszközzel kompatibilis.
Kisebb megjelenítési eltérések
lehetnek a böngészők között, de ez normális
és nem akadályozza az olvashatóságot és
nem nehezíti az IntraText böngészését sem.
Amennyiben problémája van az IntraText
használatával valamelyik böngészővel, akkor
kérjük írja meg az [email protected]
címre.
Az EuloTech IntraText technológiája
Az IntraText ISO szabványokra
épülő HTML lapokból áll
Minden lap és link kompatibilis
minden operációs rendszerrel és gyakorlatilag minden
böngésző programmal.
Olyan speciális megoldásokat tartalmaz, amelyek csak minimális
erőforrásokat igényelnek az IntraText futtatásához
a felhasználó gépén.
Az IntraText az ECP (EuloTech
Concordance Program) alkotása, mely az EuloTech
SLI rendszer egyik programja. A szöveg
elemeinek címkézése az ETML
( EuloTech Text Mark-up Language) jelölő
nyelv szabályai szerint történik.
A rendszert egy több mint 10 millió szóelőfordulást
tartalmazó szöveghalmazon teszteltük.
Szótár
- konkordanciák.
A konkordanciák rövid szövegrészletekből
álló listák. Mindegyik részlet egy adott
szó szövegkörnyezetét mutatja.
Például: a ház szó konkordanciája
egy olyan lista, amely rövid részleteket tartalmaz a szöveg
mindazon helyeiről, ahol a ház szó előfordul.
Mindegyik részlet mellett
van egy hivatkozás a szövegnek arra a szakaszára,
amelyben a keresett szó található.
Az IntraText CT verziója
esetén ez egy közvetlen hipertext link a szövegrészlet
eredeti helyére.
Az IntraText ST változatnál
ez a hivatkozás a szöveg nyomtatott kiadásának
megfelelő részére utal.
- gyakoriság. Egy
szóalak ("token") gyakorisága azt mutatja, hogy
összesen hányszor fordul elő az a szóalak
a szövegben.
Lásd még a szó
meghatározását is.
- hapax legomena (röviden:
hapax). Az ógörög nyelvben a hapax legomena
kifejezés jelentése "csak egyszer kimondva".
A nyelvészek azokra a szavakra használják ezt a
szakkifejezést, amelyek egy adott szövegben csak egyetlen
egyszer fordulnak elő.
- IntraText. Az IntraText
az EuloTech S.p.A. bejegyzett védjegye. Az IntraText
egy új és eredeti módszer egyes művek vagy
teljes szöveg-korpuszok megjelenítésére.
Az IntraText rendszer
a szöveget egy olvasásra és kutatásra egyaránt
alkalmas interaktív hipertext formára alakítja.
Egyaránt használható World Wide Web (Internet),
CD, CDcard vagy DVD változatban, illetve megosztható
egy helyi hálózaton is. Kompatibilis minden számítógéppel
és operációs rendszerrel, amelyen van web-böngésző.
Az IntraText többnyelvű
rendszer, mely kezeli a lábjegyzeteket is, statisztikákat
és grafikonokat készít, továbbá
kinyomtatható illetve kiexportálható különböző
platformokra.
Az IntraText ST verziójával
a teljes szöveg megjeleníthetősége nélkül
is létrehozható a hipertext környezet egy adott nyomtatott
kiadáshoz kapcsolva. Ez egy forradalmian új ötlet,
mely egyrészt védi a kiadó és a szerző
érdekeit, ugyanakkor páratlan lehetőséget
nyújt az olvasónak: a nyomtatott szövegben való
interaktív keresést!
Ha szeretné a szövegeit IntraText-re alakítani, ezt
gyorsan és egyszerűen megteheti: csak kérjen egy
ajánlatot.
További információk
a rendszerről az IntraText
honlapján olvashatók.
- előfordulás.
Lásd szó.
- szó. A szó
alatt betűk és/vagy számok sorozatát
értjük. Például: ház, ezer,
325.
Ugyanazon a szövegen belül egy adott szó többször
is előfordulhat. Amikor egy szó megjelenik egy szövegben,
akkor ez a szó előfordulása abban a szövegben.
Ha a ház szó
mondjuk 32 alkalommal szerepel egy szövegben, akkor ez 32 előfordulást
jelent erre a szóra. Az előfordulások összessége
a gyakoriság: vagyis a példánkban a ház
szó gyakorisága 32:
Ezért egy szöveg mérete
előfordulásokban is kifejezhető. Pl. az olasz nyelvű
Biblia kb. 815,000 előfordulásból áll, de
csak mintegy 33,000 szóból.
Az IntraText rendszerben
a szavak kezelése megfelel annak, amit a nyelvészek
"token"-eknek
hívnak. Például: a menni, megy, megyek
és ment különböző szavaknak számítanak.
Minden szót kisbetűs alakban kezelünk. Emiatt, ha egy
szövegben a Ház, HÁZ és ház
írásmódok egyaránt szerepelnek, ezek mind
a ház szó előfordulásainak számítanak.
- üres (vagy tiltott )
szavak. Az "üres szavak" olyan szavak egy adott nyelvben,
melyeknek nincs különösebb lexikális jelentésük:
névelők, elöljárószók, névmások
stb.
Ezek a szavak nagyon gyakoriak: az olasz nyelvben például
akár a szóelőfordulások 40%-át is
kitehetik.
Az IntraText-ben az "üres
szavak" is bekerülnek a szójegyzékekbe, de konkordanciák
nem készülnek hozzájuk, mivel ezeknek nincs sok hasznuk.
De, amennyiben igény van rá, vagy ha a szöveg többnyelvű,
ezek is ugyanúgy kezelhetők, mint a többi szó.
|