IntraText Digital Library
Home   Map   Catalogue   Updates   Download   Info   IXT format   Privacy   Copyright   References   Contributors   Newsletter   Contacts  
Az IntraText formátum
(Deutsch - English - Español - Français - Italiano - Magyar - Português)

Összefoglaló
Az IntraText egy "lexikális hipertext" formátumba konvertált szöveg, vagyis egy interaktív hipertext rendszer, mely az alábbi részekből áll:
  • szöveg, amely elérhető az index vagy a konkordancia alapján. Amennyiben a szövegben lábjegyzetek is vannak, ezek a szövegoldal alján jelennek meg és az általános index szintén tartalmazza a lábjegyzetek mutatóját;
  • szavak listái: ezek abc, előfordulási gyakoriság, szóvég szerinti abc, vagy hosszúság szerint rendezettek. A listákban levő szavak a konkordanciákhoz vannak linkelve;
  • konkordanciák: ezekben a listákban az adott szó minden előfordulása megtalálható. Mindegyik előfordulás egy rövid szövegkörnyezet közepében jelenik meg;
  • statisztikák: szó- és előfordulási statisztikák és a szöveg egyéb jellemzői.
Az IntraText különböző verziókban érhető el. További információkért lásd az IntraText honlapot.
Az IntraText HTML lapokra formázva jelenik meg, így a legtöbb böngészővel megtekinthető (lásd a kompatibilitásról szóló részt).
A szöveget megjelenítő oldalak egymáshoz vannak linkelve. Az oldalak tetején pedig a fontos lapokra mutató linkek találhatók.
Minden oldal úgy van tervezve, hogy a böngészőből közvetlenül kinyomtatható legyen.


Alkalmazások
Az IntraText CT használható hagyományos olvasásra és hipertext-szerű böngészésre egyaránt. A konkordanciák, a szavak listái és a statisztikák nagyszerű eszközök az olvasás elmélyítéséhez és a szöveg jobb megértéséhez.
A szöveg olvasása közben bármikor elérhető bármelyik kiegészítő funkció, mert a szöveg szavai hozzá vannak kapcsolva a konkordancia listájukhoz.
Továbbá a böngészőprogram keresési és segítő funkciói is kihasználhatók.
Az IntraText ST verziójában a böngészés a szó- és konkordancia-listákra korlátozódik, a teljes szöveg nem tekinthető meg, ehhez egy nyomtatott kiadást kell használni.
 
 

Index


Az index lapról minden adat elérhető. Megtalálható rajta a szöveg tartalomjegyzéke és (a bal oldali rovatban) a statisztikai összesítések és a szöveganyagra mutató linkek.
Az index közvetlenül a szöveghez van kapcsolva: bármelyik kék linkre kattintva a szöveg megfelelő részére ugorhatunk.
Amennyiben a szövegben lábjegyzetek is vannak, az index lapon egy "lábjegyzet index" menüpont is megjelenik. Ez a mutató a lábjegyzetek listáját tartalmazza, valamint linkeket a szöveg rájuk hivatkozó mondataira. A lábjegyzet index egyes sorai a lábjegyzet szövegének elejéből, valamint a teljes lábjegyzetre mutató hivatkozásból állnak. A szövegbe visszautaló link pedig arra a pontra mutat, ahol a lábjegyzet be van szúrva.
 
 

Szöveg


A Szöveg egymáshoz kapcsolt oldalakra oszlik
A szöveg szavai a konkordancia listájukra vannak linkelve: csak rá kell kattintani bármelyik szóra.

Kétféle módon navigálhatunk a szövegben:

  • használhatjuk a "previous" és "next" gombokat a lapok tetején vagy alján, vagy
  • rákattinthatunk az "Index" szóra a lapok bal felső sarkában és kiválaszthatjuk az olvasni kívánt szövegrészt.
Az éppen olvasott oldalon való kereséshez:
  • nyomjuk meg a CTRL+F billentyűt. Ekkor megjelenik a böngésző belső keresője. Ide beírhatjuk a keresett szót és kattintsunk a "Következő" gombra. (Ennek különböző nevei lehetnek a különböző böngészőkben: "Search", "Find Next", stb.)
A teljes szövegben való kereséshez:
  • menjünk az abc szerint rendezett szómutatóra
  • kattintsunk a keresett szó kezdőbetűjére
  • nyomjuk meg a CTRL+F billentyűt
  • gépeljük be a keresett szót
  • kattintsunk a "Következő" gombra.
Ha a szövegben lábjegyzetek vannak, ezek az oldalak alján, egy vízszintes vonal alatt jelennek meg, a fő szövegtől eltérő betűtípussal (ez a böngésző és az operációs rendszer függvényében változó lehet).
A lábjegyzet sorszáma felső indexben jelenik meg a szövegen belül, mint ahogy ebben a példában is:
  ennek a szónak1 van egy "1"-es sorszámú lábjegyzete

A felső indexbe tett számra kattintva a lap aljára ugrunk, ahol a jegyzet szövege kezdődik.
A lábjegyzet szövege mellett látható a jegyzet sorszáma is. Erre kattintva a lap visszagördül arra a helyre, ahol a jegyzetre való hivatkozás található a szövegben.
A jegyzetekben levő szavak ugyanúgy feldolgozásra kerültek, mint maga a fő szöveg, így megtalálhatók a szójegyzékekben, a statisztikákban és a konkordancia listákban.
Néhány esetben azonban egyes jegyzetek szavai (pl. azok, amelyeket nem a szerző írt) kimaradnak az elemzésből, ezért ezek nem kerülnek be a statisztikákba és a konkordancia listákba. Ily módon autentikusabb képet kapunk az író nyelvéről, elkerülve a hamis értelmezések lehetőségét.
 
 

Listák:
Abc, gyakoriság, szóvég szerinti abc és hossz szerint rendezve


Ezek a listák alapvető eszközök a szöveg tanulmányozásához, kutatásához és kivonatolásához, s a szókészlet tömörített képét adják.

Minden listában megtekinthető a szavak ('tokenek') száma és az előfordulások összesítése is.

A listákban levő szavak a saját konkordancia listájukhoz vannak kapcsolva, kivéve a lexikai jelentést nem hordozó "üres szavakat" (elöljárók, névelők, névmások stb.) valamint a hapax legomena eseteit. Ezekhez a szavakhoz nincs konkordancia lista, így link sincs rajtuk.

A listában való kereséshez használjuk a
CRTL+F gombot (lásd fenn).

Minden lista első oldalának tetején olvasható egy részletes leírás és útmutató.
 
 

Konkordanciák


A konkordanciák a szöveg összes szavára megnézhetők (kivéve a lexikai jelentés nélküli "üres szavakat" és az egyetlen előfordulású hapax legomena eseteit).

(Az IntraText Lite verziójában a konkordancia listák a www.intratext.com szerveren vannak, míg a szöveg, a szójegyzékek és egyéb funkciók a felhasználó saját gépén. Ezért az IntraText Lite használatakor is szükség van Internet kapcsolatra, amennyiben a konkordanciákat is böngészni akarjuk.)
A konkordancia lapok szerkezeti elemei és funkciói az alábbi ábrán láthatók:
Konkordanciak
A hapax legomena kezelése
A "hapax legomena" olyan szót jelent, amely csak egyetlen egyszer fordul elő a szövegben. Ezek egy abc-be rendezett listába kerültek kigyűjtésre.
Ennek a listának ugyanolyan a formája, mint a konkordancia listáké.
A szövegen belül a hapax legomena nem hordoz linket , mivel ilyenkor a konkordancia lista csak az éppen olvasott szövegrészt tartalmazná.
A hapax legomena eseteit tartalmazó listát úgy tudjuk megnézni, hogy egy olyan szóra kattintunk a szójegyzékben, amelynek a gyakorisága 1, vagy a gyakorisági listában az 1-es számra kattintunk.

A lábjegyzetekben előforduló szavak konkordanciája
A konkordanciák a lábjegyzetek szavait is tartalmazzák. Ez esetben a szöveg vonatkozó szakaszára mutató linkben a lábjegyzet sorszáma vastagítva jelenik meg.

A konkordanciák nyomtatása
A konkordancia listák úgy vannak kialakítva, hogy könnyen kinyomtathatók legyenek a böngésző program nyomtatási funkciójával.
Nincs szükség egyéb előkészítő műveletre. Néhány tipp:

  • állítsuk a papír helyzetét fekvő módba: így jobban áttekinthető eredményt kapunk;
  • a konkordancia listák sorszámozva vannak, és ezek a számok hasznos egyedi azonosítók lehetnek, ha többen dolgoznak ugyanazon a szövegen.


Statisztikák
A statisztikai oldalak egy áttekintést és az adatokból rajzolt grafikonokat tartalmaznak.

A statisztikák számszerűsítik a szöveg jellemzőit és a hipertextté való alakítás eredményét.


Minden grafikon x tengelye a megfelelő szójegyzékre van linkelve.
 
 

Ötletek az IntraText olvashatóságának megkönnyítésére


Az IntraText gyakorlatilag bármilyen böngészővel olvasható. A könnyebb olvasás céljából:
  • használjunk 800x600-as vagy nagyobb képernyőfelbontást; (a Windowsban ez a Vezérlőpult "Képernyő" funkciójával állítható be).
  • úgy állítsuk be a böngészőt, hogy ne húzza alá a linkeket. Az IntraText oldalain minden link kék színű, így könnyen felismerhetők aláhúzás nélkül is, és mivel a szavak nagy részén van ilyen hivatkozás, sokkal könnyebben olvasható a szöveg, ha a linkek nincsenek aláhúzva.
    Az aláhúzás kikapcsolásához válasszuk a böngésző Opciók vagy Beállítások menüpontját. (A Netscape-ben: Szerkesztés/Beállítások/Megjelenés/Szinek; az Internet Explorerben: Eszközök/Internet beállítások/Speciális).

  • a szöveg a böngészők alap betűkészletével jelenik meg. Amennyiben a konkordancia listák sorai nem esnek egymás alá, akkor válasszunk egy másfajta, fix szélességű betűtípust, például (a Windowsban:) "Courier New" .
 

Kompatibilitás a különböző böngészőkkel


Az IntraText minden navigációs programmal és digitális olvasóeszközzel kompatibilis.
Kisebb megjelenítési eltérések lehetnek a böngészők között, de ez normális és nem akadályozza az olvashatóságot és nem nehezíti az IntraText böngészését sem.

Amennyiben problémája van az
IntraText használatával valamelyik böngészővel, akkor kérjük írja meg az [email protected] címre.
 
 

Az EuloTech IntraText technológiája


Az IntraText ISO szabványokra épülő HTML lapokból áll
Minden lap és link kompatibilis minden operációs rendszerrel és gyakorlatilag minden böngésző programmal.
Olyan speciális megoldásokat tartalmaz, amelyek csak minimális erőforrásokat igényelnek az IntraText futtatásához
a felhasználó gépén.

Az IntraText az ECP (EuloTech Concordance Program) alkotása, mely az EuloTech SLI rendszer egyik programja. A szöveg elemeinek címkézése az ETML ( EuloTech Text Mark-up Language) jelölő nyelv szabályai szerint történik.

A rendszert egy több mint 10 millió szóelőfordulást tartalmazó szöveghalmazon teszteltük.

 
 

Szótár


  • konkordanciák. A konkordanciák rövid szövegrészletekből álló listák. Mindegyik részlet egy adott szó szövegkörnyezetét mutatja.
    Például: a ház szó konkordanciája egy olyan lista, amely rövid részleteket tartalmaz a szöveg mindazon helyeiről, ahol a ház szó előfordul.

    Mindegyik részlet mellett van egy hivatkozás a szövegnek arra a szakaszára, amelyben a keresett szó található.
    Az IntraText CT verziója esetén ez egy közvetlen hipertext link a szövegrészlet eredeti helyére.
    Az
    IntraText ST változatnál ez a hivatkozás a szöveg nyomtatott kiadásának megfelelő részére utal.
     
  • gyakoriság. Egy szóalak ("token") gyakorisága azt mutatja, hogy összesen hányszor fordul elő az a szóalak a szövegben.

  • Lásd még a szó meghatározását is.
     
  • hapax legomena (röviden: hapax). Az ógörög nyelvben a hapax legomena kifejezés jelentése "csak egyszer kimondva". A nyelvészek azokra a szavakra használják ezt a szakkifejezést, amelyek egy adott szövegben csak egyetlen egyszer fordulnak elő.

  •  
  • IntraText. Az IntraText az EuloTech S.p.A. bejegyzett védjegye.  Az IntraText egy új és eredeti módszer egyes művek vagy teljes szöveg-korpuszok megjelenítésére.
    Az
    IntraText rendszer a szöveget egy olvasásra és kutatásra egyaránt alkalmas interaktív hipertext formára alakítja. Egyaránt használható World Wide Web (Internet), CD, CDcard vagy DVD változatban, illetve megosztható egy helyi hálózaton is. Kompatibilis minden számítógéppel és operációs rendszerrel, amelyen van web-böngésző.
    Az
    IntraText többnyelvű rendszer, mely kezeli a lábjegyzeteket is, statisztikákat és grafikonokat készít, továbbá kinyomtatható illetve kiexportálható különböző platformokra.
    Az
    IntraText ST verziójával a teljes szöveg megjeleníthetősége nélkül is létrehozható a hipertext környezet egy adott nyomtatott kiadáshoz kapcsolva. Ez egy forradalmian új ötlet, mely egyrészt védi a kiadó és a szerző érdekeit, ugyanakkor páratlan lehetőséget nyújt az olvasónak: a nyomtatott szövegben való interaktív keresést!

    Ha szeretné a szövegeit IntraText-re alakítani, ezt gyorsan és egyszerűen megteheti: csak kérjen egy ajánlatot.

    További információk a rendszerről az IntraText honlapján olvashatók.
     
  • előfordulás. Lásd szó.

  •  
  • szó. A szó alatt betűk és/vagy számok sorozatát értjük. Például: ház, ezer, 325.
    Ugyanazon a szövegen belül egy adott szó többször is előfordulhat. Amikor egy szó megjelenik egy szövegben, akkor ez a szó előfordulása abban a szövegben
    .
    Ha a ház szó mondjuk 32 alkalommal szerepel egy szövegben, akkor ez 32 előfordulást jelent erre a szóra. Az előfordulások összessége a gyakoriság: vagyis a példánkban a ház szó gyakorisága 32:
    Ezért egy szöveg mérete előfordulásokban is kifejezhető. Pl. az olasz nyelvű Biblia kb. 815,000 előfordulásból áll, de csak mintegy 33,000 szóból.
    Az IntraText rendszerben a szavak kezelése megfelel annak, amit a nyelvészek "token"-eknek hívnak. Például: a menni, megy, megyek és ment különböző szavaknak számítanak. Minden szót kisbetűs alakban kezelünk. Emiatt, ha egy szövegben a Ház, HÁZ és ház írásmódok egyaránt szerepelnek, ezek mind a ház szó előfordulásainak számítanak.
     
  • üres (vagy tiltott ) szavak. Az "üres szavak" olyan szavak egy adott nyelvben, melyeknek nincs különösebb lexikális jelentésük: névelők, elöljárószók, névmások stb.
    Ezek a szavak nagyon gyakoriak: az olasz nyelvben például akár a szóelőfordulások 40%-át is kitehetik.

    Az IntraText-ben az "üres szavak" is bekerülnek a szójegyzékekbe, de konkordanciák nem készülnek hozzájuk, mivel ezeknek nincs sok hasznuk. De, amennyiben igény van rá, vagy ha a szöveg többnyelvű, ezek is ugyanúgy kezelhetők, mint a többi szó.



Best viewed with any browser at 800x600 or 768x1024 on touch, multitouch and tablet devices
The IntraText® Digital Library - Some rights reserved by EuloTech SRL - 1996-2012. Content in this page is licensed under a Creative Commons License
Last updated: 2012.01.03