Tekstaro de Esperanto

Specialaj serĉosimboloj

En serĉesprimoj vi povas uzi diversajn specialajn simbolojn. Ĉi-sube estas klarigoj pri la plej gravaj el tiuj signoj, sed principe vi povas uzi la tutan repertuaron de regulesprimaj signoj de la programada lingvo Perlo. Atentu tamen, ke ĝusta uzado de komplikaj kunmetoj de tiaj signoj povas esti iom malfacila. Eble indas legi libron pri la regulesprimoj de Perlo. Vi povas krome uzi la specialajn simbolojn en la dua listo ĉi-sube (ili ne ekzistas en Perlo).

.
= iu ajn signo (aŭ spaceto). Ekz.: serĉo per la serĉesprimo s.no trovas “sano”, “seno”, “sino”, “sono” kaj “suno” (kaj ankaŭ ekz. “s no”). Por serĉi efektivan punkton, vi skribu \. (kun aldona malsuprenstreko).
+
= unu aŭ pli de la antaŭa signo (aŭ interkrampaĵo). Ekz. vat+o respondas al “vato” kaj “vatto”, kaj ankaŭ (principe) al “vattto”, “vatttto” k.t.p. Por serĉi efektivan pluso-signon, vi skribu \+.
*
= nul aŭ pli de la antaŭa signo (aŭ interkrampaĵo). Ekz. e*norma respondas al “norma” kaj “enorma”, kaj ankaŭ (principe) al “eenorma”, “eeenorma” k.t.p. Por serĉi efektivan steleton, vi skribu \*.
{}
= kiomo de la antaŭa signo (aŭ interkrampaĵo). Ekz. i{2,4} signifas 2 ĝis 4 sinsekvajn “i”-ojn (minimume 2, maksimume 4). [aeiou]{3} signifas 3 sinsekvajn vokalojn. \.{,3} signifas 0 ĝis 3 sinsekvajn punktojn. (la){2,} signifas 2 aŭ pli da sinsekvaj okazoj de la literduopo “la”. Por serĉi efektivajn kunigajn krampojn, vi skribu \{ kaj \}.
?
= nul aŭ unu de la antaŭa signo (aŭ interkrampaĵo). Ekz. t?iaj respondas al “tiaj” kaj “iaj” (la “t” estas libervola). lingvo-?lernado trafas kaj “lingvo-lernado” kaj “lingvolernado” (la dividostreko estas libervola). Por serĉi efektivan demandosignon, vi skribu \?.
+?, *?
Post +* aldona ? havas alian signifon. Tie ĝi kaŭzas, ke +* kondutas minimumeme (normale ili kondutas maksimumeme). Ekz. se en teksto aperas la vorto “demokratioj”, kaj vi serĉas per la esprimo d.+o, vi trovas “demokratio” (de “d” ĝis “o”, inter kiuj estas unu aŭ pli da signoj, el kiuj unu hazarde estas “o”). Sed se vi anstataŭe serĉas d.+?o, vi trovas nur “demo”. En la unua okazo + estas maksimumena, kaj prenas tiom da signoj, kiom ĝi entute povas trovi. En la dua okazo +? estas minimumema, kaj kontentiĝas tuj antaŭ la unua “o”.
[]
= signoklaso. Ekz. tr[eio] respondas al “tre”, “tri” kaj “tro”. [ĉĝĥĵŝ]ar trovas “ĉar”, “ĝar”, “ĥar”, “ĵar” kaj “ŝar”. \b[Ĉĉ]u\b trovas “Ĉu” kaj “ĉu”. \b\w+[aeiou]\b trovas ĉiujn vortojn, kiuj finiĝas per vokalo. [aeiou][aeiou]+ trovas du aŭ pli da sinsekvaj vokaloj (“aa“, “eui”, “iii” k.s.). Se vi skribas ^ komence de tia signoklaso, vi inversigas la signifon: [^aeiou] simbolas ĉiun ajn signon krom ĝuste “a”, “e”, “i”, “o” kaj “u”. [^ĥ] estas ĉiu ajn signo krom ĝuste “ĥ”. Atentu, ke ^ komence de serĉesprimo havas alian signifon. Atentu, ke vi ĉiam devas uzi tiajn krampojn en paroj. Se vi skribas ekz. [l (mankas la finkrampo), vi trovos nenion ajn. Por serĉi efektivajn rektajn kramposignojn, vi skribu \[ kaj \].
|
= . Ekz. (en|el)iri respondas al “eniri” kaj “eliri”. (A|a)ntaŭ trovas kaj “Antaŭ” kaj “antaŭ”. Por serĉi efektivan vertikal-signon, vi skribu \|.
()
= kunigo. Ekz. (mal)?granda respondas al “malgranda” kaj “granda”. La posta ? koncernas la tutan interkrampaĵon, kaj indikas, ke tiu estas libervola. (mal)+graŭ respondas al “malgraŭ” kaj “malmalgraŭ” (kaj ankaŭ al “malmalmalgraŭ” k.t.p.). Atentu, ke vi ĉiam devas uzi tiajn krampojn en paroj. Se vi skribas ekz. (la - mankas la finkrampo -, vi trovos nenion ajn. Por serĉi efektivajn kramposignojn, vi skribu \( kaj \).
\1, \2...
= retroreferenco al antaŭa kunigo (per rondaj krampoj). Ekz. \b(sur|sub) \1\b respondas al “sur sur” kaj “sub sub”. \1 referencas la unuan kunigon, \2 la duan kunigon, k.t.p. Se oni uzas tiajn esprimojn, la respondaj interkrampaj kunigoj devas ekzisti. Alie la serĉo rezultigas eraron. Ne eblas ekz. \b(sur|sub) \1 \2\b, ĉar tie estas nur unu kunigo. Sed ja eblas ([a-z]+)([a-z]+) kaj \2\1, kio trafas ekz. “lignofajro kaj fajroligno” aŭ “petoskribo kaj skribopeto”.
\w
= unu vortsigno. Tio estas ĉiuj literoj (ne nur la Esperantaj), ĉiuj ciferoj (ne nur la Hind-Arabaj) kaj “_” (substrekosigno). Se vi volas serĉi nur Esperantajn literojn uzu \LI\LD.
\W
= unu ne-vorta signo. Tio estas la malo de \w.
\S
= ajna signo krom spaceto. Rimarku, ke la solaj spacosignoj, kiuj aperas en la tekstoj - kiam tiuj estas priserĉataj - estas ordinaraj intervortaj spacetoj, kaj ke nenie aperas duoblaj aŭ plioblaj spacetoj. \S do egalas al . minus spaceto. Rimarku ankaŭ, ke estu majuskla “S” en \S. (Minuskla \s signifas “ajna spacosigno”, sed tio ĉi tie praktike egalas al simpla spaceto, kaj tial \s ne estas bezonata ĉi tie.)
\b
= vortlimo. Ekz. \bsen donas trafojn nur kiam “sen” aperas ĉe la komenco de vorto. \bsen\b trafas nur la vorton “sen” (ne vortojn kiel “esence”, “senila” k.s.).
\B
= ne ĉe vortlimo (la malo de \b). Ekz. \Bsen trafas ĉiujn okazojn de “sen“, krom kiam “sen” aperas ĉe la komenco de vorto. \Bsen\B trafas ekz. la vorton “esenca”, sed ne la vorton “sen”.
\d
= cifero. Ekz. \d\d\d trafas ĉiujn okazojn de tri sinsekvaj ciferoj (“123”, “999”, “847” k.s.).
\D
= necifero (ĉia ajn signo krom cifero). Ekz. \D1 trafas “a1”, “ĉ1”, “-1” k.s.
^
= komenco de alineo (aŭ simila tekstosekcio). Ekz. ^Ĉu\b trafas la vorton “Ĉu”, kiam ĝi aperas tuj ĉe la komenco de alineo (aŭ simila tekstosekcio). Atentu, ke ^ ene de rektaj krampoj havas alian signifon.
$
= fino de alineo (aŭ simila tekstosekcio). Ekz. \.\.\.$ trafas tripunkton ĉe la fino de tekstosekcio.

Se vi iam volas serĉi la signon “\”, vi skribu \\.

Se vi iam volas serĉi efektivan literon “x”, kiu ne estu interpretata kiel surogato por supersigno, vi skribu \x\X. (En ordinara uzado de Perlo \x havas tute alian signifon.)

En la serĉataj tekstoj ekzistas nur unu speco de blanksigno, ordinara spaceto. Ne aperas taboj (tabeligaj signoj), nek linifinoj.

\FI
= iu ajn el la eblaj kombinoj de gramatikaj finaĵoj en Esperanto, t.e. “o”, “oj”, “on”, “ojn”, “a”, “aj”, “an”, “ajn”, “e”, “en”, “i”, “as”, “is”, “os”, “us”, “u”. Ekz. \binteres\FI trafas “intereso”, “intereson”, “interesojn”, “interesa”, “interesaj”, “interese”, “interesi”, “interesas” k.t.p. Tio signifas, ke ĝi trafas ĉiujn eblajn formojn de la radiko INTERES/. (Kunmetaĵojn kiel “seninteresa”, “interesiĝi” k.s., ĝi tamen ne trafas.)
\VF
= iuj ajn el la verbaj finaĵoj en Esperanto. Ekz. \binteres\VF trafas “interesi”, “interesas”, “interesis”, “interesos”, “interesus” kaj “interesu”.
\OF
= iuj ajn el la variantoj de O-finaĵo en Esperanto. Ekz. \binteres\OF trafas “intereso”, “intereson”, “interesoj” kaj “interesojn”.
\AF
= iuj ajn el la variantoj de A-finaĵo en Esperanto. Ekz. \binteres\AF trafas “interesa”, “interesan”, “interesaj” kaj “interesajn”.
\EF
= iuj ajn el la variantoj de E-finaĵo en Esperanto. Ekz. \bdekstr\EF trafas “dekstre” kaj “dekstren”.
\PA
= participa sufikso. Ekz. \bnask\PAa\b trafas “naskanta”, “naskinta”, “naskonta”, “naskata”, “naskita” kaj “naskota”. Se vi skribas anstataŭe \bnask\PA\FI la serĉo trovas ankaŭ “naskantaj”, “naskintan”, “naskontajn”, “naskitas”, “naskate” k.t.p.
\AP
= aktiva participa sufikso. Ekz. \bnask\APa\b trafas “naskanta”, “naskinta” kaj “naskonta”.
\PP
= pasiva participa sufikso. Ekz. \bnask\PPa\b trafas “naskata”, “naskita” kaj “naskota”.
\LI
= unu Esperanta litero, t.e. unu el “a-z”, “A-Z” kaj “ĉ Ĉ ĝ Ĝ ĥ Ĥ ĵ Ĵ ŝ Ŝ ŭ Ŭ”. Ekz. \b\LIia\b trafas “cia”, “dia”, “fia”, “ĝia”, “lia”, “mia”, “nia”, “pia”, “sia”, “ŝia”, “tia” kaj “via” (kaj eble ankoraŭ aliajn vortojn). \b\LI+m\b trovas ĉiujn vortojn, kiuj finiĝas per “m”, kaj kiuj cetere enhavas nur Esperantajn literojn.
\LD
= unu Esperanta litero aŭ dividostreko (“-”), t.e. la samo kiel \LI plus dividostreko. Ekz. \b\LDia\b trafas “cia”, “dia”, “fia”, “ĝia”, “lia”, “mia”, “nia”, “pia”, “sia”, “ŝia”, “tia”, “via” kaj ankaŭ “-ia” (kaj eble ankoraŭ aliajn vortojn). \b\LD+m\b trovas ĉiujn vortojn, kiuj finiĝas per “m”, kaj kiuj cetere enhavas nur Esperantajn literojn aŭ dividostrekojn.
\NE
= ne-Esperanta litero, t.e. la malo de \LI. Ekz. \b\NE\w+\b trafas vortojn, kiuj komenciĝas per ne-Esperanta litero.

Ĉiuj specialaj simboloj devas esti skribataj ekzakte tiel, kiel ili aperas ĉi-antaŭe. Atentu pri la uskleco: Estu \FI, \OF k.t.p, (ne \fi, \of aŭ simile).

Post ĉiu el la finaĵaj specialsimboloj, \FI, \VF, \OF, \AF, \EF, vortlimo estas subkomprenata. Ne necesas aldoni la vortliman simbolon \b.

La specialaj gramatikaj simboloj ne kapablas distingi inter veraj finaĵoj/sufiksoj kaj ŝajnaj. Tial ekz. \btr\FI trafas vortojn kiel “tro”, “tre” kaj “tri”, kvankam en ili “o”, “e” kaj “i” ne estas gramatikaj finaĵoj. Kaj \bkont\AP\AF\b trafas ankaŭ la vorton “kontanta”, kvankam tiu vorto ne estas participo. Per uzo de streketoj oni tamen povas solvi tiajn problemojn.

Ekzemploj de serĉoj pere de specialaj serĉosimboloj

En la ĉi-postaj ekzemploj estas uzata la vorto “propono” ĉe ĉiuj solvoj, ĉar tre ofte ekzistas pli ol unu maniero realigi tiajn taskojn.

  1. Oni volas trovi ĉiujn okazojn de la esprimo “La nova vesto”, sed ankaŭ en multe-nombro kaj eble kun N-finaĵoj.

    Propono: \b[Ll]a nov\AF vest\OF. La komenca \b (por vortlimo) certigas, ke ne estu trovita ekz. “sola nova vesto”. [Ll] certigas, ke estu trovita kaj “La” kaj “la”. \AF esprimas ĉiujn variantojn de A-vortaj finaĵoj: “a”, “an”, “aj” kaj “ajn”. \OF esprimas ĉiujn variantojn de O-vortaj finaĵoj: “o”, “on”, “oj” kaj “ojn”. Rimarku, ke vortlimo estas aŭtomate subkomprenata post \AF kaj \OF. Ne necesas aldoni \b.

  2. Oni volas trovi ĉiujn okazojn de la esprimo “montra fingro”, “montran fingron”, “montraj fingroj” aŭ “montrajn fingrojn” sed ne ekz. “montra fingroj” (kun J-finaĵo nur ĉe la dua vorto). La finaĵoj de la A-vorto kaj la O-vorto estu kongruaj.

    Propono: \bmontra(j?n?) fingro\1\b. La retroreferenco \1 esprimas tiun saman finaĵon aŭ tiujn samajn finaĵojn (aŭ mankon de finaĵoj), kiuj estis post “montra”. La demandosignoj post “j” kaj “n” igas ambaŭ finaĵojn libervolaj. Rimarku, ke ĉi-foje \b por vortlimo estas necesa post \1 (male al la ĉi-antaŭa ekzemplo).

  3. Oni volas trovi ĉiujn okazojn “mia patrino”, sed kun nul ĝis tri vortoj inter “mia” kaj “patrino”, do ankaŭ ekz. “mia kara patrino”, “mia tre ĉarma patrino”, “mia kara bela patrino” kaj simile, sed ne “mia tre kara kaj ĉarma patrino” (kun kvar interaj vortoj).

    Propono: \bmi\AF (\LI+ ){0,3}patrin\OF. La kodaĵo \LI+ esprimas vorton konsistantan el Esperantaj literoj (unu aŭ pli da literoj). Tia vorto plus posta spaceto rajtas aperi 0 ĝis 3 fojojn pro {0,3}, kiu validas por la tuta interkrampa esprimo. Pro la uzo de \AF kaj \OF la serĉesprimo akceptas ankaŭ trovojn kun J-finaĵoj kaj N-finaĵoj. Rimarku, ke ne estu \bmi\AF (\LI+ ){0,3} patrin\OF kun spaceto antaŭ “patrin”, ĉar ne ekzistas okazoj de du sinsekvaj spacetoj en la Tekstaro.

Streketoj en serĉoj

Se en la serĉilo oni ŝaltis uzadon de streketoj, oni povas uzi specialajn signojn, kiuj reprezentas limojn inter vortelementoj. Fakte oni tiam plej ofte eĉ devas uzi tiajn signojn por trovi tion, kion oni celas.

En la Tekstaro tiaj limoj estas indikataj precipe per specialaj streketoj, kiuj estas aparte aldonitaj al la tekstoj. Sed en iaj lokoj uziĝas tiucele ekz. dividostrekoj (“-”), kiuj ja estis en la originaj tekstoj. Vorto kiel ekzemple “nordokcidenta” eble aperas en teksto kiel “nord-okcidenta”. La unua varianto havas en la Tekstaro la formon “nord•okcident•a” (kun du aldonitaj streketoj), dum la dua aperas kiel “nord-okcident•a”. Ialoke uziĝas origine por tiu celo anstataŭe suprenstrekoj aŭ apostrofoj: “Pol/land/o”, “roz’odoro”, k.s. Tial kvar specialaj simboloj estas uzeblaj por reprezenti vortlimojn en serĉoj:

' (rekta apostrofo) kaj (buleto)
= streketo (nur tia, kiu estas aparte aldonita al la Tekstaraj tekstoj, kaj kiuj estas ignorataj, se oni ne ŝaltis uzadon de streketoj). Rekta apostrofo estas plej facile tajpebla, dum buletoj estas uzata en montrado de streketoj en serĉorezultoj, ĉar plej klare videblaj. Sed en serĉesprimoj ili havas ekzakte la saman sencon.
_ (substreko)
= streketo, suprenstreko (/), dividostreko (-) aŭ apostrofo (’, vera kurbigita apostrofo)
/ (suprenstreko)
= streketo, suprenstreko (/), dividostreko (-), apostrofo (’, vera kurbigita apostrofo) aŭ vortlimo (komenco aŭ fino de vorto)

Se oni volas serĉi efektivan suprenstrekon (/), ne uzante tiun simbolon por trovi streketojn k.s. laŭ la ĉi-antaŭaj klarigoj, oni povas uzi \/. Simile, se oni volas uzi rektan apostrofosignon ('), por trovi apostrofojn (ne streketojn), oni povas uzi \'. (Se oni ne ŝaltis uzon de streketoj, oni povas simple uzi / kaj ' respektive por tiaj serĉoj.) Ne havas sencon serĉi efektivajn substrekojn (_) aŭ buletojn (•), ĉar tiuj signoj tute ne aperas en la tekstoj de la Tekstaro.

Jen kelkaj ekzemploj de serĉado kun streketoj:

  1. Oni volas trovi uzon de la prefikso “mal”, sen trovi vortojn, kies radiko komenciĝas per “mal...” (kiel ekz. “malica”).

    Propono: \bmal'. La komenca \b (por vortlimo) certigas, ke ne estu trovita ekz. la vorto “normala”. ' certigas, ke estu vortelementa limo post “mal”. Tiel oni trovas ekzemple “mal•grand•a” kaj “mal•o•j”, sed ne “malic•a”, nek “malgraŭ”.

    Propono: /mal/. La signo / trovas kaj streketojn, kaj vortlimojn. Oni tiel trovas vortojn, kiuj komenciĝas per la prefikso “mal”, sed ankaŭ vortojn, kiuj havas “mal” ie en la mezo, kiel ekz. “ne•mal•hav•ebl•a”. Oni trovas ankaŭ vortojn, kiuj estas skribitaj kun dividostreko, kiel “mal-vort•o”.

    Propono: _mal_. La signo _ trovas kaj streketojn, kaj dividostrekojn, sed ne vortlimojn. Oni tiel ne trovas vortojn, kiuj komenciĝas per la prefikso “mal”, sed ja vortojn, kiuj havas “mal” ie en la mezo, kiel ekz. “ne•mal•hav•ebl•a”.

  2. Oni volas trovi uzojn de la vorto “reeniri”, kaj kun la senco “re•en•ir•i”, kaj kun la senco “re•e•n•ir•i”.

    Propono: Du serĉesprimoj en apartaj tekstokampoj por serĉado; \bre_en_ir_\VF kaj \bre_e_n_ir_\VF. Rimarku, ke necesas uzi ian simbolon por streketo antaŭ la fina \VF (por verba finaĵo). Kredeble indas malelekti “Kunigi serĉojn” por ke la du variantoj aperu aparte en po unu langeto. Poste indas kontroli, ĉu la analizo de la vortoj estas ĝusta. Tio en multaj okazoj ne estas facila. Eĉ la kunteksto ofte ne definitive montras, ĉu temas pri rea irado en ion aŭ pri irado reen al iu loko.

  3. Oni volas trovi vortojn kiel “fin•fin•e” kaj “eg•eg•e” kun ripeto de unu sama radiko.

    Propono: /(\LI+)'\1'. Ĉi tie indas uzi ' por trovi nur verajn streketojn (ne dividostrekojn). Alie oni trafas al “Hu-u-u-u!” (ekkrio) kaj similaj aferoj skribitaj kun dividostrekoj, kiuj ne indikas vortelementajn limojn. La simbolo \1 indikas ripeton de la unua interkrampa esprimo.

La Tekstaro de Esperanto ekzistas dank’ al subteno de ESF.
Donacu al ESF kaj subtenu indajn projektojn, kiel la Tekstaro!
ESF - Por lingva justeco en multkultura mondo - ekde 1968