Míneoidh an t-alt seo conas leas a bhaint as an gcuardach casta. Tá cuardach casta ar fáil i ngach ceann de na ceithre chorpas ar an suíomh seo: CNG, CMG, CGS agus CGL.
Tá difríocht mhór amháin idir an cuardach simplí agus an cuardach casta. Sa chuardach simplí, tá cead agat focal Gaeilge ar bith a scríobh isteach, agus déanfaidh an t-inneall curdaigh iarracht a thuiscint cad atá uait agus freagra éigin a thabhairt air sin. Ní mar sin atá sa chuardach casta. Sa chuardach casta, caithfidh tú an t-iarratas cuardaigh a scríobh i nodaireacht speisialta ar a dtugtar CQL (Corpus Query Language).
NOD DON EOLACH
Sna 1990í in Ollscoil Stuttgart a cruthaíodh CQL mar theanga chuardaigh corpais. Ó shin i leith, tá leaganacha éagsúla de CQL tar éis teacht chun cinn i mbogearraí éagsúla. An leagan de CQL a úsáidtear ar an suíomh seo, is ionann é agus CQL de chuid Sketch Engine.
Is nodaireacht é CQL chun patrúin a scríobh. Mar thoradh ar an chuardach, gheobhaidh tú sraitheanna focal a fhreagraíonn don phatrún sin.
PATRÚN SAMPLACH
Míniú: tá tú ag lorg sraith dhá fhocal:
- Is focal den leama
cuir
an chéad fhocal.- Is focal é an dara focal a bhfuil an chlib gramadaí
Ncfpc
aige (is é sin, is ainmfhocal comónta baininscneach iolra sa tuiseal ainmneach é).
In CQL, freagraíonn gach péire de lúibíní cearnacha [
...]
d’fhocal amháin. Taobh istigh de gach péire lúibíní cearnacha, déanann tú cur síos ar na critéir a chaithfidh an focal sin a chomhlíonadh, bunaithe ar aitreabúidí an fhocail: an leama, an chlib gramadaí, agus mar sin de.
Seo iad na haitreabúidi ar féidir leas a bhaint astu taobh istigh de na lúibíní cearnacha.
word
= foirm an fhocail
Sampla: [word="bhéaloidis"]
lemma
= leama an fhocail
Sampla: [lemma="béaloideas"]
tag
= clib gramadaí an fhocail
Sampla: [tag="Ncmsg"]
Tá na haitreabúidí sin cásíogair. Chun cuardach a dhéanamh go neamh-chásíogair, tá na haitreabúidí seo le fáil:
lc
= word
i litreacha beagalemma_lc
= lemma
i litreacha beagaSAMPLA
[word="baile"]
Aimseoidh sé seobaile
, ní aiseoidh séBaile
.
[word="Baile"]
Aimseoidh sé seoBaile
, ní aiseoidh sébaile
.
[lc="baile"]
Aimseoidh sé seo idirbaile
agusBaile
.
Is féidir siombailí speisialta ar a dtugtar sloinn rialta a úsáid taobh istigh de na comharthaí athfhriotail. Cuideoidh na siombailí seo leat focail a aimsiú a bhfreagraíonn a n-aitreabúidí do phatrúin áirithe.
Siombail amháin atá úsáideach is ea an lánstad .
a sheasann do charachtar ar bith.
SAMPLA
Má dhéanann tú cuardach ar
[lemma="ma."]
, aimseoidh tú focail a bhfuil trí charachtar ina n-aitreabúidleamma
:
- ar dtús,
m
- ina dhiaidh sin,
a
- agus ar deireadh, carachtar ar bith
Torthaí:
mac
,mag
,mar
agus eile
Siombail eile atá úsáideach is ea an comhartha ceiste ?
a chuireann in iúl go bhfuil an carachtar roimpi roghnach.
SAMPLA
Má dhéanann tú cuardach ar
[word="ch?eist"]
, aimseoidh tú focail a bhfuil an méid seo ina n-aitreabúidword
:
- ar dtús,
c
- ina dhiaidh sin, go roghnach,
h
- agus ar deireadh,
eist
Torthaí:
ceist
aguscheist
Siombail eile fós atá úsáideach freisin is ea an réiltín *
a sheasann do líon ar bith den charachtar roimhe.
SAMPLA
Má dhéanann tú cuardach ar
[word="geal*ta"]
, aimseoidh tú focail a bhfuil an méid seo ina n-aitreabúidword
:
- ar dtús,
gea
- ina dhiaidh sin, líon ar bith (náid san áireamh) de
l
- agus ar deireadh,
ta
Torthaí:
geata
,gealta
,geallta
Is féidir an dá shiombail seo, an lánstad agus an réiltín, a chur le chéile .*
, rud a sheasann do líon ar bith de charachtar ar bith.
SAMPLA
Má dhéanann tú cuardach ar
[lemma="ceist.*"]
, aimseoidh tú focail a bhfuil an méid seo ina n-aitreabúidlemma
:
- ar dtús,
ceist
- agus ar deireadh, líon ar bith (náid san áireamh) de charachtar ar bith
Torthaí:
ceist
,ceistneoir
,ceistiúchán
agus eile
Níl sa mhéid seo ach blaiseadh den mhéid is féidir a dhéanamh le sloinn rialta. Chun tuilleadh a fhoghlaim, léigh an t-alt Sloinn rialta sa chuardach.
Is féidir !=
a úsáid in ionad =
chun focail a aimsiú nach bhfuil aitreabúid faoi leith acu.
SAMPLA
[lemma="cuir"] [lemma!="ceist"]
Míniú: tá tú ag lorg sraith dhá fhocal:
- Is focal den leama
cuir
an chéad fhocal.- Is focal de leama eile seachas
ceist
an dara focal.
Taobh istigh de gach péire lúibíní cearnacha, is féidir níos mó ná critéar amháin a lua, agus iad a cheangal leis na cónaisc &
agus |
.
Ciallaíonn &
“agus”: caithfear an chritéar roimhe agus an chritéar na dhiaidh a chomhlíonadh.
SAMPLA
Míniú: tá tú ag lorg focal a bhfuil an leama
inis
aige agus clib dar túsV
(is é sin, briathar).
Ciallaíonn |
“nó”: caithfear an chritéar roimhe nó an chritéar na dhiaidh (nó an dá cheann) a chomhlíonadh.
SAMPLA
Míniú: tá tú ag lorg focal a bhfuil an leama
fear
nó an leamabean
aige.
Is féidir critéir chasta a chumadh ach lúibíní cuara a thabhairt isteach.
SAMPLA
[(lemma="inis" | lemma="oileán") & tag="N.*"]
Míniú: tá tú ag lorg focal a bhfuil an leama
inis
nó an leamaoileán
aige, agus a bhfuil clib dar túsN
aige (is é sin, ainmfhocal).
De ghnáth, bíonn gach péire de lúibíní cearnacha [
...]
ag freagairt d’fhocal amháin sa toradh cuardaigh. Is féidir sin a athrú le lúibíní catacha {
...}
.
SAMPLA
Míniú: tá tú ag lorg sraith dhá fhocal a bhfuil a gclib ag tosú le
V
– is é sin, dhá bhriathar i ndiaidh a chéile.Is ionann é seo agus
[tag="V.*"] [tag="V.*"]
SAMPLA
Míniú: tá tú ag lorg sraith focal ina bhfuil dhá fhocal, trí fhocal nó ceithre fhocal i ndiaidh a chéile a chríochnaíonn le
ach
.Is féidir
{2,4}
a léamh mar “dhá cheann ar laghad, ceithre cinn ar a mhéad”.
Tá sé seo áisiúil go háirithe i dteannta le []
a chiallaíonn “focal ar bith”:
SAMPLA
[lemma="cuir"] []{0,3} [lemma="ceist"]
Míniú: tá tú ag lorg sraith focal ina bhfuil:
- focal dar leama
cuir
- ansin suas le trí cinn d’fhocal ar bith
- ansin focal de leama
ceist
Tarlaíonn sé uaireanta go bhfaigheann tú toradh ar do chuardach a shíneann ar feadh dhá abairt.
SAMPLA
[lemma="ceist"] []{0,10} [lemma="freagra"]
Na torthaí a gheohaidh tú ar an iarratas seo, beidh cuid acu sínte ar feadh dhá abairt: an chéad fhocal in abairt amaháin agus an focal deireanach sa chéad abairt eile.
Má tá tú ag féachaint ar na torthaí cuardaigh sa leagan amach Comhchordacht, feicfidh tú go bhfuil teorainneacha abairtí marcáilte leis na siombailí <s>
(= tús abairte) agus </s>
(= deireadh abairte).
Chun an cuardach a theorannú do thorthaí atá taobh istigh d’abairt amháin, cuir an clásal within <s/>
ag deireadh an iarratais. Cuireann an clásal sin in iúl go gcaithfí an patrún iomlán a mheaitseáil taobh istigh d’aon bhloc amháin atá marcáilte le <s>
agus </s>
.
SAMPLA
Dúradh ag tús an ailt seo go bhfuil difriocht amháin idir an cuardach simplí agus an cuardach casta: sa chuardach simplí, is féidir focal Gaeilge ar bith a scríobh isteach, agus déanfaidh an t-inneall cuardaigh iarracht a thuiscint cad atá uait agus freagra éigin a thabhairt air sin.
Cén dóigh a ndéanann an t-inneall cuardaigh é sin? Taobh thiar de na cúirtíní, aistrítear gach cuardach simplí go CQL agus, i ngan fhios don úsáideoir, déantar an cuardach in CQL.
SAMPLA
Má tá tú sa chuardach simplí agus má dhéanann tú cuardach leathan ar fhocal amháin, mar shampla
cruinn
, aistrítear é go dtí an t-iarratas seo CQL:
[lc="cruinn"|lemma_lc="cruinn"]
Is é sin, déantar cuardach (neamh-chásíogair) ar gach focal a bhfuil foirm an fhocail nó leama an fhocal cothrom le
cruinn
.
SAMPLA
Más cuardach cúng atá á dhéanamh agat ar
cruinn
, seo an CQL a chuardaítear taibh thiar de na cúirtíní:Is é sin, déantar cuardach (neamh-chásíogair) ar gach focal a bhfuil foirm an fhocail (beag beann ar an leama) cothrom le
cruinn
.
Má tá tú ar leathanach torthaí cuardaigh sa chuardach simplí, is féidir leat an t-iarratas CQL atá taobh thiar den chuardach sin a fheiceáil uair ar bith ach cliceáil ar an nasc Cuardach casta atá ar thaobh an bhosca cuardaigh. Tabharfar chuig an gcuardach casta thú, áit a ndéanfar cuardach ar an iarratas CQL céanna.