Eolas Treoir don sárúsáideoir

Aithne a chur ar CQL

Míneoidh an t-alt seo conas leas a bhaint as an gcuardach casta. Tá cuardach casta ar fáil i ngach ceann de na ceithre chorpas ar an suíomh seo: CNG, CMG, CGS agus CGL.

Tá difríocht mhór amháin idir an cuardach simplí agus an cuardach casta. Sa chuardach simplí, tá cead agat focal Gaeilge ar bith a scríobh isteach, agus déanfaidh an t-inneall curdaigh iarracht a thuiscint cad atá uait agus freagra éigin a thabhairt air sin. Ní mar sin atá sa chuardach casta. Sa chuardach casta, caithfidh tú an t-iarratas cuardaigh a scríobh i nodaireacht speisialta ar a dtugtar CQL (Corpus Query Language).

NOD DON EOLACH

Sna 1990í in Ollscoil Stuttgart a cruthaíodh CQL mar theanga chuardaigh corpais. Ó shin i leith, tá leaganacha éagsúla de CQL tar éis teacht chun cinn i mbogearraí éagsúla. An leagan de CQL a úsáidtear ar an suíomh seo, is ionann é agus CQL de chuid Sketch Engine.

An chéad amharc ar CQL

Is nodaireacht é CQL chun patrúin a scríobh. Mar thoradh ar an chuardach, gheobhaidh tú sraitheanna focal a fhreagraíonn don phatrún sin.

PATRÚN SAMPLACH

[lemma="cuir"] [tag="Ncfpc"]

Míniú: tá tú ag lorg sraith dhá fhocal:

  1. Is focal den leama cuir an chéad fhocal.
  2. Is focal é an dara focal a bhfuil an chlib gramadaí Ncfpc aige (is é sin, is ainmfhocal comónta baininscneach iolra sa tuiseal ainmneach é).

In CQL, freagraíonn gach péire de lúibíní cearnacha [...] d’fhocal amháin. Taobh istigh de gach péire lúibíní cearnacha, déanann tú cur síos ar na critéir a chaithfidh an focal sin a chomhlíonadh, bunaithe ar aitreabúidí an fhocail: an leama, an chlib gramadaí, agus mar sin de.

Aitreabúidí an fhocail

Seo iad na haitreabúidi ar féidir leas a bhaint astu taobh istigh de na lúibíní cearnacha.

Tá na haitreabúidí sin cásíogair. Chun cuardach a dhéanamh go neamh-chásíogair, tá na haitreabúidí seo le fáil:

SAMPLA

Sloinn rialta in CQL

Is féidir siombailí speisialta ar a dtugtar sloinn rialta a úsáid taobh istigh de na comharthaí athfhriotail. Cuideoidh na siombailí seo leat focail a aimsiú a bhfreagraíonn a n-aitreabúidí do phatrúin áirithe.

Siombail amháin atá úsáideach is ea an lánstad . a sheasann do charachtar ar bith.

SAMPLA

Má dhéanann tú cuardach ar [lemma="ma."], aimseoidh tú focail a bhfuil trí charachtar ina n-aitreabúid leamma:

  1. ar dtús, m
  2. ina dhiaidh sin, a
  3. agus ar deireadh, carachtar ar bith

Torthaí: mac, mag, mar agus eile

Siombail eile atá úsáideach is ea an comhartha ceiste ? a chuireann in iúl go bhfuil an carachtar roimpi roghnach.

SAMPLA

Má dhéanann tú cuardach ar [word="ch?eist"], aimseoidh tú focail a bhfuil an méid seo ina n-aitreabúid word:

  1. ar dtús, c
  2. ina dhiaidh sin, go roghnach, h
  3. agus ar deireadh, eist

Torthaí: ceist agus cheist

Siombail eile fós atá úsáideach freisin is ea an réiltín * a sheasann do líon ar bith den charachtar roimhe.

SAMPLA

Má dhéanann tú cuardach ar [word="geal*ta"], aimseoidh tú focail a bhfuil an méid seo ina n-aitreabúid word:

  1. ar dtús, gea
  2. ina dhiaidh sin, líon ar bith (náid san áireamh) de l
  3. agus ar deireadh, ta

Torthaí: geata, gealta, geallta

Is féidir an dá shiombail seo, an lánstad agus an réiltín, a chur le chéile .*, rud a sheasann do líon ar bith de charachtar ar bith.

SAMPLA

Má dhéanann tú cuardach ar [lemma="ceist.*"], aimseoidh tú focail a bhfuil an méid seo ina n-aitreabúid lemma:

  1. ar dtús, ceist
  2. agus ar deireadh, líon ar bith (náid san áireamh) de charachtar ar bith

Torthaí: ceist, ceistneoir, ceistiúchán agus eile

Níl sa mhéid seo ach blaiseadh den mhéid is féidir a dhéanamh le sloinn rialta. Chun tuilleadh a fhoghlaim, léigh an t-alt Sloinn rialta sa chuardach.

Meaitseáil dhiúltach

Is féidir != a úsáid in ionad = chun focail a aimsiú nach bhfuil aitreabúid faoi leith acu.

SAMPLA

[lemma="cuir"] [lemma!="ceist"]

Míniú: tá tú ag lorg sraith dhá fhocal:

  1. Is focal den leama cuir an chéad fhocal.
  2. Is focal de leama eile seachas ceist an dara focal.

Teaglaimí de chritéir

Taobh istigh de gach péire lúibíní cearnacha, is féidir níos mó ná critéar amháin a lua, agus iad a cheangal leis na cónaisc & agus |.

Ciallaíonn & “agus”: caithfear an chritéar roimhe agus an chritéar na dhiaidh a chomhlíonadh.

SAMPLA

[lemma="inis" & tag="V.*"]

Míniú: tá tú ag lorg focal a bhfuil an leama inis aige agus clib dar tús V (is é sin, briathar).

Ciallaíonn | “nó”: caithfear an chritéar roimhe an chritéar na dhiaidh ( an dá cheann) a chomhlíonadh.

SAMPLA

[lemma="fear" | lemma="bean"]

Míniú: tá tú ag lorg focal a bhfuil an leama fear an leama bean aige.

Is féidir critéir chasta a chumadh ach lúibíní cuara a thabhairt isteach.

SAMPLA

[(lemma="inis" | lemma="oileán") & tag="N.*"]

Míniú: tá tú ag lorg focal a bhfuil an leama inis an leama oileán aige, agus a bhfuil clib dar tús N aige (is é sin, ainmfhocal).

Líon na bhfocal

De ghnáth, bíonn gach péire de lúibíní cearnacha [...] ag freagairt d’fhocal amháin sa toradh cuardaigh. Is féidir sin a athrú le lúibíní catacha {...}.

SAMPLA

[tag="V.*"]{2}

Míniú: tá tú ag lorg sraith dhá fhocal a bhfuil a gclib ag tosú le V – is é sin, dhá bhriathar i ndiaidh a chéile.

Is ionann é seo agus [tag="V.*"] [tag="V.*"]

SAMPLA

[word=".*ach"]{2,4}

Míniú: tá tú ag lorg sraith focal ina bhfuil dhá fhocal, trí fhocal nó ceithre fhocal i ndiaidh a chéile a chríochnaíonn le ach.

Is féidir {2,4} a léamh mar “dhá cheann ar laghad, ceithre cinn ar a mhéad”.

Tá sé seo áisiúil go háirithe i dteannta le [] a chiallaíonn “focal ar bith”:

SAMPLA

[lemma="cuir"] []{0,3} [lemma="ceist"]

Míniú: tá tú ag lorg sraith focal ina bhfuil:

  1. focal dar leama cuir
  2. ansin suas le trí cinn d’fhocal ar bith
  3. ansin focal de leama ceist

An cuardach a theorannú d’abairt amháin

Tarlaíonn sé uaireanta go bhfaigheann tú toradh ar do chuardach a shíneann ar feadh dhá abairt.

SAMPLA

[lemma="ceist"] []{0,10} [lemma="freagra"]

Na torthaí a gheohaidh tú ar an iarratas seo, beidh cuid acu sínte ar feadh dhá abairt: an chéad fhocal in abairt amaháin agus an focal deireanach sa chéad abairt eile.

Má tá tú ag féachaint ar na torthaí cuardaigh sa leagan amach Comhchordacht, feicfidh tú go bhfuil teorainneacha abairtí marcáilte leis na siombailí <s> (= tús abairte) agus </s> (= deireadh abairte).

Chun an cuardach a theorannú do thorthaí atá taobh istigh d’abairt amháin, cuir an clásal within <s/> ag deireadh an iarratais. Cuireann an clásal sin in iúl go gcaithfí an patrún iomlán a mheaitseáil taobh istigh d’aon bhloc amháin atá marcáilte le <s> agus </s>.

SAMPLA

[lemma="ceist"] []{0,10} [lemma="freagra"] within <s/>

An gaol idir cuardach casta agus cuardach simplí

Dúradh ag tús an ailt seo go bhfuil difriocht amháin idir an cuardach simplí agus an cuardach casta: sa chuardach simplí, is féidir focal Gaeilge ar bith a scríobh isteach, agus déanfaidh an t-inneall cuardaigh iarracht a thuiscint cad atá uait agus freagra éigin a thabhairt air sin.

Cén dóigh a ndéanann an t-inneall cuardaigh é sin? Taobh thiar de na cúirtíní, aistrítear gach cuardach simplí go CQL agus, i ngan fhios don úsáideoir, déantar an cuardach in CQL.

SAMPLA

Má tá tú sa chuardach simplí agus má dhéanann tú cuardach leathan ar fhocal amháin, mar shampla cruinn, aistrítear é go dtí an t-iarratas seo CQL:

[lc="cruinn"|lemma_lc="cruinn"]

Is é sin, déantar cuardach (neamh-chásíogair) ar gach focal a bhfuil foirm an fhocail nó leama an fhocal cothrom le cruinn.

SAMPLA

Más cuardach cúng atá á dhéanamh agat ar cruinn, seo an CQL a chuardaítear taibh thiar de na cúirtíní:

[lc="cruinn"]

Is é sin, déantar cuardach (neamh-chásíogair) ar gach focal a bhfuil foirm an fhocail (beag beann ar an leama) cothrom le cruinn.

Má tá tú ar leathanach torthaí cuardaigh sa chuardach simplí, is féidir leat an t-iarratas CQL atá taobh thiar den chuardach sin a fheiceáil uair ar bith ach cliceáil ar an nasc Cuardach casta atá ar thaobh an bhosca cuardaigh. Tabharfar chuig an gcuardach casta thú, áit a ndéanfar cuardach ar an iarratas CQL céanna.