Corpas Monatóireachta na Gaeilge
Is éard atá i gCorpas Monatóireachta na Gaeilge (CMG) ná milliún focal in aghaidh na bliana ón tréimhse 2000–2024. Tiomsaíodh an milliún focal in aghaidh na bliana as seánraí inar foilsíodh ábhar Gaeilge chuile bhliain i gcaitheamh na tréimhse e.g. ábhar nuachta, litríocht, agus reachtaíocht. Fágann sé seo go bhfuil 25 milliún focal sa leagan reatha de CMG. Cuirfear milliún focal breise leis in 2025.
Cuireann CMG ar ár gcumas athruithe in úsáid agus i stór focal na teanga a aithint agus a scrúdú. Is féidir, mar shampla, cén bhliain inar úsáideadh focail áirithe den chéad uair a fheiceáil dála 'Breatimeacht' agus 'podchraoladh'. Nó is féidir an borradh nó an maolú atá tar éis teacht ar úsáid focal agus frásaí áirithe thar an tréimhse a rianú, e.g. 'tithíocht', 'cúlú eacnamaíochta'. Bíonn amlíne le feiceáil os cionn liosta na dtorthaí a léiríonn minicíocht an fhocail nó an fhrása ó bhliain go bliain ó 2000 i leith.
Gineadh CMG ó Chorpas Náisiúnta na Gaeilge ar an mbealach seo a leanas:
- Ríomhadh an líon focal in CNG in aghaidh na bliana, ag comhaireamh ar a mhéad 2,000 focal in aghaidh an doiciméid. Níor áiríodh doiciméid gan dáta beacht.
- Bunaithe ar an líon focal sin, oibríodh amach an cóimheas de réir seánra (e.g. oideachas, nuacht, litríocht) atá in CNG don bhliain, ag comhaireamh ar a mhéad 2,000 focal in aghaidh an doiciméid. Ar an meán, rinneadh sampláil ar 1,372 doiciméad éagsúil in aghaidh na bliana.
- Bunaithe ar an gcóimheas sin, ríomhadh uaslíon focal do CMG le haghaidh gach seánra don bhliain, le go suimfeadh an t-iomlán suas go milliún focal.
- Cuireadh na comhaid do gach seánra in ord randamach, agus ansin seánra ar sheánra, tógadh idir 100 agus c.2,000 focal ó dheireadh gach comhad ceann ar cheann, go dtí gur baineadh an t-uaslíon focal don seánra amach.
- Rinneadh an méid sin le haghaidh gach bliain ó 2000 ar aghaidh.
- Tá 2000–2024 (25 bliain / 25m focal) san áireamh sa leagan reatha de CMG. NB: Tá 2024 bunaithe ar shonraí ó R1-2 amháin.