Líonra Séimeantach na Gaeilge:
Baile
Kevin P. Scannell
Achoimre
Seo é leathanach baile Líonra Séimeantach na Gaeilge ("LSG" mar ghiorrúchán, nó, as Béarla, The Irish Language Semantic Network), bunachar sonraí ina bhfuil focail Ghaeilge agus gaolta séimeantacha eatarthu. Uaireanta tugtar wordnet ar líonra séimeantach den chineál seo, ainmnithe as an WordNet Béarla a forbraíodh sna 1980í in Ollscoil Princeton, S.A.M. Ba é sin an chéad líonra séimeantach cuimsitheach i dteanga ar bith. Tabhair faoi deara go bhfuil líonra séimeantach i bhfad níos saibhre ná "teasáras" traidisiúnta ina bhfuil focail chomhchiallacha agus, b'fhéidir, focail fhrithchiallacha. Ach tá gaolta níos saibhre ar fáil i LSG (agus i líonraí séimeantacha eile), mar shampla hipearainmneacha agus hiopainmneacha (téarmaí níos leithne/níos cúinge) míorainmneacha agus holainmneacha (páirt vs. iomlán), srl.
Is féidir líonraí séimeantacha a úsáid i raon leathan feidhmchlár a bhaineann le Próiseáil Teangacha Nádúrtha. Úsáidtear iad i gcórais imdhealaithe athbhríochta, achoimriú agus innéacsú de cháipéisí, agus aisfháil faisnéise. Nuair atá na focail i líonra áirithe nasctha le focail i dteanga eile (nascanna le Béarla atá i LSG), is féidir an líonra a úsáid chun córas ríomhaistriúcháin a fheabhsú. Go ginearálta, ó dhearcadh na hintleachta saorga, stórálann líonra séimeantach roinnt eolais faoin saol mór atá de dhíth ar ríomhairí chun téacsanna a thuiscint agus a phróiseáil ar bhealach fiúntach.
Ar an taobh clé den leathanach seo, feicfidh tú íomhá bheag den líonra ina iomláine (cliceáil chun leagan lánmhéide a fheiceáil). Mar a tharlaíonn, íomhá shimplithe atá ann — seasann gach nód san íomhá do chnuasach d'fhocail chomhchiallacha ab fhéidir cur leis an íomhá mar chraobhacha breise. Rud éigin cosúil leis an líonra seo, ach níos mó agus níos casta faoi mhílte is dócha, atá neadaithe in inchinn gach cainteora Gaeilge — déantar nascanna séimeantacha den chineál seo go hinstinneach agus ar bhuille boise. Leis an mbrabhsálaí tríthoiseach (féach thíos), is féidir leat "eitilt" tríd an líonra agus é a láimhseáil ar bhealaí éagsúla.
Íosluchtú
Fiú mura bhfuil suim agat i mbogearraí a dhéanann próiseáil ar theangacha nádúrtha, seans go mbainfidh tú úsáid as an mbunachar sonraí mar sin féin, agus dá bhrí seo tugaim rochtain air ar bhealaí éagsúla:- Mar "theasáras" saibhrithe, i bhfoirm PDF. Tabhair faoi deara go bhfuil gach focal sa teasáras ina chrostagairt hipearnaisc. Is féidir an comhad PDF (beagnach 50MB!) a íosluchtú go díreach, is é sin nó na foinsí LaTeX a fháil más mian leat an PDF a thógáil duit féin (mar shampla le clófhoirne eile). Ba chóir duit an comhad a shábháil go logánta ar do ríomhaire chun bandaleithead a choigilt.
- Mar chuid den fheidhmchlár saor in aisce OpenOffice.org. Is féidir an líonra a shuiteáil go díreach ón fheidhmchlár féin leis an treoraí (nó "draoi") "Install new dictionaries..." ("Suiteáil foclóirí nua..." sa leagan breá Gaeilge). Nó, ina áit sin, íosluchtaigh an comhad ZIP ina bhfuil sonraí an teasárais agus cuir é isteach de láimh. Seo é pictiúr den teasáras ar obair.
- Mar bhrabhsálaí nua-aoiseach tríthoiseach, faoi óstaíocht aimsigh.com.
- I bhformáid RDF-XML is féidir a úsáid ó ríomhchláir eile. Déan teagmháil liomsa má tá suim agat san fhormáid seo.
Sainghnéithe
- Bunachar sonraí cuimsitheach. Tá 32742 bunchiall, 36262 ceannfhocal agus 77596 ciall ar leith ann, le téarmaíocht chomhaimseartha, focail liteartha, focail chanúnacha, béarlagair, srl. san áireamh.
- Saorcheadúnas. Cosúil le WordNet Princeton (ach, faraor, neamhchosúil leis an gcuid is mó de líonraí séimeantacha eile), is saorbhogearra é LSG. Go sonrach, tá na sonraí go léir, an teasáras PDF san áireamh, ar fáil de réir coinníollacha an GNU Free Documentation License. Tugann an ceadúnas seo saoirse duit — saoirse na sonraí a chóipeáil nó a dháileadh, athraithe nó gan athrú, chomh fada is a dháileann tú iad faoin cheadúnas céanna.
- Nascanna le Béarla. Tá gach iontráil i LSG nasctha le cnuasach d'fhocail chomhchiallacha ("a synset") i WordNet Princeton. Is cuid thábhachtach é seo i m'obair ar ríomhaistriúchán idir Béarla agus An Ghaeilge, tionscadal atá idir lámha fós.
- Nuashonraithe go minic. Déanfaidh mé nuashonrú ar an líonra go rialta agus nuair a bheidh ceartúcháin agus feabhsúcháin le déanamh. Sa chaoi seo, is féidir cumhacht na Gaeilge mar theanga bheo a thaispeáint, trí téarmaíocht agus frásaí nua a chur leis.
- Foclóir comhroinnte. Úsáidim bunachar sonraí aonair chun LSG, litreoirí GaelSpell, agus An Gramadóir a chruthú. Nuair a fheabhsaítear an foclóir i dtionscadal amháin, téann na tionscadail eile i bhfeabhas freisin, go huathoibríoch.
© Cóipcheart 2007 Kevin P. Scannell