Tricead fhaclan Gàidhlig

Nuair a bha sinn ag obair air Adaptxt, an gleus a bheir dhut teacsadh ro-innseach air fònaichean Android, b’ fheudar dhuinn rannsachadh a dhèanamh air tricead nam faclan Gàidhlig. Thàinig rud às a tha car coltach ri seo:

36451 a
20934 an
13882 air
12409 na
10009 tha
9602 agus
7180 ann
5086 gu
4434 e
4235 airson
4004 o
3841 am
3408 seo
3133 le
3014 aig
2757 gàidhlig
2720 is
2621 bha
2439 do
2354 mu
2353 ri
2280 mar
2265 de
2137 mi
2034 iad
2034 nan
1961 anns
1782 bho
1737 eile
1704 bhith
1654 bheil
1594 sin
1559 chaidh
1472 sinn

Tha an àireamh ag innse dè cho tric ’s a nochd facal (chan e lemma) ann an corpas-lìn Gàidhlig. Tha sinn ’ga thoirt seachad an-seo air teans ’s gum bi e feumail do dhaoine eile cuideachd.

Puing no dhà mu dhèidhinn:

  • ’S ann air Gàidhlig sgrìobhte air an lìon a tha seo stèidhichte agus leis a sin, tha e “claon” mar a bhios gach corpas mar sin a tha stèidhichte air cànan sgrìobhte (seach feadhainn a tha stèidhichte air cainnt). Mar eisimpleir, tha am facal pàrlamaid a’ nochdadh nas trice na bhiodh dùil ann an còmhradh.
  • Tha seo a’ cunntas cruthan eadar-dhealaichte, chan ann lemmata. ’S ciall dha sin gu bheil (mar eisimpleir) an dà chuid gàidhlig agus ghàidhlig a’ nochdadh san liosta. Tha feumail agus neo-fheumail. Tha e feumail leis gu bheil e ag innse dhut dè cho tric ’s a tha gach cruth (m.e. gu bheil chaidh nas cumanta na deach) ach chan eil e ag innse dhut dè cho cumantas ’s a tha gach cruth dhen ghnìomhair rach, can.
  • Mus do rinn sinn cunntas, chleachd sinn an dearbhair-litreachaidh gus faclan mearachdadh agus faclan Beurla a thoirt air falbh. Leis a sin, chan eil faclan mar Coop a’ nochdadh ann ged a nochdas iad ann an cainnt no sgrìobhadh Gàidhlig.

Tha am faidhle an-seo (’s e LibreOffice as fhearr a dh’fhosglas e).

Fàg freagairt

Cha dèid an seòladh puist-dhealain agad fhoillseachadh.

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Pin It on Pinterest