-
Notifications
You must be signed in to change notification settings - Fork 0
/
sonrai.html
148 lines (138 loc) · 7.59 KB
/
sonrai.html
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
<h2>Rialacha fleiscínithe don Ghaeilge</h2>
<p>
Gheobhaidh tú cur síos garbh ar an algartam fleiscínithe in TeX ar
<a target="_blank" href="https://en.wikipedia.org/wiki/TeX#Hyphenation_and_justification">an leathanach Vicipéide seo</a> (i mBéarla),
agus is féidir leat na mionsonraí go léir a fháil ó
<a target="_blank" href="https://tug.org/docs/liang/liang-thesis.pdf">thráchtas PhD Frank Liang</a>, áit a ndearnadh cur síos ar an algartam i dtús báire.
</p>
<p>
Seo ceithre cinn de na 6000+ riail sa gcomhad Gaeilge:
<pre>
al3i
a6ll
al2ann
geal5a
</pre>
Go bunúsach, cuireann na ré-uimhreacha (2,4,6) cosc ar fhleiscín ag an bpointe
atá i gceist, agus ceadaíonn corruimhreacha (1,3,5) fleiscín ag an bpointe sin.
Tá éifeacht níos láidre ag na huimhreacha níos mó.
Ceadaíonn an chéad riail <code>al3i</code> fleiscín tar éis an “l”
i bhfocail ar nós <i>béaliata</i> nó <i>galinneall</i>.
Cuireann an dara riail cosc láidir ar fhleiscín roimh an “ll”
i bhfocail ar nós <i>timpeallacht</i> nó <i>fealltóir</i>.
Cuireann an tríú riail cosc (lag) ar fhleiscín tar éis an “l”
i bhfocail ar nós <i>bialann</i> nó <i>dialann</i>.
Ach tabhair faoi deara gur féidir an riail seo a chur i bhfeidhm
ar an mbriathar <i>gealann</i> freisin, rud a chuirfeadh cosc ar fhleiscín
úsáideach (<i>geal-ann</i>),
ach ar an dea-uair, ceadaíonn an cheathrú riail fleiscín
ag an bpointe céanna (toisc go bhfuil 5 níos mó ná 2).
</p>
<p>
Baineann riail ghinearálta amháin leis an séimhiú:
níor chóir focal a bhriseadh riamh idir consan séimhithe
agus an “h” ina dhiaidh.
Dá bharr seo, feicfidh tú rialacha ar nós
<code>c2h</code> agus <code>d2h</code>
sa gcomhad. Ar an taobh eile, má tá “h” i ndiaidh guta nó
consan doshéimhithe (l,n,r), is féidir fleiscín a chur san áit de ghnáth,
mar shampla <i lang="ga">Bói-héam-ach</i> nó <i lang="ga">Faran-haít</i>.
Sin an fáth a bhfuil rialacha
<code>i1h</code>, <code>n5h6a</code>, srl. ann.
</p>
<p>
Riail ghinearálta eile: i gcás focal coimrithe, is féidir fleiscín a chur
isteach ag pointe an choimrithe; m.sh.
<i lang="ga">ciog-al</i> agus <i lang="ga">ciog-lach</i>.
</p>
<hr>
<h2>Torthaí</h2>
<p>
Tá na rialacha seo bunaithe ar mhoirfeolaíocht na Gaeilge seachas ar
fhóineolaíocht na Gaeilge (mo rogha phearsanta).
Uaireanta, ní aontaíonn siad leis na fleiscíní
a fheictear i leabhair phriontáilte dá bharr seo.
Mar shampla:
<p>
<table lang="ga" class="fleiscin">
<tr><th>Na rialacha seo</th> <th>Corpas</th></tr>
<tr><td>Ceilt-each</td> <td>Ceil-teach</td></tr>
<tr><td>siosc-adh</td> <td>sios-cadh</td></tr>
<tr><td>craic-eann</td> <td>crai-ceann</td></tr>
<tr><td>ceann-aithe</td> <td>cean-naithe</td></tr>
<tr><td>tuairt-eáil</td> <td>tuair-teáil</td></tr>
<tr><td>comh-alta</td> <td>com-halta</td></tr>
</table>
<p>
Ar ndóigh tá an sampla deireanach seo uafásach ar fad.
</p>
<hr>
<h2>Fadhbanna agus focail dhébhríocha</h2>
<p>Nuair is gá fleiscín a chur san fhocal Béarla “record”, braitheann
sé ar an gcomhthéacs (briathar <i>re-cord</i> vs. ainmfhocal <i>rec-ord</i>).
Toisc gur lean mé struchtúr moirfeolaíoch na Gaeilge
go cúramach, tá roinnt samplaí débhríocha (agus greannmhara)
ann sa mbunachar sonraí.
Den chuid is mó is focail nó foirmeacha as an ngnáth iad,
an saorbhriathar gnáthchaite go minic.
</p>
<ul>
<li><i lang="ga">bhrach-taí</i> “used to be fermented” (stoc leathan) vs. <i lang="ga">bhracht-aí</i> “sappiest”</li>
<li><i lang="ga">cháint-í</i> “most critical” (gan fleiscín) vs. <i lang="ga">cháin-tí</i> “used to be taxed”</li>
<li><i lang="ga">Cheilt-í</i> “most Celtic” (gan fleiscín) vs. <i lang="ga">Cheil-tí</i> “used to be concealed”</li>
<li><i lang="ga">chist-í</i> “treasures” (gan fleiscín) vs. <i lang="ga">chis-tí</i> “used to be handicapped”</li>
<li><i lang="ga">gcoirtí</i> “may you tan” (gan fleiscín) vs. <i lang="ga">gcoir-tí</i> “used to be worn out”</li>
<li><i lang="ga">chreataí</i> “used to be shaken” (gan fleiscín) vs. <i lang="ga">chreat-aí</i> “shakiest”</li>
<li><i lang="ga">doir-tear</i> “breeds” vs. <i lang="ga">doirt-ear</i> “spills”</li>
<li><i lang="ga">fhuad-ar</i> “bustle” vs. <i lang="ga">fhua-dar</i> “they sewed”</li>
<li><i lang="ga">fhuaf-ar</i> “odious” vs. <i lang="ga">fhua-far</i> “one will sew”</li>
<li><i lang="ga">ghais-tí</i> “used to gush” vs. <i lang="ga">ghaist-í</i> “traps” (no hyphen)</li>
<li><i lang="ga">gheal-taí</i> “used to be brightened” vs. <i lang="ga">ghealt-aí</i> “lunatics”</li>
<li><i lang="ga">ghor-taí</i> “used to be incubated” vs. <i lang="ga">ghort-aí</i> “may you injure”</li>
<li><i lang="ga">na haist-í</i> “hatches” (gan fleiscín) vs. <i lang="ga">na hais-tí</i> “essays”</li>
<li><i lang="ga">lé-amar</i> “we read” (aimsir chaite) vs. <i lang="ga">léam-ar</i> “lemur”</li>
<li><i lang="ga">luad-ar</i> “movement” vs. <i lang="ga">lua-dar</i> “they mentioned”</li>
<li><i lang="ga">meat-aí</i> “most perishable” vs. <i lang="ga">mea-taí</i> “used to waste”</li>
<li><i lang="ga">réalt-aí</i> “stars” vs. <i lang="ga">réal-taí</i> “used to be developed”</li>
<li><i lang="ga">ríf-ear</i> “reefer” (Foclóir Collins Gem) vs. <i lang="ga">rí-fear</i> “will tighten”</li>
<li><i lang="ga">shá-dar</i> “they stabbed” vs. <i lang="ga">shád-ar</i> “solder”</li>
<li><i lang="ga">Shá-imis</i> “we stab” vs. <i lang="ga">Sháim-is</i> “Sami language”</li>
<li><i lang="ga">shá-faí</i> “one would stab” vs. <i lang="ga">sháf-aí</i> “ax handle” (genitive)</li>
<li><i lang="ga">speal-ta</i> “mowed” vs. <i lang="ga">spealt-a</i> “milt” (ginideach, gan fleiscín)</li>
<li><i lang="ga">thiom-áin-tí</i> “used to be driven” vs. <i lang="ga">thiom-áint-í</i> “drives”</li>
</ul>
<p>
Chuir mé na focail seo laistigh de bhloc
<code>\hyphenation{}</code> sna rialacha, sa chaoi nach ndéanfaidh TeX
fleiscíniú mícheart orthu.
</p>
<p>
Baineann deacracht eile le focail ar nós
<i lang="ga">bainte</i>, ar féidir anailís a dhéanamh orthu
mar aidiachtaí briathartha (m.sh. <i lang="ga">bain+te</i>)
nó mar ainmfhocail sa ghinideach (m.sh. <i lang="ga">baint+e</i>).
Tá an deacracht chéanna ann
san iolra (<i lang="ga">bhaint+í</i>) vs.
an saorbhriathar gnáthchaite (<i lang="ga">bhain+tí</i>).
Ceadaíonn na rialacha sa leagan is déanaí fleiscíniú mar
aidiacht bhriathartha.
Seo roinnt focal eile den sórt céanna:
<i lang="ga">athoscailte, bainte, ceilte, cigilte, coigilte, cuimilte,
deighilte, déroinnte, diomailte, dúbailte, easmailte, eitilte,
fóinte, foroinnte, fuascailte, meilte, múscailte, oscailte, roinnte,
satailte, streachailte, tochailte, tomhailte, tríroinnte, tuirlingte</i>.
Tarlaíonn an débhríocht seo i gcásanna eile “trí thimpiste”:
<i lang="ga">ciste</i> (<i lang="ga">cist</i>=“a cyst”), <i lang="ga">coirte</i> (<i lang="ga">coirt</i>=“tree bark”),
<i lang="ga">deilte</i> (<i lang="ga">deilt</i>=“delta”), <i lang="ga">feilte</i> (<i lang="ga">feilt</i>=“felt”)
Is sampla sa tríú díochlaonadh é an t-ainmfhocal <i lang="ga">cruacht(a)</i>.
</p>
<p>
Tá fabhtanna ann freisin, ach is fíorannamh iad:
ní dhéanann na rialacha i leagan 1.0
<em>aon</em> fhleiscín nach bhfuil sa mbunachar
sonraí, agus níl ach deich gcinn as 314,639
sa mbunachar sonraí nach féidir leo a dhéanamh.
Ní hé sin le rá nach bhfaighidh tú aon drochfhleiscíní,
ach gur ar an mbunachar sonraí an locht seachas ar an
algartam a chruthaigh na rialacha.
</p>