This page is archived for historical purposes and is no longer being maintained or updated

Η Ελληνική Λέξη

Περιεχόμενα Σελίδας
  1. Επισκόπηση,
  2. Ο τρόπος ανάλυσης,
  3. Ευρήματα,
  4. Μονάδες-ήχου,
  5. Μέρη-συλλαβής,
  6. Συλλαβές,
  7. Ακουλουθίες-συμφώνων,
  8. Αξιολόγηση,
  9. Χρησιμότητα,
ΕΠΙΣΚΟΠΗΣΗ:
Με το WordForms Applet, πέρυσι (2001), προσπάθησα να δείξω το μηχανισμό ΚΛΙΣΗΣ των λέξεων που χρησιμοποιεί η γλώσσα μας στη δημιουργία του λόγου. Ο στόχος μου τώρα ήταν να βρώ το μηχανισμό ΔΗΜΙΟΥΡΓΙΑΣ λέξεων. Για το σκοπό αυτό πήρα ένα δείγμα 11.377 λέξεων και το ανέλυσα. Το δείγμα το πήρα από τις έννοιες που έχω προσωπικά καταχωρημένες στο κομπιούτερ μου και από ηλεκτρονικά άρθρα διαφόρων θεμάτων, κυρίως από "ΤΟ ΒΗΜΑ της Κυριακής". Με την πληροφορία που συγκέντρωσα, έφτιαξα το GWCreator Applet. Τα αποτελέσματα αυτού του προγράμματος δείχνουν και την ποιότητα της γνώσης μου για το μηχανισμό δημιουργίας λέξεων της Ελληνικής γλώσσας.
---
Ο ΤΡΟΠΟΣ ΑΝΑΛΥΣΗΣ:
Πρώτα, έκανα το συλλαβισμό του δείγματος με regular-expression's search/replace. Μετά με διαδοχικές εκτελέσεις ενός προγράμματος που έφτιαξα, έβρισκα τις καινούργιες συλλαβές που χρησιμοποιεί η γλώσσα και συγχρόνως μου έβρισκε τη προφορική μορφή των λέξεων. Τέλος με άλλα προγραμματάκια (όλα γραμμένα σε Java) βρήκα τη συχνότητα των συλλαβών, των μερών των συλλαβών και των ήχων της γλώσσας.

Για το συλλαβισμό χρησιμοποίησα με ΣΥΝΕΠΕΙΑ τον παρακάτω ορισμό:
Συλλαβή (προφορική) είναι το ΜΕΡΟΣ ΛΕΞΗΣ που αποτελείται από:
α) ΕΝΑ φωνήεν που έχει
β) αριστερά του, την ακολουθία συμφώνων που προηγούνται και με τα οποία αρχίζει ελληνική λέξη και
γ) δεξιά του, την ακολουθία συμφώνων που έπονται και μένουν απο την αφαίρεση αυτών με τα οποία αρχίζει ελληνική λέξη (που ανήκουν στην επόμενη συλλαβή) ή όποια τελικά σύμφωνα υπάρχουν.
π.χ. α-νε-ξάρ-τη-τος, βο-η-θά-ω.
Κάθε ακολουθία φωνηέντων, ανεξάρτητα από το πόσο ΓΡΗΓΟΡΑ την προφέρουμε, θεωρώ ότι είναι διαφορετικές συλλαβές.
Τον ορισμό αυτό των προφορικών-συλλαβών χρησιμοποίησα και για τις γραπτές-λέξεις.
---
ΕΥΡΗΜΑΤΑ:
ΠΑΡΑΜΕΤΡΟΣ ΠΟΣΟΤΗΤΑ
ΣΥΝΟΛΟ ΛΕΞΕΩΝ 11.377
Λέξεις 1σύλλαβες 230
Λέξεις 2σύλλαβες 2.118
Λέξεις 3σύλλαβες 3.270
Λέξεις 4σύλλαβες 3.048
Λέξεις 5σύλλαβες 1.843
Λέξεις 6σύλλαβες 656
Λέξεις 7σύλλαβες 165
Λέξεις 8σύλλαβες 38
Λέξεις 9σύλλαβες 9
ΣΥΝΟΛΟ ΣΥΛΛΑΒΩΝ 41.159
Συλλ. μοναδικές 1.207/1794
Συλλ. αρχικές 709/923
Συλλ. μεσαίες 498/805
Συλλ. τελικές 684/955
ΜΕΡΗ ΣΥΛΛΑΒΩΝ 134
Μέρη-Συλλ. αρχικά 53
Μέρη-Συλλ. μεσαία 5
Μέρη-Συλλ. τελικά 111
ΣΥΝΟΛΟ ΜΟΝΑΔΩΝ-ΗΧΟΥ 88.204
Μονάδες ήχου 31
Γράμματα 24

---
ΜΟΝΑΔΕΣ-ΗΧΟΥ:
Από τις 88.204 μονάδες-ήχου των λέξεων βρήκα τις παρακάτω συχνότητες:
ΜΟΝΑΔΑ-ΗΧΟΥ ΠΟΣΟΤΗΤΑ ΣΥΧΝΟΤΗΤΑ
I (ι) 13534 15,34
A (α) 9733 11,03
O (ο) 8996 10,2
S (σ) 7804 8,85
E (ε) 7244 8,21
R (ρ) 4823 5,47
T (τ) 4781 5,42
K (κ) 4566 5,18
N (ν) 4415 5,01
P (π) 3555 4,03
M (μ) 3272 3,71
L (λ) 2764 3,13
Δ (δ) 1753 1,99
U (ου) 1651 1,87
F (φ) 1597 1,81
Y (γ) 1506 1,71
Q (θ) 1162 1,32
V (β) 1133 1,28
H (χ) 1109 1,26
Z (ζ) 926 1,05
D (ντ) 831 0,94
B (μπ) 301 0,34
G (γκ) 289 0,33
YY (γι) 257 0,29
LL (λι) 57 0,06
KK (κι) 47 0,05
NN (νι) 46 0,05
HH (χι) 23 0,03
SS (σι) 20 0,02
ZZ (ζι) 6 0,01
GG (γκι) 3 0
ΣΥΝΟΛΟ 88.204 100

1η ΠΑΡΑΤΗΡΗΣΗ: Η συχνότητα των ήχων για τα οποία η γλώσσα δεν έχει γράμματα πέφτει κάτω από το 1%.
2η ΠΑΡΑΤΗΡΗΣΗ: Οι ήχοι που δεν έχουν γράμματα, δεν είναι όλοι ΦΩΝΗΜΑΤΑ και άλλοι σε άλλες περιπτώσεις είναι και σε άλλες δεν είναι. (Φώνημα είναι ο ήχος που γίνεται αντιληπτός στη δήλωση διαφορετικών εννοιών, πχ τα φ/β στις λέξεις φάρος/βάρος.)
B μπουρί-πουρί, D ντάμα-τάμα, G γκάρα-κάρα,
HH χιόνι /HHO1NI/ - χώνει /HO1NI/,
YY γυάλα /YYA1LA/ - γάλα /YA1LA/,
KK κακιά /KAKKA1/ - κακά /KAKA1/,
GG
NN νιάτα /NNA1TA/ - νά'τα /NA1TA/, /NNI1KOS/ = /NI1KOS/ = Νίκος,
LL μίλια /MI1LLA/ - μήλα /MI1LA/, /KALLE1S/ = /KALE1S/ = καλές,
SS σιάζω /SSA1ZO/ = σάζω /SA1ZO/,
ZZ
3η ΠΑΡΑΤΗΡΗΣΗ: Τους ήχους /TS/ και /DZ/ τους θεώρησα σύνθετους, ενώ άλλοι τους θεωρούν σαν μονάδες-ήχου. Πάντως πιστεύω ότι δεν μπορούμε τον ένα να τον θεωρήσουμε μονάδα και τον άλλο σύνθετο. Η γνώμη σας για το θέμα είναι ευπρόσδεκτη.
---
ΜΕΡΗ ΣΥΛΛΑΒΗΣ:
Τα διαφορετικά μέρη-συλλαβής (ONSET, PEAK, CODA) που βρήκα είναι 134 (προφορικά):
ΜΕΡΟΣ-ΣΥΛ ΣΥΝΟΛΟ ΑΡΧ-ΛΕΞ ΑΡΧ-ΣΥΛ ΜΕΣΟ-ΣΥΛ ΤΕΛ-ΣΥΛ ΤΕΛ-ΛΕΞ
I 13534 595 0 10580 0 2359
A 9733 1402 0 5634 0 1997
O 8996 313 0 7108 0 1575
E 7245 1279 0 4986 0 980
S 5438 619 1875 0 22 2922
N 4137 189 2801 0 207 940
K 3278 889 2270 0 101 18
R 3069 132 2063 0 811 63
T 2933 334 2580 0 11 8
M 2927 548 2197 0 169 13
P 2354 884 1464 0 1 5
L 2184 266 1747 0 146 25
U 1651 42 0 1262 0 347
Δ 1564 599 963 0 0 2
Y 1196 154 959 0 83 0
F 1156 274 713 0 154 15
Q 922 163 715 0 38 6
V 867 193 587 0 84 3
ST 832 131 697 0 0 4
H 740 166 562 0 7 5
D 722 47 654 0 6 15
KS 540 92 437 0 1 10
Z 533 70 450 0 4 9
PR 435 395 40 0 0 0
ZM 314 10 304 0 0 0
TR 267 124 143 0 0 0
PS 265 65 200 0 0 0
B 245 101 135 0 8 1
G 231 16 156 0 55 4
KR 209 86 123 0 0 0
PL 201 127 74 0 0 0
SK 186 71 115 0 0 0
FT 179 36 142 0 0 1
KT 173 7 165 0 0 1
YR 149 60 89 0 0 0
KL 141 64 77 0 0 0
PT 118 12 106 0 0 0
VR 107 40 67 0 0 0
SH 100 36 64 0 0 0
STR 98 36 62 0 0 0
HR 95 56 39 0 0 0
ΔR 93 25 68 0 0 0
HN 92 4 88 0 0 0
YY 89 24 65 0 0 0
FR 83 44 39 0 0 0
SP 82 46 36 0 0 0
YN 75 34 41 0 0 0
TS 75 31 40 0 1 3
QR 71 23 48 0 0 0
VL 71 21 50 0 0 0
ΔYY 70 40 30 0 0 0
SF 65 29 36 0 0 0
SQ 62 1 60 0 1 0
LL 56 8 48 0 0 0
FQ 54 13 41 0 0 0
DR 49 5 44 0 0 0
DZ 49 26 21 0 1 1
PN 48 15 33 0 0 0
YL 46 33 13 0 0 0
KK 45 5 40 0 0 0
HT 41 22 19 0 0 0
PYY 40 24 16 0 0 0
BL 35 10 25 0 0 0
GR 34 10 24 0 0 0
NN 33 3 30 0 0 0
VY 32 12 20 0 0 0
FL 28 15 13 0 0 0
HQ 27 3 24 0 0 0
ZV 25 7 18 0 0 0
TYY 21 1 20 0 0 0
KN 20 7 13 0 0 0
QN 18 1 17 0 0 0
18 2 16 0 0 0
BR 17 11 6 0 0 0
FTYY 17 14 3 0 0 0
GL 17 4 13 0 0 0
MN 13 4 9 0 0 0
HL 12 6 6 0 0 0
SS 12 3 9 0 0 0
VYY 12 9 3 0 0 0
MNN 11 4 7 0 0 0
FHH 9 3 6 0 0 0
SL 9 6 3 0 0 0
HH 8 5 3 0 0 0
SPR 8 6 2 0 0 0
8 4 4 0 0 0
RT 8 0 0 0 1 7
SKL 7 3 4 0 0 0
TSS 7 3 4 0 0 0
QHH 6 1 5 0 0 0
STYY 5 1 4 0 0 0
DZZ 4 2 2 0 0 0
SKR 4 2 2 0 0 0
RG 4 0 0 0 1 3
RS 4 0 0 0 1 3
NS 4 0 0 0 0 4
GG 3 2 1 0 0 0
SFR 3 2 1 0 0 0
SPL 3 3 0 0 0 0
TM 3 1 2 0 0 0
LS 3 0 0 0 0 3
RD 3 0 0 0 0 3
RK 3 0 0 0 0 3
BYY 2 0 2 0 0 0
HNN 2 0 2 0 0 0
RN 2 0 0 0 2 0
SKK 2 2 0 0 0 0
ZB 2 2 0 0 0 0
ZZ 2 0 2 0 0 0
MS 2 0 0 0 0 2
NG 2 0 0 0 0 2
RDZ 2 0 0 0 0 2
DV 1 1 0 0 0 0
FLL 1 0 1 0 0 0
GM 1 0 1 0 0 0
KSS 1 0 1 0 0 0
KV 1 1 0 0 0 0
KZ 1 1 0 0 0 0
LD 1 0 0 0 1 0
LTS 1 0 0 0 1 0
QL 1 1 0 0 0 0
SKN 1 1 0 0 0 0
SPYY 1 1 0 0 0 0
SR 1 1 0 0 0 0
LF 1 0 0 0 0 1
LM 1 0 0 0 0 1
NT 1 0 0 0 0 1
NTS 1 0 0 0 0 1
RF 1 0 0 0 0 1
RKS 1 0 0 0 0 1
RL 1 0 0 0 0 1
RNST 1 0 0 0 0 1
RQ 1 0 0 0 0 1
ZL 1 0 0 0 0 1
ΠΑΡΑΤΗΡΗΣΗ: Τα περισσότερα μέρη-συλλαβών με μικρή συχνότητα, ανήκουν σε ξένες λέξεις που χρησιμοποιούμε.
ΠΑΡΑΤΗΡΗΣΗ: Αν ταξινομήσουμε τον παραπάνω πίνακα ως προς τα μέρη-συλλαβών που βρίσκονται στο τέλος λέξης, βλέπουμε τον κανόνα ότι ΒΑΣΙΚΑ οι ελληνικές λέξεις τελειώνουν με τα σύμφωνα S και N.
ΜΕΡΟΣ-ΣΥΛ ΠΟΣΟΤΗΤΑ ΕΜΦΑΝΙΣΗΣ
S 2922
I 2359
A 1997
O 1575
E 980
N 940
U 347
R 63
L 25
K 18
F 15
D 15
M 13
KS 10
Z 9
T 8
RT 7
Q 6
P 5
H 5
ST 4
G 4
NS 4
V 3
TS 3
RS 3
RG 3
RK 3
RD 3
LS 3
Δ 2
RDZ 2
NG 2
MS 2
B 1
FT 1
KT 1
DZ 1
ZL 1
RQ 1
RNST 1
RL 1
RKS 1
RF 1
NTS 1
NT 1
LM 1
LF 1

---
ΣΥΛΛΑΒΕΣ:
Οι μοναδικές συλλαβές που βρήκα στο δείγμα μου είναι 1.207 προφορικές και 1794 αντίστοιχες γραπτές. Οι παραπάνω προφορικές-συλλαβές προέρχονται από τους 5 τρόπους που γράφουμε το /I/, τους 2 τρόπους που γράφουμε το /O/, το /E/, το /V/ (υ και β), το /F/ και από τα διπλά σύμφωνα. Ακολουθείστε τις επόμενες συνδέσεις (links) για να δείτε τους πίνακες με τις συλλαβές που εμφανίζονται στην ΑΡΧΗ, στη ΜΕΣΗ και στο ΤΕΛΟΣ λέξεων.
ΠΑΡΑΤΗΡΗΣΗ: Η πλειοψηφία των καθαρόαιμων ελληνικών συλλαβών τελειώνει σε φωνήεν. Επίσης επειδή έχουμε περίπου 41.000 συλλαβές και 88.000 ήχους (φωνήματα), κατά μέσο όρο κάθε συλλαβή έχει 2 φωνήματα, άρα σύμφωνο και φωνήεν.
ΠΑΡΑΤΗΡΗΣΗ: Οι περισσότερες λέξεις είναι 3/4 σύλλαβες. Βρέθηκαν λέξεις μέχρι 9 συλλαβές. Τέλος επειδή έχουμε περίπου 11.000 λέξεις και 41.000 συλλαβές, κατά μέσο όρο κάθε λέξη έχει 4 συλλαβές.
---
ΑΚΟΛΟΥΘΙΕΣ-ΣΥΜΦΩΝΩΝ:
Σημαντική πληροφορία για τη δημιουργία λέξεων είναι η γνώση της ακολουθίας-συμφώνων που υποστηρίζει η γλώσσα ανάμεσα σε 2 φωνήεντα και όχι μόνο μέσα σε συλλαβή. Η λίστα που βρήκα στο δείγμα είναι η εξής:
  1. V,
  2. VY,
  3. VYY,
  4. VΔ,
  5. VL,
  6. VR,
  7. VZM,
  8. VM,
  9. VN,
  10. Y,
  11. YΔ,
  12. YL,
  13. YN,
  14. YR,
  15. YY,
  16. YM,
  17. Δ,
  18. ΔYY,
  19. ΔR,
  20. Z,
  21. ZV,
  22. ZM,
  23. ZB,
  24. ZZ,
  25. ZY,
  26. ZΔ,
  27. ZL,
  28. ZN,
  29. Q,
  30. QL,
  31. QN,
  32. QR,
  33. QHH,
  34. QM,
  35. K,
  36. KL,
  37. KN,
  38. KR,
  39. KS,
  40. KT,
  41. KK,
  42. KV,
  43. KΔ,
  44. KQ,
  45. KM,
  46. KP,
  47. KPL,
  48. KPN,
  49. KPR,
  50. KF,
  51. KFR,
  52. L,
  53. LL,
  54. LV,
  55. LY,
  56. LΔ,
  57. LQ,
  58. LK,
  59. LKS,
  60. LM,
  61. LN,
  62. LP,
  63. LPS,
  64. LT,
  65. LTR,
  66. LTS,
  67. LF,
  68. M,
  69. MN,
  70. MNN,
  71. MV,
  72. MVR,
  73. MΔ,
  74. MZ,
  75. MK,
  76. MT,
  77. MDZ,
  78. N,
  79. NN,
  80. NΔ,
  81. NΔR,
  82. NZ,
  83. NQ,
  84. NQR,
  85. NK,
  86. NKS,
  87. NS,
  88. NST,
  89. NT,
  90. NF,
  91. NG,
  92. P,
  93. PYY,
  94. PL,
  95. PN,
  96. PR,
  97. PS,
  98. PT,
  99. R,
  100. RV,
  101. RVL,
  102. RY,
  103. RYY,
  104. RΔ,
  105. RZ,
  106. RQ,
  107. RQR,
  108. RK,
  109. RKS,
  110. RL,
  111. RM,
  112. RN,
  113. RP,
  114. RPS,
  115. RPR,
  116. RPS,
  117. RT,
  118. RH,
  119. RB,
  120. RD,
  121. RG,
  122. S,
  123. SQ,
  124. SK,
  125. SKK,
  126. SL,
  127. SP,
  128. ST,
  129. SF,
  130. SH,
  131. SKL,
  132. SKN,
  133. SKR,
  134. SPYY,
  135. SPL,
  136. SPR,
  137. STYY,
  138. STR,
  139. SFR,
  140. SS,
  141. T,
  142. TYY,
  143. TM,
  144. TR,
  145. TS,
  146. TQ,
  147. TL,
  148. F,
  149. FQ,
  150. FL,
  151. FR,
  152. FT,
  153. FTYY,
  154. FHH,
  155. FK,
  156. FN,
  157. FS,
  158. FST,
  159. FH,
  160. H,
  161. HQ,
  162. HL,
  163. HN,
  164. HR,
  165. HT,
  166. HH,
  167. HM,
  168. HP,
  169. B,
  170. BL,
  171. BR,
  172. BN,
  173. D,
  174. DR,
  175. DZ,
  176. DZZ,
  177. DL,
  178. G,
  179. GL,
  180. GR,
  181. GT,
  182. GS,
  183. GH,
  184. GHR,
  185. GG,

---
ΑΞΙΟΛΟΓΗΣΗ:
Η ανάλυσή μου με κανένα τρόπο δεν είναι τέλεια. Υπάρχουν λάθη στις λέξεις του δείγματος, στο δείγμα, στην ανάλυση, αλλά πιστεύω η ποσότητα αυτή των λαθών δεν αλλοιώνει το αποτέλεσμα. Επειδή όμως δεν έχουμε πολλές δουλειές πάνω στο θέμα αυτό, δείτε την σαν προσεγγιστική εργασία του θέματος. Με ένα μεγαλύτερο δείγμα θα είχαμε καλύτερα αποτελέσματα. Επειδή όμως το δείγμα ΔΕΝ είναι και μικρό, πιστεύω ότι δείχνει κατεύθυνση.
Όσοι βρίσκουν λάθη ή ξέρουν άλλα παραδείγματα, να με ενημερώνουν.
---
ΧΡΗΣΙΜΟΤΗΤΑ:
Την παραπάνω ανάλυση την έκανα για να καλυτερέψω τη γνώση μου για τη ελληνική-γλώσσα. Η δημοσίευσή της, μαζί με τα OPEN-SOURCE προγράμματα GWCreator και WordForms Applets, έγινε για τον ίδιο λόγο. Πχ θα μπορούσε να βοηθήσει στη γνώση μας για:
1) ΕΞΕΛΙΞΗ ΓΛΩΣΣΑΣ: η ανάλυση της συχνότητας των συλλαβών σε διαφορετικές χρονικές στιγμές, μπορεί να μας δείξει την πορεία της γλώσσας.
2) TTS (Text To Speech Synthesis): Η αντιστοιχία των γραπτών με τις προφορικές συλλαβές μπορεί να βοηθήσει τα προγράμματα αυτά.
---

LAST MODIFIED: 2002.02.27
CREATED: 2002.02.17
URL: http://users.otenet.gr/~nikkas/gr/gw.html
HOME: http://users.otenet.gr/~nikkas/
MAIL: userid@domain, where userid=nikkas and domain=otenet.gr


MOVED to synagonism: 2014.09.16
new url: synagonism.net/otenet/gr/gw.html