Komputa lingvistiko por Esperanto
de AleksandrSup, 19 de gener de 2023
Missatges: 6
Llengua: Esperanto
AleksandrSup (Mostra el perfil) 19 de gener de 2023 18.00.07
Por tio mi petas informi pri ĉiuj projektoj farantaj:
- grandan korpuson de tekstoj (por havi materialon por laboro);
- morfologian analizilon (por determini gramatikajn formojn de vortoj);
- vort-vektorojn (por konverti vortojn al vektorojn por analizi senca proksimeco);
- eble eĉ sintaksan analizilon aŭ iajn aliajn komputajn ilojn?
AleksandrSup (Mostra el perfil) 19 de gener de 2023 18.40.32
Frano (Mostra el perfil) 19 de gener de 2023 20.24.36
Altebrilas (Mostra el perfil) 20 de gener de 2023 13.51.05
Mi iam verkis programeton en python por distrancxi radikojn el vortoj. Oni devas disponi pri listo de radikaro kaj, post forjxeto de la terminajxoj, vidi cxu la listigitaj radikoj aperas komence aux fine de la vorto. La programo printas la nerekonitajn vortojn, kaj la uzanto povas aldoni radikon en la listo aux korekti eraron.
Mi ne konas aliajn laborojn, sed multe supozas, ke tiaj ekzistas, cxar auxtomata tradukado bezonas tiajn ilojn.
AleksandrSup (Mostra el perfil) 21 de gener de 2023 17.13.17
Altebrilas:Kio estas vortvektoro?Tio estas iom da nombroj reprezentantaj iun vorton, komputitaj per statistiko pri aperoj de la vorto en tekstoj apud aliaj vortoj. Ideale vortvektoroj de vortoj kun similaj sencoj estas proksimaj en vektora spaco. Vi povas legi pli en ekzemple angla Vikipedio (Word embedding).
Frano (Mostra el perfil) 22 de gener de 2023 19.30.58
https://www.eric-xia.com/esperanto1.html