Till sidans innehåll

Неоднозначные слова

av sunnynai, 16 januari 2014

Meddelanden: 48

Språk: Русский

maratonisto (Visa profilen) 25 januari 2014 18:15:50

А есть смысл изощряться?
Такого добра полно в любом языке.

sunnynai (Visa profilen) 25 januari 2014 21:06:37

В каком смысле изощряться? Я просто делаю программу автоматического анализа эо-текста (перевод на лидепла), мне такие случаи попадаются. Некоторые надо убирать (простое alia, к примеру, 3-мя способами раскладывается, если брать i как суффикс-показатель страны), некоторые остаются (и весьма раздражают, признаться честно).

Все о том же: в любом языке может и полно. Но "любой язык" - это язык естественный, который не претендует на исключительную простоту, всяческую универсальность и право быть (по возможности в обязательном порядке) изучаемым всеми...

maratonisto (Visa profilen) 26 januari 2014 00:17:26

sunnynai:Я просто делаю программу автоматического анализа эо-текста
Это интересно. Используете какой-нибудь готовый движок или делаете с нуля?

sunnynai:простое alia, к примеру, 3-мя способами раскладывается, если брать i как суффикс-показатель страны
А какой способ третий?

sunnynai:Все о том же: в любом языке может и полно. Но "любой язык" - это язык естественный, который не претендует на исключительную простоту, всяческую универсальность и право быть (по возможности в обязательном порядке) изучаемым всеми...
Даже не знаю, можно ли сделать в принципе язык с однозначным разбором слов. Наверное можно, он будет удобным для компьютера, но будет ли он удобен для человека?

sunnynai (Visa profilen) 26 januari 2014 08:22:55

maratonisto:
sunnynai:Я просто делаю программу автоматического анализа эо-текста
Это интересно. Используете какой-нибудь готовый движок или делаете с нуля?
Делаю с нуля.

maratonisto:
sunnynai:простое alia, к примеру, 3-мя способами раскладывается, если брать i как суффикс-показатель страны
А какой способ третий?
ali-a - a-li-a - al-i-a
Во втором "a" - то, которое, бывает, появляется при словосложении.

maratonisto:
sunnynai:Все о том же: в любом языке может и полно. Но "любой язык" - это язык естественный, который не претендует на исключительную простоту, всяческую универсальность и право быть (по возможности в обязательном порядке) изучаемым всеми...
Даже не знаю, можно ли сделать в принципе язык с однозначным разбором слов. Наверное можно, он будет удобным для компьютера, но будет ли он удобен для человека?
В этой теме в самом начале есть ссылка на лингвофорум. Так вот там есть вот такая пара реплик:
-"Если говорить о рассматриваемых примерах, то ложбан и китайский от такой двусмысленности начисто избавлены."
-"Не избавлены, а лишены."

Где много частей, там много неоднозначности. В Эсперанто обилие этих самых частей считается, как правило, достоинством. Или, по меньшей мере, некоторой основополагающей его характеристикой: в конце концов, это одна из всего нескольких явных идей, сознательно заложенных в язык автором. Но оно влечет за собой определенные сложности и недостатки.

maratonisto (Visa profilen) 26 januari 2014 08:40:30

sunnynai:
Делаю с нуля.
На каком языке программирования?

sunnynai (Visa profilen) 26 januari 2014 09:00:16

maratonisto:[На каком языке программирования?/quote]На php.
Суть алгоритма в том, что программистская часть полностью отделена от собственно лингвистической, поэтому программа сама по себе не очень сложная.

maratonisto (Visa profilen) 26 januari 2014 09:42:28

sunnynai:На php.
Суть алгоритма в том, что программистская часть полностью отделена от собственно лингвистической, поэтому программа сама по себе не очень сложная.
Это разумно. Лингвистический данные вынесены в базу (MySQL?). То есть, её легко переделать в другой, "оффлайновский" язык.

sunnynai (Visa profilen) 26 januari 2014 09:49:08

maratonisto:Это разумно. Лингвистический данные вынесены в базу (MySQL?). То есть, её легко переделать в другой, "оффлайновский" язык.
Вынесены, да. В несколько баз.
В принципе да, несложно. Если появится необходимость.
Тут же еще дело в том, что язык для анализа-перевода - лидепла (лингва де планета). Он пока не слишком широко известен (прямо даже почти совсем неизвестен - достаточно новый просто). А в среде эсперантистов (то есть здесь, собственно) вообще чаще всего воспринимается как конкурент и "вражеский язык". Поэтому пока необходимости делать оффлайн версию нет. Но в планах перевод не только с эсперанто - там может и понадобится.

Gleki (Visa profilen) 26 januari 2014 10:41:22

sunnynai:Буду класть в тему слова, с которыми встречаюсь. Мне как-то не верилось, но таких слов действительно ОЧЕНЬ много. Особенно если считать также не слишком осмысленные сочетания.

vizagxo - viz-agxo (подозреваю, что о возрасте визы никто не говорит, но теоретически вполне возможно)
acxeto - acx-eto
mistero - mis-tero
sunnynai, обратите внимание, что предыдущие попытки создания BNF грамматики эсперанто просто проводили сличение с базой данных. vizagxo в словаре есть - что ещё надо для счастья? А если нет, то желательно разбивать на более длинные корни, если есть несколько вариантов. Скажем, если есть корень vizagx' и корни viz' + agx', то первый вариант предпочтительнее.

А, кстати, есть языки, в которых такого бардака нет.
Из естественных - китайский.
Из плановых - ложбан.

sunnynai (Visa profilen) 26 januari 2014 10:56:55

Gleki:sunnynai, обратите внимание, что предыдущие попытки создания BNF грамматики эсперанто просто проводили сличение с базой данных. vizagxo в словаре есть - что ещё надо для счастья? А если нет, то желательно разбивать на более длинные корни, если есть несколько вариантов. Скажем, если есть корень vizagx' и корни viz' + agx', то первый вариант предпочтительнее.
Но тогда потеряются всякие красивые возможности типа kolego - kol-eg-o, persone - per-son-e.

Gleki:А, кстати, есть языки, в которых такого бардака нет.
Из естественных - китайский.
Из плановых - ложбан.
Gleki, может это я Ваше сообщение на лингвофоруме цитировала чуть выше? )

Tillbaka till toppen