Į turinį

Неоднозначные слова

sunnynai, 2014 m. sausis 16 d.

Žinutės: 48

Kalba: Русский

Gleki (Rodyti profilį) 2014 m. sausis 27 d. 11:33:48

sunnynai:
Gleki:sunnynai, обратите внимание, что предыдущие попытки создания BNF грамматики эсперанто просто проводили сличение с базой данных. vizagxo в словаре есть - что ещё надо для счастья? А если нет, то желательно разбивать на более длинные корни, если есть несколько вариантов. Скажем, если есть корень vizagx' и корни viz' + agx', то первый вариант предпочтительнее.
Но тогда потеряются всякие красивые возможности типа kolego - kol-eg-o, persone - per-son-e.
Та ли они часты? Есть вещи, которые компьютер не поймет. Важно знать контекст. Но если вы пытаетесь компьютер и такую игру в аффиксы заставить понять - низкий вам поклон. В обычной речи даже люди таким редко балуются.
Gleki:А, кстати, есть языки, в которых такого бардака нет.
Из естественных - китайский.
Из плановых - ложбан.
Gleki, может это я Ваше сообщение на лингвофоруме цитировала чуть выше? )
Лингвофорум - это lingovoforum.net ? Вполне возможно, что ранее высказывались сходные идеи. Машинному переводу много лет.

sunnynai (Rodyti profilį) 2014 m. sausis 27 d. 14:38:58

Gleki:Так ли они часты? Есть вещи, которые компьютер не поймет. Важно знать контекст. Но если вы пытаетесь компьютер и такую игру в аффиксы заставить понять - низкий вам поклон. В обычной речи даже люди таким редко балуются.
Так мне же не нужно, чтобы понял компьютер. Мне нужно чтобы понял тот, кто будет читать полученный в результате текст на лидепла. И я не слишком увлекаюсь выбором правильного варианта, я просто предлагаю все возможные (убирая перед итоговым выводом самые невероятные). И, наконец, контекст я учитываю. Не слишком далеко, и, быть может, не слишком подробно. Но достаточно, к примеру, для того, чтобы различать kiu в значениях "кто" и "который".

Gleki (Rodyti profilį) 2014 m. sausis 28 d. 11:11:40

sunnynai:
Gleki:Так ли они часты? Есть вещи, которые компьютер не поймет. Важно знать контекст. Но если вы пытаетесь компьютер и такую игру в аффиксы заставить понять - низкий вам поклон. В обычной речи даже люди таким редко балуются.
Так мне же не нужно, чтобы понял компьютер. Мне нужно чтобы понял тот, кто будет читать полученный в результате текст на лидепла. И я не слишком увлекаюсь выбором правильного варианта, я просто предлагаю все возможные (убирая перед итоговым выводом самые невероятные). И, наконец, контекст я учитываю. Не слишком далеко, и, быть может, не слишком подробно. Но достаточно, к примеру, для того, чтобы различать kiu в значениях "кто" и "который".
Если вам нужно только перегнать корпус текстов из эсперанто в лидепла и вы говорите на этом языке, то тогда такая игра в большинстве текстов отсутствует, и предложенная (не мной) схема эффективна.

Also try http://www.statmt.org/moses/

Также попробуйте вместо эсперанто использовать тексты на Ток Писин.

sunnynai (Rodyti profilį) 2014 m. sausis 28 d. 11:37:08

Gleki:Если вам нужно только перегнать корпус текстов из эсперанто в лидепла и вы говорите на этом языке, то тогда такая игра в большинстве текстов отсутствует, и предложенная (не мной) схема эффективна.
Also try http://www.statmt.org/moses/
Также попробуйте вместо эсперанто использовать тексты на Ток Писин.
Dankon за ссылку, изучу.
Нет, мне не нужно только перегнать корпус текстов. Мне нужен инструмент для анализа текста, написанного на некотором языке. (Эсперанто - для пробы, планируется большее количество языков.)
Лидепла идеально подходит, так как в нем (в языке лидепла) полностью разнесены лексическое и грамматическое значения. Соответственно, я могу анализировать текст, оставляя ВСЮ процедуру анализа абсолютно прозрачной.

sunnynai (Rodyti profilį) 2014 m. sausis 28 d. 11:41:58

teamo - te-am-o

В этом определенно что-то есть )))
Можно аж засомневаться в случайности... )

amuzi - am-uz-i

Gleki (Rodyti profilį) 2014 m. sausis 28 d. 14:34:32

sunnynai:Лидепла идеально подходит, так как в нем (в языке лидепла) полностью разнесены лексическое и грамматическое значения.
Что это значит? Каковы примеры?

sunnynai (Rodyti profilį) 2014 m. sausis 28 d. 14:54:05

Gleki:
sunnynai:Лидепла идеально подходит, так как в нем (в языке лидепла) полностью разнесены лексическое и грамматическое значения.
Что это значит? Каковы примеры?
Это значит, что существительные, к примеру, не несут в себе значения числа. kitaba - книга вообще, как класс. Одна или несколько, неважно. Но, при необходимости, можно указать это значение явно: un kitaba (одна книга) или mucho kitaba (много книг). Также, при желании и необходимости, можно (но не обязательно) использовать форму множественного числа kitabas (при отсутствии других указателей числа).

В тексте на эсперанто число существительного и прилагательного всегда указывается явно. Поэтому при анализе они получают отметку un (один) или pluri (несколько). В итоговом тексте на лидепла прилагательные, естественно, будут без указания числа, а существительные, если необходимо, - в форме множественного числа.

Кроме того, в эсперанто есть винительный падеж. В лидепла есть возможность указать форму винительного падежа явно (частица den, очевидно немецкого происхождения), и эту возможность я использую. То есть в итоговом тексте на лидепла перед всеми группами, которые в исходном эсперанто-тексте стояли в винительном падеже, будет стоять den (хотя обычно в лидепла эта частица ставится только при непрямом порядке слов). Конечно, было бы неплохо иметь возможность это den после глагол убирать, но винительный падеж в эсперанто многозначен и далеко не всегда обозначает прямое дополнение.

Еще примеры - все тексты, которые можно найти на сайтах (ссылки на lidepla.info).
А программа уже работает и скоро будет опубликована.

(Искренне надеюсь, что мои объяснения не будут восприняты как пропаганда лидепла...)

Gleki (Rodyti profilį) 2014 m. sausis 28 d. 16:04:39

Описывая проблемы разбиения слов, не боитесь ли вы, что такие же проблемы встанут перед теми, кто будет анализировать текст на лидепла? Или вы будете части составных слова, как Заменгоф, отделять апострофом или дефисом?

Gleki (Rodyti profilį) 2014 m. sausis 28 d. 16:06:09

sunnynai:
Gleki:
sunnynai:Лидепла идеально подходит, так как в нем (в языке лидепла) полностью разнесены лексическое и грамматическое значения.
Что это значит? Каковы примеры?
Это значит, что существительные, к примеру, не несут в себе значения числа. kitaba - книга вообще, как класс. Одна или несколько, неважно. Но, при необходимости, можно указать это значение явно: un kitaba (одна книга) или mucho kitaba (много книг). Также, при желании и необходимости, можно (но не обязательно) использовать форму множественного числа kitabas (при отсутствии других указателей числа).
...
Еще примеры - все тексты, которые можно найти на сайтах (ссылки на lidepla.info).
А как как обозначается императив?

sunnynai (Rodyti profilį) 2014 m. sausis 28 d. 16:09:08

Gleki:Описывая проблемы разбиения слов, не боитесь ли вы, что такие же проблемы встанут перед теми, кто будет анализировать текст на лидепла? Или вы будете части составных слова, как Заменгоф, отделять апострофом или дефисом?
Ну, во-первых, в лидепла на порядок меньше составных слов (хотя есть соответствия всем аффиксам в эсперанто). Во-вторых - да, некоторые аффиксы отделяются дефисом, даже в обычном тексте. В рамках программы я еще добавляю разделительную звездочку (*).

Atgal į pradžią