Mergi la conținut

Неоднозначные слова

de sunnynai, 16 ianuarie 2014

Contribuții/Mesaje: 48

Limbă: Русский

Gleki (Arată profil) 27 ianuarie 2014, 11:33:48

sunnynai:
Gleki:sunnynai, обратите внимание, что предыдущие попытки создания BNF грамматики эсперанто просто проводили сличение с базой данных. vizagxo в словаре есть - что ещё надо для счастья? А если нет, то желательно разбивать на более длинные корни, если есть несколько вариантов. Скажем, если есть корень vizagx' и корни viz' + agx', то первый вариант предпочтительнее.
Но тогда потеряются всякие красивые возможности типа kolego - kol-eg-o, persone - per-son-e.
Та ли они часты? Есть вещи, которые компьютер не поймет. Важно знать контекст. Но если вы пытаетесь компьютер и такую игру в аффиксы заставить понять - низкий вам поклон. В обычной речи даже люди таким редко балуются.
Gleki:А, кстати, есть языки, в которых такого бардака нет.
Из естественных - китайский.
Из плановых - ложбан.
Gleki, может это я Ваше сообщение на лингвофоруме цитировала чуть выше? )
Лингвофорум - это lingovoforum.net ? Вполне возможно, что ранее высказывались сходные идеи. Машинному переводу много лет.

sunnynai (Arată profil) 27 ianuarie 2014, 14:38:58

Gleki:Так ли они часты? Есть вещи, которые компьютер не поймет. Важно знать контекст. Но если вы пытаетесь компьютер и такую игру в аффиксы заставить понять - низкий вам поклон. В обычной речи даже люди таким редко балуются.
Так мне же не нужно, чтобы понял компьютер. Мне нужно чтобы понял тот, кто будет читать полученный в результате текст на лидепла. И я не слишком увлекаюсь выбором правильного варианта, я просто предлагаю все возможные (убирая перед итоговым выводом самые невероятные). И, наконец, контекст я учитываю. Не слишком далеко, и, быть может, не слишком подробно. Но достаточно, к примеру, для того, чтобы различать kiu в значениях "кто" и "который".

Gleki (Arată profil) 28 ianuarie 2014, 11:11:40

sunnynai:
Gleki:Так ли они часты? Есть вещи, которые компьютер не поймет. Важно знать контекст. Но если вы пытаетесь компьютер и такую игру в аффиксы заставить понять - низкий вам поклон. В обычной речи даже люди таким редко балуются.
Так мне же не нужно, чтобы понял компьютер. Мне нужно чтобы понял тот, кто будет читать полученный в результате текст на лидепла. И я не слишком увлекаюсь выбором правильного варианта, я просто предлагаю все возможные (убирая перед итоговым выводом самые невероятные). И, наконец, контекст я учитываю. Не слишком далеко, и, быть может, не слишком подробно. Но достаточно, к примеру, для того, чтобы различать kiu в значениях "кто" и "который".
Если вам нужно только перегнать корпус текстов из эсперанто в лидепла и вы говорите на этом языке, то тогда такая игра в большинстве текстов отсутствует, и предложенная (не мной) схема эффективна.

Also try http://www.statmt.org/moses/

Также попробуйте вместо эсперанто использовать тексты на Ток Писин.

sunnynai (Arată profil) 28 ianuarie 2014, 11:37:08

Gleki:Если вам нужно только перегнать корпус текстов из эсперанто в лидепла и вы говорите на этом языке, то тогда такая игра в большинстве текстов отсутствует, и предложенная (не мной) схема эффективна.
Also try http://www.statmt.org/moses/
Также попробуйте вместо эсперанто использовать тексты на Ток Писин.
Dankon за ссылку, изучу.
Нет, мне не нужно только перегнать корпус текстов. Мне нужен инструмент для анализа текста, написанного на некотором языке. (Эсперанто - для пробы, планируется большее количество языков.)
Лидепла идеально подходит, так как в нем (в языке лидепла) полностью разнесены лексическое и грамматическое значения. Соответственно, я могу анализировать текст, оставляя ВСЮ процедуру анализа абсолютно прозрачной.

sunnynai (Arată profil) 28 ianuarie 2014, 11:41:58

teamo - te-am-o

В этом определенно что-то есть )))
Можно аж засомневаться в случайности... )

amuzi - am-uz-i

Gleki (Arată profil) 28 ianuarie 2014, 14:34:32

sunnynai:Лидепла идеально подходит, так как в нем (в языке лидепла) полностью разнесены лексическое и грамматическое значения.
Что это значит? Каковы примеры?

sunnynai (Arată profil) 28 ianuarie 2014, 14:54:05

Gleki:
sunnynai:Лидепла идеально подходит, так как в нем (в языке лидепла) полностью разнесены лексическое и грамматическое значения.
Что это значит? Каковы примеры?
Это значит, что существительные, к примеру, не несут в себе значения числа. kitaba - книга вообще, как класс. Одна или несколько, неважно. Но, при необходимости, можно указать это значение явно: un kitaba (одна книга) или mucho kitaba (много книг). Также, при желании и необходимости, можно (но не обязательно) использовать форму множественного числа kitabas (при отсутствии других указателей числа).

В тексте на эсперанто число существительного и прилагательного всегда указывается явно. Поэтому при анализе они получают отметку un (один) или pluri (несколько). В итоговом тексте на лидепла прилагательные, естественно, будут без указания числа, а существительные, если необходимо, - в форме множественного числа.

Кроме того, в эсперанто есть винительный падеж. В лидепла есть возможность указать форму винительного падежа явно (частица den, очевидно немецкого происхождения), и эту возможность я использую. То есть в итоговом тексте на лидепла перед всеми группами, которые в исходном эсперанто-тексте стояли в винительном падеже, будет стоять den (хотя обычно в лидепла эта частица ставится только при непрямом порядке слов). Конечно, было бы неплохо иметь возможность это den после глагол убирать, но винительный падеж в эсперанто многозначен и далеко не всегда обозначает прямое дополнение.

Еще примеры - все тексты, которые можно найти на сайтах (ссылки на lidepla.info).
А программа уже работает и скоро будет опубликована.

(Искренне надеюсь, что мои объяснения не будут восприняты как пропаганда лидепла...)

Gleki (Arată profil) 28 ianuarie 2014, 16:04:39

Описывая проблемы разбиения слов, не боитесь ли вы, что такие же проблемы встанут перед теми, кто будет анализировать текст на лидепла? Или вы будете части составных слова, как Заменгоф, отделять апострофом или дефисом?

Gleki (Arată profil) 28 ianuarie 2014, 16:06:09

sunnynai:
Gleki:
sunnynai:Лидепла идеально подходит, так как в нем (в языке лидепла) полностью разнесены лексическое и грамматическое значения.
Что это значит? Каковы примеры?
Это значит, что существительные, к примеру, не несут в себе значения числа. kitaba - книга вообще, как класс. Одна или несколько, неважно. Но, при необходимости, можно указать это значение явно: un kitaba (одна книга) или mucho kitaba (много книг). Также, при желании и необходимости, можно (но не обязательно) использовать форму множественного числа kitabas (при отсутствии других указателей числа).
...
Еще примеры - все тексты, которые можно найти на сайтах (ссылки на lidepla.info).
А как как обозначается императив?

sunnynai (Arată profil) 28 ianuarie 2014, 16:09:08

Gleki:Описывая проблемы разбиения слов, не боитесь ли вы, что такие же проблемы встанут перед теми, кто будет анализировать текст на лидепла? Или вы будете части составных слова, как Заменгоф, отделять апострофом или дефисом?
Ну, во-первых, в лидепла на порядок меньше составных слов (хотя есть соответствия всем аффиксам в эсперанто). Во-вторых - да, некоторые аффиксы отделяются дефисом, даже в обычном тексте. В рамках программы я еще добавляю разделительную звездочку (*).

Înapoi mai sus