Viestejä: 48
Kieli: Русский
Gleki (Näytä profiilli) 27. tammikuuta 2014 11.33.48
sunnynai:Та ли они часты? Есть вещи, которые компьютер не поймет. Важно знать контекст. Но если вы пытаетесь компьютер и такую игру в аффиксы заставить понять - низкий вам поклон. В обычной речи даже люди таким редко балуются.Gleki:sunnynai, обратите внимание, что предыдущие попытки создания BNF грамматики эсперанто просто проводили сличение с базой данных. vizagxo в словаре есть - что ещё надо для счастья? А если нет, то желательно разбивать на более длинные корни, если есть несколько вариантов. Скажем, если есть корень vizagx' и корни viz' + agx', то первый вариант предпочтительнее.Но тогда потеряются всякие красивые возможности типа kolego - kol-eg-o, persone - per-son-e.
Лингвофорум - это lingovoforum.net ? Вполне возможно, что ранее высказывались сходные идеи. Машинному переводу много лет.Gleki:А, кстати, есть языки, в которых такого бардака нет.Gleki, может это я Ваше сообщение на лингвофоруме цитировала чуть выше? )
Из естественных - китайский.
Из плановых - ложбан.
sunnynai (Näytä profiilli) 27. tammikuuta 2014 14.38.58
Gleki:Так ли они часты? Есть вещи, которые компьютер не поймет. Важно знать контекст. Но если вы пытаетесь компьютер и такую игру в аффиксы заставить понять - низкий вам поклон. В обычной речи даже люди таким редко балуются.Так мне же не нужно, чтобы понял компьютер. Мне нужно чтобы понял тот, кто будет читать полученный в результате текст на лидепла. И я не слишком увлекаюсь выбором правильного варианта, я просто предлагаю все возможные (убирая перед итоговым выводом самые невероятные). И, наконец, контекст я учитываю. Не слишком далеко, и, быть может, не слишком подробно. Но достаточно, к примеру, для того, чтобы различать kiu в значениях "кто" и "который".
Gleki (Näytä profiilli) 28. tammikuuta 2014 11.11.40
sunnynai:Если вам нужно только перегнать корпус текстов из эсперанто в лидепла и вы говорите на этом языке, то тогда такая игра в большинстве текстов отсутствует, и предложенная (не мной) схема эффективна.Gleki:Так ли они часты? Есть вещи, которые компьютер не поймет. Важно знать контекст. Но если вы пытаетесь компьютер и такую игру в аффиксы заставить понять - низкий вам поклон. В обычной речи даже люди таким редко балуются.Так мне же не нужно, чтобы понял компьютер. Мне нужно чтобы понял тот, кто будет читать полученный в результате текст на лидепла. И я не слишком увлекаюсь выбором правильного варианта, я просто предлагаю все возможные (убирая перед итоговым выводом самые невероятные). И, наконец, контекст я учитываю. Не слишком далеко, и, быть может, не слишком подробно. Но достаточно, к примеру, для того, чтобы различать kiu в значениях "кто" и "который".
Also try http://www.statmt.org/moses/
Также попробуйте вместо эсперанто использовать тексты на Ток Писин.
sunnynai (Näytä profiilli) 28. tammikuuta 2014 11.37.08
Gleki:Если вам нужно только перегнать корпус текстов из эсперанто в лидепла и вы говорите на этом языке, то тогда такая игра в большинстве текстов отсутствует, и предложенная (не мной) схема эффективна.Dankon за ссылку, изучу.
Also try http://www.statmt.org/moses/
Также попробуйте вместо эсперанто использовать тексты на Ток Писин.
Нет, мне не нужно только перегнать корпус текстов. Мне нужен инструмент для анализа текста, написанного на некотором языке. (Эсперанто - для пробы, планируется большее количество языков.)
Лидепла идеально подходит, так как в нем (в языке лидепла) полностью разнесены лексическое и грамматическое значения. Соответственно, я могу анализировать текст, оставляя ВСЮ процедуру анализа абсолютно прозрачной.
sunnynai (Näytä profiilli) 28. tammikuuta 2014 11.41.58
В этом определенно что-то есть )))
Можно аж засомневаться в случайности... )
amuzi - am-uz-i
Gleki (Näytä profiilli) 28. tammikuuta 2014 14.34.32
sunnynai:Лидепла идеально подходит, так как в нем (в языке лидепла) полностью разнесены лексическое и грамматическое значения.Что это значит? Каковы примеры?
sunnynai (Näytä profiilli) 28. tammikuuta 2014 14.54.05
Gleki:Это значит, что существительные, к примеру, не несут в себе значения числа. kitaba - книга вообще, как класс. Одна или несколько, неважно. Но, при необходимости, можно указать это значение явно: un kitaba (одна книга) или mucho kitaba (много книг). Также, при желании и необходимости, можно (но не обязательно) использовать форму множественного числа kitabas (при отсутствии других указателей числа).sunnynai:Лидепла идеально подходит, так как в нем (в языке лидепла) полностью разнесены лексическое и грамматическое значения.Что это значит? Каковы примеры?
В тексте на эсперанто число существительного и прилагательного всегда указывается явно. Поэтому при анализе они получают отметку un (один) или pluri (несколько). В итоговом тексте на лидепла прилагательные, естественно, будут без указания числа, а существительные, если необходимо, - в форме множественного числа.
Кроме того, в эсперанто есть винительный падеж. В лидепла есть возможность указать форму винительного падежа явно (частица den, очевидно немецкого происхождения), и эту возможность я использую. То есть в итоговом тексте на лидепла перед всеми группами, которые в исходном эсперанто-тексте стояли в винительном падеже, будет стоять den (хотя обычно в лидепла эта частица ставится только при непрямом порядке слов). Конечно, было бы неплохо иметь возможность это den после глагол убирать, но винительный падеж в эсперанто многозначен и далеко не всегда обозначает прямое дополнение.
Еще примеры - все тексты, которые можно найти на сайтах (ссылки на lidepla.info).
А программа уже работает и скоро будет опубликована.
(Искренне надеюсь, что мои объяснения не будут восприняты как пропаганда лидепла...)
Gleki (Näytä profiilli) 28. tammikuuta 2014 16.04.39
Gleki (Näytä profiilli) 28. tammikuuta 2014 16.06.09
sunnynai:А как как обозначается императив?Gleki:Это значит, что существительные, к примеру, не несут в себе значения числа. kitaba - книга вообще, как класс. Одна или несколько, неважно. Но, при необходимости, можно указать это значение явно: un kitaba (одна книга) или mucho kitaba (много книг). Также, при желании и необходимости, можно (но не обязательно) использовать форму множественного числа kitabas (при отсутствии других указателей числа).sunnynai:Лидепла идеально подходит, так как в нем (в языке лидепла) полностью разнесены лексическое и грамматическое значения.Что это значит? Каковы примеры?
...
Еще примеры - все тексты, которые можно найти на сайтах (ссылки на lidepla.info).
sunnynai (Näytä profiilli) 28. tammikuuta 2014 16.09.08
Gleki:Описывая проблемы разбиения слов, не боитесь ли вы, что такие же проблемы встанут перед теми, кто будет анализировать текст на лидепла? Или вы будете части составных слова, как Заменгоф, отделять апострофом или дефисом?Ну, во-первых, в лидепла на порядок меньше составных слов (хотя есть соответствия всем аффиксам в эсперанто). Во-вторых - да, некоторые аффиксы отделяются дефисом, даже в обычном тексте. В рамках программы я еще добавляю разделительную звездочку (*).