Tin nhắn: 48
Nội dung: Русский
Gleki (Xem thông tin cá nhân) 11:33:48 Ngày 27 tháng 1 năm 2014
sunnynai:Та ли они часты? Есть вещи, которые компьютер не поймет. Важно знать контекст. Но если вы пытаетесь компьютер и такую игру в аффиксы заставить понять - низкий вам поклон. В обычной речи даже люди таким редко балуются.Gleki:sunnynai, обратите внимание, что предыдущие попытки создания BNF грамматики эсперанто просто проводили сличение с базой данных. vizagxo в словаре есть - что ещё надо для счастья? А если нет, то желательно разбивать на более длинные корни, если есть несколько вариантов. Скажем, если есть корень vizagx' и корни viz' + agx', то первый вариант предпочтительнее.Но тогда потеряются всякие красивые возможности типа kolego - kol-eg-o, persone - per-son-e.
Лингвофорум - это lingovoforum.net ? Вполне возможно, что ранее высказывались сходные идеи. Машинному переводу много лет.Gleki:А, кстати, есть языки, в которых такого бардака нет.Gleki, может это я Ваше сообщение на лингвофоруме цитировала чуть выше? )
Из естественных - китайский.
Из плановых - ложбан.
sunnynai (Xem thông tin cá nhân) 14:38:58 Ngày 27 tháng 1 năm 2014
Gleki:Так ли они часты? Есть вещи, которые компьютер не поймет. Важно знать контекст. Но если вы пытаетесь компьютер и такую игру в аффиксы заставить понять - низкий вам поклон. В обычной речи даже люди таким редко балуются.Так мне же не нужно, чтобы понял компьютер. Мне нужно чтобы понял тот, кто будет читать полученный в результате текст на лидепла. И я не слишком увлекаюсь выбором правильного варианта, я просто предлагаю все возможные (убирая перед итоговым выводом самые невероятные). И, наконец, контекст я учитываю. Не слишком далеко, и, быть может, не слишком подробно. Но достаточно, к примеру, для того, чтобы различать kiu в значениях "кто" и "который".
Gleki (Xem thông tin cá nhân) 11:11:40 Ngày 28 tháng 1 năm 2014
sunnynai:Если вам нужно только перегнать корпус текстов из эсперанто в лидепла и вы говорите на этом языке, то тогда такая игра в большинстве текстов отсутствует, и предложенная (не мной) схема эффективна.Gleki:Так ли они часты? Есть вещи, которые компьютер не поймет. Важно знать контекст. Но если вы пытаетесь компьютер и такую игру в аффиксы заставить понять - низкий вам поклон. В обычной речи даже люди таким редко балуются.Так мне же не нужно, чтобы понял компьютер. Мне нужно чтобы понял тот, кто будет читать полученный в результате текст на лидепла. И я не слишком увлекаюсь выбором правильного варианта, я просто предлагаю все возможные (убирая перед итоговым выводом самые невероятные). И, наконец, контекст я учитываю. Не слишком далеко, и, быть может, не слишком подробно. Но достаточно, к примеру, для того, чтобы различать kiu в значениях "кто" и "который".
Also try http://www.statmt.org/moses/
Также попробуйте вместо эсперанто использовать тексты на Ток Писин.
sunnynai (Xem thông tin cá nhân) 11:37:08 Ngày 28 tháng 1 năm 2014
Gleki:Если вам нужно только перегнать корпус текстов из эсперанто в лидепла и вы говорите на этом языке, то тогда такая игра в большинстве текстов отсутствует, и предложенная (не мной) схема эффективна.Dankon за ссылку, изучу.
Also try http://www.statmt.org/moses/
Также попробуйте вместо эсперанто использовать тексты на Ток Писин.
Нет, мне не нужно только перегнать корпус текстов. Мне нужен инструмент для анализа текста, написанного на некотором языке. (Эсперанто - для пробы, планируется большее количество языков.)
Лидепла идеально подходит, так как в нем (в языке лидепла) полностью разнесены лексическое и грамматическое значения. Соответственно, я могу анализировать текст, оставляя ВСЮ процедуру анализа абсолютно прозрачной.
sunnynai (Xem thông tin cá nhân) 11:41:58 Ngày 28 tháng 1 năm 2014
В этом определенно что-то есть )))
Можно аж засомневаться в случайности... )
amuzi - am-uz-i
Gleki (Xem thông tin cá nhân) 14:34:32 Ngày 28 tháng 1 năm 2014
sunnynai:Лидепла идеально подходит, так как в нем (в языке лидепла) полностью разнесены лексическое и грамматическое значения.Что это значит? Каковы примеры?
sunnynai (Xem thông tin cá nhân) 14:54:05 Ngày 28 tháng 1 năm 2014
Gleki:Это значит, что существительные, к примеру, не несут в себе значения числа. kitaba - книга вообще, как класс. Одна или несколько, неважно. Но, при необходимости, можно указать это значение явно: un kitaba (одна книга) или mucho kitaba (много книг). Также, при желании и необходимости, можно (но не обязательно) использовать форму множественного числа kitabas (при отсутствии других указателей числа).sunnynai:Лидепла идеально подходит, так как в нем (в языке лидепла) полностью разнесены лексическое и грамматическое значения.Что это значит? Каковы примеры?
В тексте на эсперанто число существительного и прилагательного всегда указывается явно. Поэтому при анализе они получают отметку un (один) или pluri (несколько). В итоговом тексте на лидепла прилагательные, естественно, будут без указания числа, а существительные, если необходимо, - в форме множественного числа.
Кроме того, в эсперанто есть винительный падеж. В лидепла есть возможность указать форму винительного падежа явно (частица den, очевидно немецкого происхождения), и эту возможность я использую. То есть в итоговом тексте на лидепла перед всеми группами, которые в исходном эсперанто-тексте стояли в винительном падеже, будет стоять den (хотя обычно в лидепла эта частица ставится только при непрямом порядке слов). Конечно, было бы неплохо иметь возможность это den после глагол убирать, но винительный падеж в эсперанто многозначен и далеко не всегда обозначает прямое дополнение.
Еще примеры - все тексты, которые можно найти на сайтах (ссылки на lidepla.info).
А программа уже работает и скоро будет опубликована.
(Искренне надеюсь, что мои объяснения не будут восприняты как пропаганда лидепла...)
Gleki (Xem thông tin cá nhân) 16:04:39 Ngày 28 tháng 1 năm 2014
Gleki (Xem thông tin cá nhân) 16:06:09 Ngày 28 tháng 1 năm 2014
sunnynai:А как как обозначается императив?Gleki:Это значит, что существительные, к примеру, не несут в себе значения числа. kitaba - книга вообще, как класс. Одна или несколько, неважно. Но, при необходимости, можно указать это значение явно: un kitaba (одна книга) или mucho kitaba (много книг). Также, при желании и необходимости, можно (но не обязательно) использовать форму множественного числа kitabas (при отсутствии других указателей числа).sunnynai:Лидепла идеально подходит, так как в нем (в языке лидепла) полностью разнесены лексическое и грамматическое значения.Что это значит? Каковы примеры?
...
Еще примеры - все тексты, которые можно найти на сайтах (ссылки на lidepla.info).
sunnynai (Xem thông tin cá nhân) 16:09:08 Ngày 28 tháng 1 năm 2014
Gleki:Описывая проблемы разбиения слов, не боитесь ли вы, что такие же проблемы встанут перед теми, кто будет анализировать текст на лидепла? Или вы будете части составных слова, как Заменгоф, отделять апострофом или дефисом?Ну, во-первых, в лидепла на порядок меньше составных слов (хотя есть соответствия всем аффиксам в эсперанто). Во-вторых - да, некоторые аффиксы отделяются дефисом, даже в обычном тексте. В рамках программы я еще добавляю разделительную звездочку (*).