Викилуғат: Тафовут байни таҳрирҳо

Content deleted Content added
AryanSogd (баҳс | ҳисса)
→‎Тарҷума: танзим
No edit summary
Сатри 60:
* [[машинный перевод на основе правил]] между [[Нидерландский язык|нидерландским]] и языком [[африкаанс]]; используются данные Английского и Нидерландского Викисловарей и двух википедий в рамках системы [[Apertium]]{{sfn|Otte and Tyers|2011}};
* создание машиночитаемого словаря парсером NULEX, интегрирующего открытые лингвистические ресурсы: Английский Викисловарь, [[WordNet]] и [[:en:VerbNet|VerbNet]]{{sfn|McFate and Forbus|2011}}. Для существительного из Английского Викисловаря извлекались часть речи и форма множественного числа, для глаголов — время. Для извлечения данных из Викисловаря использовалась методика [[:en:Web scraping|Screen scraping]];
* [[:en:Ontology engineering|построение онтологий]]{{sfn|Meyer and Gurevych|2012}} и [[База знаний|баз знаний]]<ref>{{cite web|url=http://conceptnet5.media.mit.edu/|title=ConceptNet 5|accessdate=2013-04-17|archiveurl=http://www.webcitation.org/6G0D94MVG|archivedate=2013-04-19}}</ref>;
* [[Распознавание речи|распознавание]] и [[синтез речи]], где Викисловарь выступает в роли источника данных для автоматического построения словаря произношений{{sfn|Schlippe et al.|2012}}. Извлекаются пары слово-произношение (транскрипция в системе [[Международный фонетический алфавит|МФА]]) из Чешского, Английского, Французского, Немецкого, Польского и Испанского Викисловарей<ref group="Прим">Если в словарной статье несколько транскрипций, то берётся первая.</ref>. При проверке самое большое число ошибок оказалось в транскрипциях, извлечённых из Английского Викисловаря{{sfn|Schlippe et al.|2012|p=4804}};
* [[отображение онтологий]]{{sfn|Lin and Krizhanovsky|2011}};
* [[:en:Ontology engineering|построение онтологий]]{{sfn|Meyer and Gurevych|2012}} и [[База знаний|баз знаний]]<ref>{{cite web|url=http://conceptnet5.media.mit.edu/|title=ConceptNet 5|accessdate=2013-04-17|archiveurl=http://www.webcitation.org/6G0D94MVG|archivedate=2013-04-19}}</ref>;
* [[:en:Text simplification|упрощение текста]]. В работе {{sfn|Medero and Ostendorf|2009}} выполняется оценка сложности слов на основе данных Викисловаря. Для слова из Английского Викисловаря извлекаются: размер словарной статьи, число частей речи, число значений и число переводов. Авторы{{sfn|Medero and Ostendorf|2009}} предположили, что более простыми, базовыми, употребимыми будут те слова, у которых больше значений (то есть размер статьи будет больше), больше частей речи и больше переводов. Далее найденные в тексте «сложные» слова необходимо перефразировать, найти более «простые» эквиваленты, что приведёт к упрощению (адаптации) текста;
* [[отображение онтологий]]{{sfn|Lin and Krizhanovsky|2011}};
* [[частеречная разметка]]. В работе (Ли и др., 2012){{sfn|Li et al|2012}} на основе данных Английского Викисловаря построены POS-tagger’ы для восьми языков, имеющих «бедные лингвистические ресурсы», с использованием [[Скрытая марковская модель|скрытых марковских моделей]].<ref group="Прим">Исходный код программы и результаты частеречной разметки доступны онлайн: https://code.google.com/p/wikily-supervised-pos-tagger</ref>
* [[:en:Text simplification|упрощение текста]]. В работе {{sfn|Medero and Ostendorf|2009}} выполняется оценка сложности слов на основе данных Викисловаря. Для слова из Английского Викисловаря извлекаются: размер словарной статьи, число частей речи, число значений и число переводов. Авторы{{sfn|Medero and Ostendorf|2009}} предположили, что более простыми, базовыми, употребимыми будут те слова, у которых больше значений (то есть размер статьи будет больше), больше частей речи и больше переводов. Далее найденные в тексте «сложные» слова необходимо перефразировать, найти более «простые» эквиваленты, что приведёт к упрощению (адаптации) текста;
* [[частеречная разметка]]. В работе (Ли и др., 2012){{sfn|Li et al|2012}} на основе данных Английского Викисловаря построены POS-tagger’ы для восьми языков, имеющих «бедные лингвистические ресурсы», с использованием [[Скрытая марковская модель|скрытых марковских моделей]].<ref group="Прим">Исходный код программы и результаты частеречной разметки доступны онлайн: https://code.google.com/p/wikily-supervised-pos-tagger</ref>
* [[анализ тональности текста]]{{sfn|Chesley et al|2006}}.
==Тарҷума==
Line 77 ⟶ 76:
* [[тарҷумаи мошинӣ дар асоси қоидаҳо]] байни [[Нидерландский язык|забони нидерландӣ]] ва забони [[африкаанс]]; маълумотҳои Викилуғатҳои англисӣ ва нидерландӣ ва ду википедия дар доираи системаи[[Apertium]]{{sfn|Otte and Tyers|2011}};
* таъсиси луғати хонои мошинӣ бо парсери NULEX, ки захираҳои кушоди забониро ҳамгиро аст: Викилуғати англисӣ,[[WordNet]] ва [[:en:VerbNet|VerbNet]]{{sfn|McFate and Forbus|2011}}. Барои исм аз Викилуғати англисӣ ҳиссаи нутқ ва шакли ҷамъбандии исм гирифта мешаванд, барои феъл - замони феъл. Барои гирифтани маълумотҳо аз Викилуғат усули [[:en:Web scraping|Screen scraping]] истифода мешавад;
*[[:en:Ontology engineering|сохти онтологияҳо]]{{sfn|Meyer and Gurevych|2012}} и [[Асоси донишҳо |асоси донишҳо]]<ref>{{cite web|url=http://conceptnet5.media.mit.edu/|title=ConceptNet 5|accessdate=2013-04-17|archiveurl=http://www.webcitation.org/6G0D94MVG|archivedate=2013-04-19}}</ref>;
*[[инъикоси онтологияҳо]]{{sfn|Lin and Krizhanovsky|2011}};
*[[:en:Text simplification|содашавии матнҳо]]. Дар кор {{sfn|Medero and Ostendorf|2009}} ба мураккабии вожаҳо дар асоси маълумоти Викилуғат баҳо дода мешавад. Барои вожа аз Викилуғати англисӣ инҳо гирифта мешаванд: ҳаҷми мақолаи луғавӣ, шумораи ҳиссаҳои нутқ,шумораи размер словарной статьи, число частей речи, шумораи арзишҳо ва шумораи тарҷумаҳо. Муаллифон{{sfn|Medero and Ostendorf|2009}} тахмин карданд, ки аз ҳама содатарин, асоситарин, маъмултарин вожаҳое ҳисобида мешаванд, ки маъноҳои зиёдтар (яъне ҳаҷми мақола калонтар мешавад), ҳиссаҳои нутқ бештар ва тарҷумаҳояшон низ бисёртар бошанд. Сипас вожаҳои «мураккаб»и дар матн ёфтшуда бояд бо пайдо кардани муодилҳои «сода» дигаргун намуд, ин матнро осон (мутобиқгардонӣ) менамояд;
*[[аломатгузории қисмҳои нутқ]]. Дар кори (Ли и диг., 2012){{sfn|Li et al|2012}} дар асоси маълумоти Викилуғати англисӣ POS-tagger’ы барои ҳашт забони «захираи ками забонӣ» дошта бо истифодаи сохта шудаанд бо истифодаи [[Намунаи пинҳони марковӣ|намунаи пинҳони марковӣ]].<ref group="Эзоҳ">Рамзи натиҷавии барномаҳо ва натиҷаҳои аломатгузории қисмҳои нутқи дастраси онлайн: https://code.google.com/p/wikily-supervised-pos-tagger</ref>
* [[таҳлили оҳанги матн]]{{sfn|Chesley et al|2006}}.
*[[Эътироф намудани нутқ|эътироф]] ва [[синтези нутқ ]], дар ҷое, ки Викилуғат дар вазифаи сарчашмаи маълумотҳо барои сохти автоматии луғати талаффуз баромад мекунад{{sfn|Schlippe et al.|2012}}. Ҷуфти вожаҳои талаффузшаванда гирифта мешаванд Извлекаются пары слово-произношение (транскрипсия дар низоми[[Алифбои фонетикии байналхалқӣ|АФБ]]) аз Викилуғатҳои чехӣ, англисӣ, фаронсавӣ, олмонӣ, полякӣ ва испанӣ<ref group="Эзоҳ">Агар дар мақолаи луғавӣ якчанд транскрипсия бошад, аввалаш гирифта мешавад.</ref>. Ҳангоми тафтиш миқдори зиёди ғалатҳо дар транскрипсияҳои аз Викилуғати англисӣ гирифта шуда пайхас карда шуд.{{sfn|Schlippe et al.|2012|p=4804}};
== См. также ==
* [[Татоэба]]