Викилуғат: Тафовут байни таҳрирҳо

Content deleted Content added
тарҷума
No edit summary
Сатри 59:
Аз моҳи августи соли 2008 сар карда Викилуғати русӣ аз рӯйи ҳаҷми маълумотҳо дар байни Викилуғатҳо ба ҷойи якум баромад.<ref>[http://stats.wikimedia.org/wiktionary/RU/TablesDatabaseSize.htm Омори викилуғатҳо: Ҳаҷми маълумот]</ref>. Дар айни ҳол миқдори мақолаҳо дар Викилуғати русӣ начандон калон аст<ref>[http://stats.wikimedia.org/wiktionary/RU/Sitemap.htm Омори викилуғатҳо]</ref>.Ин боз аз он хотир аст, ки лоиҳаҳои назар ба Викилуғати русӣ мақолаи зиёд дошта, мақолаҳояшон метавонанд ба ҳисоби миёна ҳаҷман хурдтар бошанд, ба ин аз сомонаи омор боварӣ ҳосил кардан мумкин аст<ref>[http://stats.wikimedia.org/wiktionary/RU/TablesArticlesBytesPerArticle.htm Омори викилуғатҳо: Байтҳо барои мақола]</ref>Ғайр аз ин дар муқоиса бо қисматҳои дигари Wiktionary Википедияи русӣ дар худ маводи зиёди ёридиҳандаро дорад, чун таблитсаи маълумот, рӯйхати басомади вожаҳо (дар муқоиса бо мақолаҳои луғатҳо, ки номҳои зиёдро дороянд, чунин маълумот дар қисматҳои «Замимаҳо», «Индексҳо» ва ғ. ҷойгир мешаванд.) Миқдори зиёди мақолаҳо дар Викилуғати русӣ ҳанӯз ҳам мақола-қолабҳо мебошанд, ки онҳоро ботҳо офаридаанд. Гарчанде баъзан қисми зиёди онҳо зери танқиданд, якчанд бартариҳо дида мешаванд. Якум, вай барои тезтар навишта шудани мақола ёрӣ медиҳанд, чун баъзе маълумотҳо аллакай ворид шудаанд. Дуюм, сохти мақолаҳо стандартӣ мешаванд. Аз ҳисоби дар ҷояш истифода бурдани шаблонҳо (одатан дарҳол аз тарафи ботҳо ба таври автоматӣ ҳангоми офаридани мақола гузошта мешаванд), шароит пайдо мешавад, ки мутамарказона ва якбора шакли зоҳирии якчанд мақола иваз карда шавад. Мавҷудияти миқдори зиёди шаблонҳо низ ба таҳрири автоматии минбаъдаи мақолаҳои аллакай вироишшуда ёрӣ медиҳад - масалан, бо роҳи автоматӣ — тарҷума аз рўйи луғати пешакӣ тайёркарда (азбаски ба ботҳо сохти маӄолаҳоро дарк кардан аз рӯйи лоиҳаҳои махсуси кашида назар ба забони инсонӣ осонтар аст). Хусусияти фарӄунандаи Викилуғати русӣ ин консепсияи таҳияшудаи рушд мебошад. Аз хотири консепсияи коркардшуда ва истифодаи васеи шаблонҳо мақолаҳо дар Викилуғати русӣ нисбат ба лоиҳаҳои дигар якхела ҳастанд (асосан миқдори қисматҳо, пайдарҳамии онҳо ва таҳияи ҳар як қисмат ба як тартиб омадаанд).
== Применение викисловарей в задачах автоматической обработки текста и речи ==
 
==Истифодаи Викилуғатҳо дар ҳалли масъалаҳои коркарди матн ва нутқ ==
Для использования лексикографических данных викисловарей при решении задач [[Обработка естественного языка|автоматической обработки текста и речи]] — необходимо преобразовать тексты словарных статей ([[слабоструктурированные данные]]{{sfn|Meyer and Gurevych|2012|p=140}}) в машиночитаемый формат{{sfn|Zesch et al|2008|p=4|loc=Figure 1}}{{sfn|Meyer and Gurevych|2010|p=40}}{{sfn|Крижановский, Преобразование|2010|с=1}}.
 
Барои истифодаи маълумотҳои лексикографикии викилуғатҳо ҳангоми ҳалли масъалаҳо [[Обработка естественного языка|коркарди автоматии матн ва нутқ]]- зарур аст, ки матнҳои мақолаҳои луғавӣ тағйир дода шаванд ([[маълумотҳои сохташон дар сатҳи паст]]{{sfn|Meyer and Gurevych|2012|p=140}}) дар шакли барои мошин хоно{{sfn|Zesch et al|2008|p=4|loc=Figure 1}}{{sfn|Meyer and Gurevych|2010|p=40}}{{sfn|Крижановский, Преобразование|2010|с=1}}.
Извлечение данных из викисловарей является непростой задачей. Можно выделить следующие трудности{{sfn|Hellmann and Auer|2013|p=302|loc=стр. 16 в PDF|name=HellmannAuer2013}}: (1) регулярное и частое изменение как данных, так и самой структуры статей, (2) разные викисловари имеют различную структуру и формат статей<ref group="Прим">Сравните, например, структуру и правила оформления статей в [[wikt:en:Wiktionary:Entry layout explained|Английском Викисловаре]] и [[wikt:Викисловарь:Правила оформления статей|Русском Викисловаре]].</ref>, (3) технология [[вики]] изначально ориентирована на удобство работы человека, а не на машинную обработку.
Аз викилуғатҳо гирифтани маълумот кори саҳл нест.Чунин мушкилотҳоро метавон номбар кард {{sfn|Hellmann and Auer|2013|p=302|loc=стр. 16 в PDF|name=HellmannAuer2013}}: (1) мунтазам ва зуд-зуд тағйирёбии чи маълумот, чи сохти худи мақолаҳо,(2) викилуғатҳои гуногун сохт ва шакли гуногуни мақолаҳоро доранд<ref group="Эзоҳ"> Муқоиса кунед, масалан, сохт ва қоидаҳои таҳияи мақолаҳоро дар [[wikt:en:Wiktionary:Entry layout explained|Викилуғати англисӣ]] ва [[wikt:Викилуғат:Қоидаҳои таҳияи мақолаҳо|дар Викилуғати русӣ]].</ref>, (3) технологияи [[вики]] аз аввал ба осонии кори инсон, на коркарди мошин равона карда шудааст.
Существует несколько [[Синтаксический анализ|парсеров]] для разных викисловарей{{sfn|Hellmann et al|2012|p=3| loc=Table 1}}:
Якчанд [[Таҳлили наҳвии|парсерҳо]] мавҷуд аст{{sfn|Hellmann et al|2012|p=3| loc=Table 1}}:
* [http://dbpedia.org/Wiktionary DBpedia Wiktionary] — одно из расширений проекта [[DBpedia]], данные извлекаются из Английского, Французского, Немецкого и Русского Викисловарей. Извлекаются: язык, часть речи, толкование, семантические отношения, переводы. Для извлечения данных используются: декларативное описание структуры словарной статьи{{sfn|Hellmann et al|2012|pp=8-9}}, [[регулярные выражения]]{{sfn|Hellmann et al|2012|p=10}} и [[:en:Finite state transducer|FST]]-разновидность [[Конечный автомат|конечного автомата]]{{sfn|Hellmann et al|2012|p=11}}.
* [http://www.ukp.tu-darmstadt.de/software/jwktl/ JWKTL] (Java Wiktionary Library) — [[Интерфейс программирования приложений|API]] к данным Английского и Немецкого Викисловарей{{sfn|Zesch et al|2008}}. Извлекаются: язык, часть речи, толкование, цитаты, семантические отношения, этимология и переводы. Программа доступна для некоммерческого использования.
* [https://github.com/componavt/wikokit wikokit] — парсер Английского и Русского Викисловарей{{sfn|Крижановский, Преобразование|2010}}. Извлекаются: язык, часть речи, толкование, цитаты{{sfn|Крижановский|2011}} (только для Русского Викисловаря), семантические отношения{{sfn|Крижановский, Сравнение|2010}} и переводы. Исходный код программы доступен на условиях открытой [[Двойное лицензирование|мульти-лицензии]].
 
С помощью викисловарей решаются разнообразные задачи, связанные с обработкой текста и речи{{sfn|Смирнов и др.|2012|pp=233-234}}:
* [[машинный перевод на основе правил]] между [[Нидерландский язык|нидерландским]] и языком [[африкаанс]]; используются данные Английского и Нидерландского Викисловарей и двух википедий в рамках системы [[Apertium]]{{sfn|Otte and Tyers|2011}};
Line 79 ⟶ 76:
* [[частеречная разметка]]. В работе (Ли и др., 2012){{sfn|Li et al|2012}} на основе данных Английского Викисловаря построены POS-tagger’ы для восьми языков, имеющих «бедные лингвистические ресурсы», с использованием [[Скрытая марковская модель|скрытых марковских моделей]].<ref group="Прим">Исходный код программы и результаты частеречной разметки доступны онлайн: https://code.google.com/p/wikily-supervised-pos-tagger</ref>
* [[анализ тональности текста]]{{sfn|Chesley et al|2006}}.
==Тарҷума==
 
==Истифодаи Викилуғатҳо дар ҳалли масъалаҳои коркарди матн ва нутқ ==
Барои истифодаи маълумотҳои лексикографикии викилуғатҳо ҳангоми ҳалли масъалаҳо [[Обработка естественного языка|коркарди автоматии матн ва нутқ]]- зарур аст, ки матнҳои мақолаҳои луғавӣ тағйир дода шаванд ([[маълумотҳои сохташон дар сатҳи паст]]{{sfn|Meyer and Gurevych|2012|p=140}}) дар шакли барои мошин хоно{{sfn|Zesch et al|2008|p=4|loc=Figure 1}}{{sfn|Meyer and Gurevych|2010|p=40}}{{sfn|Крижановский, Преобразование|2010|с=1}}.
Аз викилуғатҳо гирифтани маълумот кори саҳл нест.Чунин мушкилотҳоро метавон номбар кард {{sfn|Hellmann and Auer|2013|p=302|loc=стр. 16 в PDF|name=HellmannAuer2013}}: (1) мунтазам ва зуд-зуд тағйирёбии чи маълумот, чи сохти худи мақолаҳо,(2) викилуғатҳои гуногун сохт ва шакли гуногуни мақолаҳоро доранд<ref group="Эзоҳ"> Муқоиса кунед, масалан, сохт ва қоидаҳои таҳияи мақолаҳоро дар [[wikt:en:Wiktionary:Entry layout explained|Викилуғати англисӣ]] ва [[wikt:Викилуғат:Қоидаҳои таҳияи мақолаҳо|дар Викилуғати русӣ]].</ref>, (3) технологияи [[вики]] аз аввал ба осонии кори инсон, на коркарди мошин равона карда шудааст.
Якчанд [[Таҳлили наҳвии|парсерҳо]] мавҷуд аст{{sfn|Hellmann et al|2012|p=3| loc=Table 1}}:
*[http://dbpedia.org/Wiktionary DBpedia Wiktionary] — як роҳи васеъшавии лоиҳа [[DBpedia]], маълумотҳо аз Викилуғатҳои англисӣ, франсузӣ, олмонӣ ва русӣ гирифта мешавад. Инҳо гирифта мешаванд: забон, ҳиссаи нутқ, тафсир,муносибатҳои маъноӣ, тарҷумаҳо. Барои гирифтани маълумот инҳо истифода бурда мешаванд: декларативное описание структуры словарной статьи{{sfn|Hellmann et al|2012|pp=8-9}}, [[регулярные выражения]]{{sfn|Hellmann et al|2012|p=10}} и [[:en:Finite state transducer|FST]]-разновидность [[Конечный автомат|конечного автомата]]{{sfn|Hellmann et al|2012|p=11}}.  
== См. также ==
* [[Татоэба]]