Викилуғат: Тафовут байни таҳрирҳо

Content deleted Content added
No edit summary
тарҷума
Сатри 63:
Барои истифодаи маълумотҳои лексикографикии викилуғатҳо ҳангоми ҳалли масъалаҳо [[Обработка естественного языка|коркарди автоматии матн ва нутқ]]- зарур аст, ки матнҳои мақолаҳои луғавӣ тағйир дода шаванд ([[маълумотҳои сохташон дар сатҳи паст]]{{sfn|Meyer and Gurevych|2012|p=140}}) дар шакли барои мошин хоно{{sfn|Zesch et al|2008|p=4|loc=Figure 1}}{{sfn|Meyer and Gurevych|2010|p=40}}{{sfn|Крижановский, Преобразование|2010|с=1}}.
Извлечение данных из викисловарей является непростой задачей. Можно выделить следующие трудности{{sfn|Hellmann and Auer|2013|p=302|loc=стр. 16 в PDF|name=HellmannAuer2013}}: (1) регулярное и частое изменение как данных, так и самой структуры статей, (2) разные викисловари имеют различную структуру и формат статей<ref group="Прим">Сравните, например, структуру и правила оформления статей в [[wikt:en:Wiktionary:Entry layout explained|Английском Викисловаре]] и [[wikt:Викисловарь:Правила оформления статей|Русском Викисловаре]].</ref>, (3) технология [[вики]] изначально ориентирована на удобство работы человека, а не на машинную обработку.
Аз викилуғатҳо гирифтани маълумот кори саҳл нест.Чунин мушкилотҳоро метавон номбар кард {{sfn|Hellmann and Auer|2013|p=302|loc=стр. 16 в PDF|name=HellmannAuer2013}}: (1) мунтазам ва зуд-зуд тағйирёбии чи маълумот, чи сохти худи мақолаҳо,(2) викилуғатҳои гуногун сохт ва шакли гуногуни мақолаҳоро доранд<ref group="Эзоҳ"> Муқоиса кунед, масалан, сохт ва қоидаҳои таҳияи мақолаҳоро дар [[wikt:en:Wiktionary:Entry layout explained|Викилуғати англисӣ]] ва [[wikt:Викилуғат:Қоидаҳои таҳияи мақолаҳо|дар Викилуғати русӣ]].</ref>, (3) технологияи [[вики]] аз аввал ба осонии кори инсон, на коркарди мошин равона карда шудааст.
Аз викилуғатҳо гирифтани маълумот кори саҳл нест.
Существует несколько [[Синтаксический анализ|парсеров]] для разных викисловарей{{sfn|Hellmann et al|2012|p=3| loc=Table 1}}:
Якчанд [[Таҳлили наҳвии|парсерҳо]] мавҷуд аст{{sfn|Hellmann et al|2012|p=3| loc=Table 1}}:
* [http://dbpedia.org/Wiktionary DBpedia Wiktionary] — одно из расширений проекта [[DBpedia]], данные извлекаются из Английского, Французского, Немецкого и Русского Викисловарей. Извлекаются: язык, часть речи, толкование, семантические отношения, переводы. Для извлечения данных используются: декларативное описание структуры словарной статьи{{sfn|Hellmann et al|2012|pp=8-9}}, [[регулярные выражения]]{{sfn|Hellmann et al|2012|p=10}} и [[:en:Finite state transducer|FST]]-разновидность [[Конечный автомат|конечного автомата]]{{sfn|Hellmann et al|2012|p=11}}.
* [http://www.ukp.tu-darmstadt.de/software/jwktl/ JWKTL] (Java Wiktionary Library) — [[Интерфейс программирования приложений|API]] к данным Английского и Немецкого Викисловарей{{sfn|Zesch et al|2008}}. Извлекаются: язык, часть речи, толкование, цитаты, семантические отношения, этимология и переводы. Программа доступна для некоммерческого использования.