Викилуғат: Тафовут байни таҳрирҳо

Content deleted Content added
No edit summary
No edit summary
Сатри 59:
Аз моҳи августи соли 2008 сар карда Викилуғати русӣ аз рӯйи ҳаҷми маълумотҳо дар байни Викилуғатҳо ба ҷойи якум баромад.<ref>[http://stats.wikimedia.org/wiktionary/RU/TablesDatabaseSize.htm Омори викилуғатҳо: Ҳаҷми маълумот]</ref>. Дар айни ҳол миқдори мақолаҳо дар Викилуғати русӣ начандон калон аст<ref>[http://stats.wikimedia.org/wiktionary/RU/Sitemap.htm Омори викилуғатҳо]</ref>.Ин боз аз он хотир аст, ки лоиҳаҳои назар ба Викилуғати русӣ мақолаи зиёд дошта, мақолаҳояшон метавонанд ба ҳисоби миёна ҳаҷман хурдтар бошанд, ба ин аз сомонаи омор боварӣ ҳосил кардан мумкин аст<ref>[http://stats.wikimedia.org/wiktionary/RU/TablesArticlesBytesPerArticle.htm Омори викилуғатҳо: Байтҳо барои мақола]</ref>Ғайр аз ин дар муқоиса бо қисматҳои дигари Wiktionary Википедияи русӣ дар худ маводи зиёди ёридиҳандаро дорад, чун таблитсаи маълумот, рӯйхати басомади вожаҳо (дар муқоиса бо мақолаҳои луғатҳо, ки номҳои зиёдро дороянд, чунин маълумот дар қисматҳои «Замимаҳо», «Индексҳо» ва ғ. ҷойгир мешаванд.) Миқдори зиёди мақолаҳо дар Викилуғати русӣ ҳанӯз ҳам мақола-қолабҳо мебошанд, ки онҳоро ботҳо офаридаанд. Гарчанде баъзан қисми зиёди онҳо зери танқиданд, якчанд бартариҳо дида мешаванд. Якум, вай барои тезтар навишта шудани мақола ёрӣ медиҳанд, чун баъзе маълумотҳо аллакай ворид шудаанд. Дуюм, сохти мақолаҳо стандартӣ мешаванд. Аз ҳисоби дар ҷояш истифода бурдани шаблонҳо (одатан дарҳол аз тарафи ботҳо ба таври автоматӣ ҳангоми офаридани мақола гузошта мешаванд), шароит пайдо мешавад, ки мутамарказона ва якбора шакли зоҳирии якчанд мақола иваз карда шавад. Мавҷудияти миқдори зиёди шаблонҳо низ ба таҳрири автоматии минбаъдаи мақолаҳои аллакай вироишшуда ёрӣ медиҳад - масалан, бо роҳи автоматӣ — тарҷума аз рўйи луғати пешакӣ тайёркарда (азбаски ба ботҳо сохти маӄолаҳоро дарк кардан аз рӯйи лоиҳаҳои махсуси кашида назар ба забони инсонӣ осонтар аст). Хусусияти фарӄунандаи Викилуғати русӣ ин консепсияи таҳияшудаи рушд мебошад. Аз хотири консепсияи коркардшуда ва истифодаи васеи шаблонҳо мақолаҳо дар Викилуғати русӣ нисбат ба лоиҳаҳои дигар якхела ҳастанд (асосан миқдори қисматҳо, пайдарҳамии онҳо ва таҳияи ҳар як қисмат ба як тартиб омадаанд).
== Применение викисловарей в задачах автоматической обработки текста и речи ==
 
Для использования лексикографических данных викисловарей при решении задач [[Обработка естественного языка|автоматической обработки текста и речи]] — необходимо преобразовать тексты словарных статей ([[слабоструктурированные данные]]{{sfn|Meyer and Gurevych|2012|p=140}}) в машиночитаемый формат{{sfn|Zesch et al|2008|p=4|loc=Figure 1}}{{sfn|Meyer and Gurevych|2010|p=40}}{{sfn|Крижановский, Преобразование|2010|с=1}}.
 
Извлечение данных из викисловарей является непростой задачей. Можно выделить следующие трудности{{sfn|Hellmann and Auer|2013|p=302|loc=стр. 16 в PDF|name=HellmannAuer2013}}: (1) регулярное и частое изменение как данных, так и самой структуры статей, (2) разные викисловари имеют различную структуру и формат статей<ref group="Прим">Сравните, например, структуру и правила оформления статей в [[wikt:en:Wiktionary:Entry layout explained|Английском Викисловаре]] и [[wikt:Викисловарь:Правила оформления статей|Русском Викисловаре]].</ref>, (3) технология [[вики]] изначально ориентирована на удобство работы человека, а не на машинную обработку.
Существует несколько [[Синтаксический анализ|парсеров]] для разных викисловарей{{sfn|Hellmann et al|2012|p=3| loc=Table 1}}:
Line 81 ⟶ 79:
Аз викилуғатҳо гирифтани маълумот кори саҳл нест.Чунин мушкилотҳоро метавон номбар кард {{sfn|Hellmann and Auer|2013|p=302|loc=стр. 16 в PDF|name=HellmannAuer2013}}: (1) мунтазам ва зуд-зуд тағйирёбии чи маълумот, чи сохти худи мақолаҳо,(2) викилуғатҳои гуногун сохт ва шакли гуногуни мақолаҳоро доранд<ref group="Эзоҳ"> Муқоиса кунед, масалан, сохт ва қоидаҳои таҳияи мақолаҳоро дар [[wikt:en:Wiktionary:Entry layout explained|Викилуғати англисӣ]] ва [[wikt:Викилуғат:Қоидаҳои таҳияи мақолаҳо|дар Викилуғати русӣ]].</ref>, (3) технологияи [[вики]] аз аввал ба осонии кори инсон, на коркарди мошин равона карда шудааст.
Якчанд [[Таҳлили наҳвии|парсерҳо]] мавҷуд аст{{sfn|Hellmann et al|2012|p=3| loc=Table 1}}:
*[http://dbpedia.org/Wiktionary DBpedia Wiktionary] — як роҳи васеъшавии лоиҳа [[DBpedia]], маълумотҳо аз Викилуғатҳои англисӣ, франсузӣ, олмонӣ ва русӣ гирифта мешавад. Инҳо гирифта мешаванд: забон, ҳиссаи нутқ, тафсир, муносибатҳои маъноӣ, тарҷумаҳо. Барои гирифтани маълумот инҳо истифода бурда мешаванд: декларативноетавсифи описаниедекларативии структурысохти словарноймақолаи статьилуғавӣ{{sfn|Hellmann et al|2012|pp=8-9}}, [[регулярныеибораҳои выражениямунтазам]]{{sfn|Hellmann et al|2012|p=10}} и [[:en:Finite state transducer|FST]]-разновидность гуногуннамудӣ[[КонечныйАвтомати автоматохирин|конечногоавтомати автоматаохирин]]{{sfn|Hellmann et al|2012|p=11}}.  
* [http://www.ukp.tu-darmstadt.de/software/jwktl/ JWKTL] (Java Wiktionary Library) — [[Интерфейси барномасозии замимаҳо|API]] ба маълумоти Викилуғатҳои англисӣ, ва олмонӣ{{sfn|Zesch et al|2008}}. Инҳо гирифта мешаванд: забон, ҳиссаи нутқ, тафсир, шиорҳо, муносибатҳои маъноӣ, таърихи пайдоиш ва тарҷумаҳо. Барнома барои истифодаи ғайритиҷоратӣ.
* [https://github.com/componavt/wikokit wikokit] — парсери Викилуғатҳои англисӣ ва русӣ{{sfn|Крижановский, Преобразование|2010}}. Инҳо гирифта мешаванд: забон, ҳиссаи нутқ, тафсир, шиорҳо{{sfn|Крижановский|2011}} (танҳо барои викилуғати русӣ), муносибатҳои маъноӣ{{sfn|Крижановский, Сравнение|2010}} и переводы. Рамзи натиҷавии барнома бо шартҳои кушода дастрас аст[[Иҷозатдиҳии дугона|мульти-литсензия]].
Бо ёрии викилуғатҳо масъалаҳои гуногун ҳал мегарданд, ки бо коргарди матн ва нутқ вобастаанд{{sfn|Смирнов ва диг.|2012|pp=233-234}}:
== См. также ==
* [[Татоэба]]