Викилуғат
Викилуғат (англ. Wiktionary) — луғат ва тезауруси бисёрсоҳавӣ ва чандзабонаест, ки дар асоси вики-давак озодона пуррашаванда мебошад. Яке аз лоиҳаҳои фонди «Викимедиа» аст. Сараввал дар забони инглисӣ 12 декабри соли 2002 пайдо шуд.
Wiktionary | |
---|---|
URL | www.wiktionary.org |
Тиҷорӣ | Нет |
Навъи вебгоҳ | Луғати интернетӣ |
Сабтином | Ҳатмӣ нест |
Забон(-ҳо) | 170 |
Макони сервер | Майами |
Молик | Фонди Викимедиа |
Бунёнгузор | Ҷимбо Вейлс |
Оғози кор | 12 декабр 2002 |
Рутбаи Alexa | 474, 523, 494[1] ва 502 |
Парвандаҳо дар Викианбор |
Дар луғат тавсифи грамматикӣ, тафсир ва тарҷумаи вожаҳо (калимаҳо)оварда мешаванд. Илова бар ин, дар мақолаҳо маълумотро доир ба таърихи пайдоиши вожаҳо, хусусияти фонетикӣ ва алоқаи луғавии калимаҳо низ додан мумкин аст. Ҳамин тавр, Викилуғат - кӯшиши пайваст кардани луғатҳои грамматикӣ, тафсирӣ, этимологӣ, чандзабона ва тезаурус мебошад.
Маълумоти викилуғатҳо дар ҳалли масъалаҳои гуногун, ки бо коркарди мошинии матн ва нутқ вобастаанд, зиёд истифода бурда мешаванд.
Консепсияи лексикографикӣ
вироишБа шарофати робитаи мутақобилаи қисматҳои гуногуни забонии Wiktionary, инчунин миёни иштирокдорони лоиҳаҳои луғавӣ ва дигар лоиҳаҳои «Фонди Викимедиа», иштирокдорони ҳар кадом аз лоиҳаҳо метавонанд консепсия, воситаҳо ва маводҳои лексикографикиро, ки ҳампешагонашон - соҳибони дигар забон офаридаанд, истифода баранд. Дар ҷараёни кор бо қисматҳои гуногуни забонии луғат консепсияи маҷмӯии манбаъҳои лексикографикии универсиалӣ ба вуҷуд омад, ки бори якум ба шарофати технологияи электронӣ имконпазир гардидааст. Дар натиҷа, консепсия тавсифи пурра ва ҳаматарафаи тамоми воҳидҳои маъноии (лексикӣ) ҳамаи забонҳои табиӣ (забонҳои сунъии асосӣ), ки дорои хат ҳастанд, дар назар дорад. Тавсифи пурра маънои мавҷудияти маълумотҳо дар бораи хусусиятҳои фонетикӣ, сарфӣ, наҳвӣ ва маъногии воҳиди лексикӣ, таърихи пайдоиши он, иборасозӣ ва фразеологияро дорад. Пуррагӣ ва дараҷаи пайдарҳамии амалӣ гардидани консепсияи мазкур дар қисматҳои гуногуни забонии лоиҳа метавонад тағйир ёбад. Дар ҳар қисмати забонӣ забони «сарлавҳа» забони марказӣ маҳсуб буда, ҳамаи мақолаҳо танҳо бо ҳамин забон вироиш мешаванд, ғайр аз ин мақсад гузошта мешавад, ки тарҷумаи вожаҳо ва воҳидҳои дигари ин забон то ҳадди имкон ба забонҳои зиёд оварда шавад. Вожаҳои дигар забонҳо танҳо ба забони «сарлавҳа» тарҷума мешаванд. Чунончи, дар Викилуғати русӣ вожаҳои русӣ ба забонҳои хориҷӣ тарҷума ва тафсир дода мешаванд ва вожаҳои хориҷӣ бошанд бе тафсир танҳо тарҷума оварда мешавад. Ҳангоми тафсири сарф (морфология) кӯшиш мешавад, ки тасвири ниҳоии тасрифи вожаҳо бо таснифоташон дода шавад. Аз ҷумла, маълумоти сарфии воҳидҳои луғавии забони русӣ мувофиқи таснифоти пешниҳодкардаи А. А. Зализняк оварда мешавад.
Барои пурра кардани Викилуғат рӯйхати калони адабиёт оварда шудааст рӯйхати адабиёт, дар Викилуғати англисӣ қоидаҳои ба луғат дохил кардани терминҳо (калимаҳои соҳавӣ) таҳия шудаанд (нигар: Criteria for inclusion). Дар фарқият аз Википедияи русӣ, ки дар интихоби мавод бартарӣ ба сарчашмаҳои эътиборнок дода мешавад Википедиа:Сарчашмаҳои эътиборнок
, мақолаҳо бояд дар Википедия дар асоси сарчашмаҳои эътиборнок офарида шаванд.
</ref>, дар Викилуғати русӣ ба мақолаи аз ҷониби муҳаррир ҷиҳати истифодаи вожаҳо таҳриршуда бартарӣ дода мешавад. Викисловарь: Лексикографическая концепция
. Ҳангоми мавҷуд будани ихтилофи назар доир ба ягон хусусияти тасвиршавандаи ягон воҳиди забонӣ бартарӣ (аз нуқтаи назари исботнокияш) ба сарчашмаи корпусӣ дода мешавад.
</ref>.
Тезаурус
вироишВикилуғат аз муносибатҳои маъногии зерин иборат аст:синонимҳо, антонимҳо, гиперонимҳо, гипонимҳо, согипонимҳо, холонимҳо, меронимҳо, паронимҳо.
Википедиа ва Викилуғат
вироишВикилуғат тавсифи мукаммал ва маълумоти энсиклопедиро дар бар намегирад. Бо вуҷуди ин, Викилуғат маълумоти беназирро пешкаш мекунад, ки он дар Википедия мавҷуд нест: ибораҳо, мақолҳо, калимаҳои мураккаби мухтасаршуда, акронимҳо, та[2] всифи ғалатҳои имлоӣ, шаклҳои нодурусти навишт ва талаффузи вожаҳои фаннӣ [3]. Ҳамин тавр, Википедия ва Викилуғат якдигарро пурра мегардонанд.
Викилуғат аз он ҷиҳат ба Википедия монанд аст, ки (1) ба мақолаҳо доир ба вожаҳои дохили Викилуғат истиноди дохилӣ ҳаст, (2) гурӯҳҳо ҳастанд, (3) интервикиҳо, ки ба мақолаҳо доир ба ҳамин вожа дар луғати забонҳои дигар ишора мекунанд, ҳастанд [3].
Пайвастани лоиҳаҳо
вироишБа корбарони Википедия тавсия дода мешавад,ки барои пайвастан(алоқаманд кардан) бо мақолаи муносиби Викилуғат ба мақолаҳо шаблони «викилуғат»-ро илова кунанд (масалан, {{Викилуғат|Викилуғат}}). Барои нишон додани ҳаволаи баръакс дар саҳифаи Викилуғат бошад, шаблони «википедия» истифода шавад (масалан, {{Википедия|Википедия}}).
Истифодаи чунин шаблонҳо имконият медиҳад, ки кунҷҳои тези мушкилоти «энсиклопедия ё луғат» ҳамвор шавад ва ба маълумот роҳ ёфтан қулайтар гардад, азбаски ба маълумоти иловагии забонӣ доир ба вожа дар энсиклопедия ва баръакс ба тавсифи амиқи маънои вожа дар луғат истинод медиҳад, дар маҷмӯъ вобастагии мақолаҳоро дар лоиҳаҳои Фонди Викимедиа беҳтар мегардонад.
Агар нишон додани истинод ба муайян кардани вожа дар дохили матни мақола даркор бошад,(шаблон «викилуғат» як қисми алоҳидаро илова мекунад) бо истифодаи интервики - истинодҳои байнилоиҳавӣ, ки чунин муқаррар карда мешаванд:[[wikt:ru:понятие|вожа]]
ё кӯтоҳтар [[:wikt:вожа|]]
чунин шакл дорад: вожа.
Қисмати забони тоҷикӣ
вироишҶараёни инкишофи Викилуғати тоҷикӣ
вироишҚисмати тоҷикии Wiktionary баҳори соли 2004 ташкил карда шуд. Дар муддати яку ним сол он инкишоф наёфт, бе низоми муайян ва бо маводи бесифат пурра мегашт.Вазъият дар охири соли 2005 ва аввали соли 2006 тағйир ёфт. Соли 2006 мудири якум таъйин шуд, миқдори мақолаҳо нисбат ба соли пештара чор маротиба афзуд. Воситаҳои пурқувват барои тавсифи сарф (морфология), оғози ташаккули инкишофи низоми категорияҳои маъноӣ офарида шуданд. Тирамоҳи соли 2006 миқдори мақолаҳо дар Викилуғати русӣ ба 10 000 расид; Сипас ба шарофати офарида шудани ботҳо,ки луғатномаҳои қисматҳои дигари Wiktionary- ро барои тавлиди мақолаҳо - қолабҳо (болванкаҳо) дар қисмати русӣ истифода мебаранд, дар давоми яку ним моҳ қариб 70 000 мақола илова шуд.7 ноябри соли 2006 миқдори мақолаҳо дар Викилуғат аз 80 000 гузашт, 10 декабри соли 2006 бошад, ба 100 000 расид. 21 марти соли 2009 миқдори мақолаҳо то 200 000 афзуд. Миқдори иштирокдорони фаъол 20 нафарро ташкил кард. Дар фарқият бо луғатҳои анъанавӣ пуррагии Викилуғатро набояд аз рӯйи миқдори мақолаҳо баҳо дод, Ҳисобкунаки автоматӣ мақола-қолабҳои нимхолиро аз мақолаҳои иттилоотӣ фарқ намекунад, ғайр аз ин ҳисобкунаки автоматӣ омонимҳои дохилизабонӣ ва омонимҳои байнизабониро ба ҳисоб намегирад. Масалан, вориди луғавии бор ҳамчун як мақола ҳисобида шудааст, дар асл бошад ин мақола якчанд воҳидҳои луғавӣ, яъне омонимҳои забони русиро тавсиф мекунад, бар замми ин воҳидҳои луғавии ҳамноми дигар забонҳоро низ (булғорӣ, тоторӣ),- дар луғатҳои анъанавӣ ин мавод ҳамчун якчанд мақола шакл мегирифт ва шуморида мешуд.
Муқоиса бо дигар Викилуғатҳо
вироишАз моҳи августи соли 2008 сар карда Викилуғати русӣ аз рӯйи ҳаҷми маълумотҳо дар байни Викилуғатҳо ба ҷойи якум баромад.[5]. Дар айни ҳол миқдори мақолаҳо дар Викилуғати русӣ начандон калон аст[6].Ин боз аз он хотир аст, ки лоиҳаҳои назар ба Викилуғати русӣ мақолаи зиёд дошта, мақолаҳояшон метавонанд ба ҳисоби миёна ҳаҷман хурдтар бошанд, ба ин аз сомонаи омор боварӣ ҳосил кардан мумкин аст[7] Ғайр аз ин дар муқоиса бо қисматҳои дигари Wiktionary Википедияи русӣ дар худ маводи зиёди ёридиҳандаро дорад, чун таблитсаи маълумот, рӯйхати басомади вожаҳо (дар муқоиса бо мақолаҳои луғатҳо, ки номҳои зиёдро дороянд, чунин маълумот дар қисматҳои «Замимаҳо», «Индексҳо» ва ғ. ҷойгир мешаванд.) Миқдори зиёди мақолаҳо дар Викилуғати русӣ ҳанӯз ҳам мақола-қолабҳо мебошанд, ки онҳоро ботҳо офаридаанд. Гарчанде баъзан қисми зиёди онҳо зери танқиданд, якчанд бартариҳо дида мешаванд. Якум, вай барои тезтар навишта шудани мақола ёрӣ медиҳанд, чун баъзе маълумотҳо аллакай ворид шудаанд. Дуюм, сохти мақолаҳо стандартӣ мешаванд. Аз ҳисоби дар ҷояш истифода бурдани шаблонҳо (одатан дарҳол аз тарафи ботҳо ба таври автоматӣ ҳангоми офаридани мақола гузошта мешаванд), шароит пайдо мешавад, ки мутамарказона ва якбора шакли зоҳирии якчанд мақола иваз карда шавад. Мавҷудияти миқдори зиёди шаблонҳо низ ба таҳрири автоматии минбаъдаи мақолаҳои аллакай вироишшуда ёрӣ медиҳад - масалан, бо роҳи автоматӣ — тарҷума аз рўйи луғати пешакӣ тайёркарда (азбаски ба ботҳо сохти маӄолаҳоро дарк кардан аз рӯйи лоиҳаҳои махсуси кашида назар ба забони инсонӣ осонтар аст). Хусусияти фарӄунандаи Викилуғати русӣ ин консепсияи таҳияшудаи рушд мебошад. Аз хотири консепсияи коркардшуда ва истифодаи васеи шаблонҳо мақолаҳо дар Викилуғати русӣ нисбат ба лоиҳаҳои дигар якхела ҳастанд (асосан миқдори қисматҳо, пайдарҳамии онҳо ва таҳияи ҳар як қисмат ба як тартиб омадаанд).
Истифодаи Викилуғатҳо дар ҳалли масъалаҳои коркарди матн ва нутқ
вироишБарои истифодаи маълумотҳои лексикографикии викилуғатҳо ҳангоми ҳалли масъалаҳо коркарди автоматии матн ва нутқ- зарур аст, ки матнҳои мақолаҳои луғавӣ тағйир дода шаванд (маълумотҳои сохташон дар сатҳи паст[8]) дар шакли барои мошин хоно[9][10][11]. Аз викилуғатҳо гирифтани маълумот кори саҳл нест.Чунин мушкилотҳоро метавон номбар кард [12]: (1) мунтазам ва зуд-зуд тағйирёбии чи маълумот, чи сохти худи мақолаҳо,(2) викилуғатҳои гуногун сохт ва шакли гуногуни мақолаҳоро доранд. Муқоиса кунед, масалан, сохт ва қоидаҳои таҳияи мақолаҳоро дар Викилуғати англисӣ ва дар Викилуғати русӣ.</ref>, (3) технологияи вики аз аввал ба осонии кори инсон, на коркарди мошин равона карда шудааст. Якчанд парсерҳо мавҷуд аст[13]:
- DBpedia Wiktionary Бойгонӣ шудааст 4 май 2013 сол. — як роҳи васеъшавии лоиҳа DBpedia, маълумотҳо аз Викилуғатҳои англисӣ, франсузӣ, олмонӣ ва русӣ гирифта мешавад. Инҳо гирифта мешаванд: забон, ҳиссаи нутқ, тафсир, муносибатҳои маъноӣ, тарҷумаҳо. Барои гирифтани маълумот инҳо истифода бурда мешаванд: тавсифи декларативии сохти мақолаи луғавӣ[14], ибораҳои мунтазам[15] и FST-гуногуннамудӣавтомати охирин[16].
- JWKTL (Java Wiktionary Library) — API ба маълумоти Викилуғатҳои англисӣ, ва олмонӣ[17]. Инҳо гирифта мешаванд: забон, ҳиссаи нутқ, тафсир, шиорҳо, муносибатҳои маъноӣ, таърихи пайдоиш ва тарҷумаҳо. Барнома барои истифодаи ғайритиҷоратӣ.
- wikokit — парсери Викилуғатҳои англисӣ ва русӣ[18]. Инҳо гирифта мешаванд: забон, ҳиссаи нутқ, тафсир, шиорҳо[19] (танҳо барои викилуғати русӣ), муносибатҳои маъноӣ[20] и переводы. Рамзи натиҷавии барнома бо шартҳои кушода дастрас астмульти-литсензия.
Бо ёрии викилуғатҳо масъалаҳои гуногун ҳал мегарданд, ки бо коргарди матн ва нутқ вобастаанд[21]:
- тарҷумаи мошинӣ дар асоси қоидаҳо байни забони нидерландӣ ва забони африкаанс; маълумотҳои Викилуғатҳои англисӣ ва нидерландӣ ва ду Википедия дар доираи системаиApertium[22];
- таъсиси луғати хонои мошинӣ бо парсери NULEX, ки захираҳои кушоди забониро ҳамгиро аст: Викилуғати англисӣ,WordNet ва VerbNet[23]. Барои исм аз Викилуғати англисӣ ҳиссаи нутқ ва шакли ҷамъбандии исм гирифта мешаванд, барои феъл - замони феъл. Барои гирифтани маълумотҳо аз Викилуғат усули Screen scraping истифода мешавад;
- сохти онтологияҳо[24] и асоси донишҳо[25];
- инъикоси онтологияҳо[26];
- содашавии матнҳо. Дар кор [27] ба мураккабии вожаҳо дар асоси маълумоти Викилуғат баҳо дода мешавад. Барои вожа аз Викилуғати англисӣ инҳо гирифта мешаванд: ҳаҷми мақолаи луғавӣ, шумораи ҳиссаҳои нутқ,шумораи арзишҳо ва шумораи тарҷумаҳо. Муаллифон[27] тахмин карданд, ки аз ҳама содатарин, асоситарин, маъмултарин вожаҳое ҳисобида мешаванд, ки маъноҳои зиёдтар (яъне ҳаҷми мақола калонтар мешавад), ҳиссаҳои нутқ бештар ва тарҷумаҳояшон низ бисёртар бошанд. Сипас вожаҳои «мураккаб»и дар матн ёфтшуда бояд бо пайдо кардани муодилҳои «сода» дигаргун намуд, ин матнро осон (мутобиқгардонӣ) менамояд;
- аломатгузории қисмҳои нутқ. Дар кори (Ли и диг., 2012)[28] дар асоси маълумоти Викилуғати англисӣ POS-tagger’ы барои ҳашт забони «захираи ками забонӣ» дошта бо истифодаи сохта шудаанд бо истифодаи намунаи пинҳони марковӣ.Рамзи натиҷавии барномаҳо ва натиҷаҳои аломатгузории қисмҳои нутқи дастраси онлайн: https://code.google.com/p/wikily-supervised-pos-tagger</ref>
- таҳлили оҳанги матн[29].
- эътироф ва синтези нутқ , дар ҷое, ки Викилуғат дар вазифаи сарчашмаи маълумотҳо барои сохти автоматии луғати талаффуз баромад мекунад[30]. Ҷуфти вожаҳои талаффузшаванда гирифта мешаванд Извлекаются пары слово-произношение (транскрипсия дар низомиАФБ) аз Викилуғатҳои чехӣ, англисӣ, фаронсавӣ, олмонӣ, полякӣ ва испанӣ. Агар дар мақолаи луғавӣ якчанд транскрипсия бошад, аввалаш гирифта мешавад.</ref>. Ҳангоми тафтиш миқдори зиёди ғалатҳо дар транскрипсияҳои аз Викилуғати англисӣ гирифта шуда пайхас карда шуд.[31];
Нигаред:
вироишТафсир
вироишЭзоҳ
вироиш- ↑ Alexa Internet (ингл.) — 1996.
- ↑ [1]
- ↑ 3.0 3.1 Zesch et al, 2008, p. 2.
- ↑ Смирнов и диг., 2012.
- ↑ Омори викилуғатҳо: Ҳаҷми маълумот
- ↑ Омори викилуғатҳо
- ↑ Омори викилуғатҳо: Байтҳо барои мақола
- ↑ Meyer and Gurevych, 2012, p. 140.
- ↑ Zesch et al, 2008, Figure 1, p. 4.
- ↑ Meyer and Gurevych, 2010, p. 40.
- ↑ Крижановский, Преобразование, 2010, с. 1.
- ↑ Hellmann and Auer, 2013, стр. 16 в PDF, p. 302.
- ↑ Hellmann et al, 2012, Table 1, p. 3.
- ↑ Hellmann et al, 2012, pp. 8-9.
- ↑ Hellmann et al, 2012, p. 10.
- ↑ Hellmann et al, 2012, p. 11.
- ↑ Zesch et al, 2008.
- ↑ Крижановский, Преобразование, 2010.
- ↑ Крижановский, 2011.
- ↑ Крижановский, Сравнение, 2010.
- ↑ Смирнов ва диг., 2012, pp. 233-234.
- ↑ Otte and Tyers, 2011.
- ↑ McFate and Forbus, 2011.
- ↑ Meyer and Gurevych, 2012.
- ↑ ConceptNet 5. 17 апрели 2013 санҷида шуд. Баргирифта аз сарчашмаи аввал 19 апрели 2013.
- ↑ Lin and Krizhanovsky, 2011.
- ↑ 27.0 27.1 Medero and Ostendorf, 2009.
- ↑ Li et al, 2012.
- ↑ Chesley et al, 2006.
- ↑ Schlippe et al., 2012.
- ↑ Schlippe et al., 2012, p. 4804.
Таърих
вироиш- . — СПб.: С.-Петербургский гос. университет, Филологический факультет, 2011. — С. 348. — ISBN 978-5-8465-0005-5.
- . — СПб., 2012. — Ҷ. 23.
- . — 2006. — Ҷ. 580.
- / Gurevych, Iryna; Kim, Jungi. — Springer, 2013. — 378 с. — (Theory and Applications of Natural Language Processing). — ISBN 978-3-642-35084-9.
- . — 2011.
- . — The Association for Computer Linguistics, 2011. — ISBN 978-1-932432-88-6.
- . — 2009.
- / M. T. Pazienza and A. Stellato. — IGI Global, 2012. — ISBN 978-1-4666-0188-8.
- / Mikel L. Forcada, Heidi Depraetere, Vincent Vandeghinste. — Leuven, Belgium, 2011.
- . — 2012.
Манбаъ
вироишВикилуғат дар Викианбор |