World News in Latvian

Новости сегодня на DirectAdvert

Новости сегодня от Adwile

Kā saglabāsim latviešu valodu mākslīgā intelekta un lielo valodas modeļu laikmetā?

IR 

Mākslīgais intelekts (MI) mūsdienās kļūst par ikdienas tehnoloģiju neatņemamu sastāvdaļu, un tā izplatība strauji pieaug. Daudzi to saista ar tādiem rīkiem kā ChatGPT, kuru pamatā ir lielie valodas modeļi, kas trenēti, izmantojot milzīgus teksta un citu datu apjomus. Tomēr šajā procesā mazo kopienu valodas, arī latviešu valoda, bieži paliek ēnā.

Piemēram, vairāk nekā 90% ChatGPT modeļa apmācībā izmantoto datu ir angļu valodā, bet atlikušo daļu pārsvarā sastāda dati tādās lielajās valodas kā vācu, franču, portugāļu, spāņu un mandarīnu. Šis ir tikai viens no iemesliem, kādēļ Latvijai ir jāveido savs nacionālais lielais valodas modelis, kas spētu nodrošināt latviešu valodas saglabāšanu un attīstību digitālajā laikmetā. Ceram, ka nesenajā Valsts prezidenta Edgara Rinkēviča tikšanās reizē ar “OpenAI” vadītāju Samu Altmanu arī šis jautājums ir pārrunāts.

Arvien vairāk mākslīgā intelekta risinājumi tiek veidoti, izmantojot lielo valodas modeļu tehnoloģiju, piemēram, ChatGPT, Microsoft Copilot, Gemini. Ļoti iespējams, ka ilgtermiņā šī tehnoloģija aizstās visas līdzšinējās tehnoloģijas – mašīntulkošanu, valodas atpazīšanu, teksta analīzi, datorredzi u.c. Mākslīgais intelekts varētu agregēt tekstuālos datus un attēlus, padarot to visu pieejamu lielā valodas modelī. Tā būtu bāzes tehnoloģija visiem nākotnes risinājumiem, kurus mēs šobrīd vēl varam tikai iztēloties vai arī redzēt fantastikas filmās.

ASV dominē tehnoloģiju giganti, Eiropa iet citu ceļu

MI rīku izstrādē šobrīd dominē ASV tehnoloģiju milži – Microsoft, Google, Meta, Amazon. Šiem uzņēmumiem ir milzīga datorjauda, intelektuālā kapacitāte un arī vērienīgi finanšu resursi. Tā kā ASV darba un datu valoda primāri ir angļu, tad šo gigantu izstrādātie risinājumi ir augstas kvalitātes, plaša lietojuma un strauji iekaro tirgu. Taču šie ASV uzņēmumi skatās arī uz procesiem un notikumiem citur pasaulē. Tie skaidri apzinās Eiropas tirgus potenciālu un ir gatavi ātri un efektīvi aizpildīt esošo trūkumu augstas kvalitātes lielajiem valodu modeļiem, kas pielāgoti Eiropas valodām. Par to liecina nesenais darījums, kad tehnoloģiju gigants AMD par 665 miljoniem ASV dolāru iegādājās somu uzņēmumu Silo.ai, kas tiek uzskatīts par līderi lielo valodas modeļu izstrādē Ziemeļeiropas valstu valodām.

Eiropas Savienība (ES) ir gājusi citu ceļu. Šeit tehnoloģija nav nozares gigantu rokās. Lielo valodas modeļu ieviešanu varētu salīdzināt ar industriālo revolūciju – tā būs automatizācijas un robotizācijas nākotne, tikai nu jau citā līmenī. Eiropas valstis šo ļoti labi apzinās, tāpēc kopīgiem spēkiem ir radīti vairāki superdatori, kas dažādu inovāciju programmu ietvaros kļūs pieejami nozares uzņēmumiem. Latvijas uzņēmums Tilde, uzvarot Eiropas Komisijas rīkotajā konkursā Mākslīgā intelekta lielais izaicinājums, ir viens no pirmajiem četriem uzņēmumiem, kam būs iespēja izmantot visjaudīgāko Eiropas superdatoru LUMI. Ar tā palīdzību Tilde varēs izstrādāt daudzvalodīgu, sarunbotam ChatGPT līdzīgu lielo valodas modeli latviešu, lietuviešu un citām Eiropas mazo kopienu valodām. Izmantoto datu apjoms būs tik milzīgs, ka nedz Baltijas valstīs, ne citur Eiropā līdz šim pieejamajos datu centros šādas lielo valodas modeļu apmācības nevar notikt. Šāds fundamentālais daudzvalodu modelis kalpos kā pamats turpmāko nacionālo lielo valodas modeļu izveidei un MI risinājumu pielāgošanai.

Nepieciešama politiska iniciatīva

Lai nākotnē saglabātu spēju izmantot un attīstīt MI rīkus latviešu valodā un veiksmīgi konkurētu ar citām pasaules valstīm, Latvijai ir jāizveido nacionālais valodas modelis. Gandrīz katrā Eiropas valstī jau šādas iniciatīvas notiek. Piemēram, Nīderlande tikko uzsāka realizēt nacionālā līmeņa programmu un piešķīra vairāku miljonu eiro finansējumu nacionālā valodas modeļa izstrādei. Arī Polija 2023. gada novembrī uzsāka viena gadu projektu ar mērķi izveidot nacionālo valodas modeli. Mūsu kaimiņi lietuvieši jūnija beigās noslēdza iepirkumu par Lietuvas nacionālā valodas modeļa izstrādi un ieviešanu. Igaunijas valdība nule piešķīrusi finansējumu Tartu Universitātei pirmajam izstrādes solim – datu apzināšanai un savākšanai, lai turpmāk veidotu lielo valodas modeļu apmācību. Lielajās valstīs – Vācijā, Francijā un Spānijā – jau ir pat izveidotas vairākas nacionālā valodas modeļa versijas.

Kas būtu jādara Latvijai? Pirmkārt, ir nepieciešama valdības iniciatīva, budžets un administratīvo šķēršļu mazināšana, jo datiem ir zināmi ierobežojumi. Tie var saturēt arī konfidenciālu informāciju, tāpēc to ir nepieciešams anonimizēt. Otrkārt, būtu jāiesaistās akadēmiskajai videi un citām organizācijām jeb datu turētājiem – Nacionālajai bibliotēkai, arhīvam, arī medijiem. Treškārt, protams, gan Tilde, gan citiem nozares uzņēmumiem ir jābūt gataviem iesaistīties ar savām zināšanām un jau izstrādātajiem tehnoloģiskajiem risinājumiem. Latviešu valoda ar tās plašo leksisko, morfoloģisko un sintaktisko daudzveidību prasa īpašu pieeju mākslīgā intelekta izveidē. Jāņem vērā, ka nacionālā lielā valodas modeļa izstrāde nav tikai tehnoloģisks projekts, bet arī kultūras un valodas saglabāšanas jautājums.

Nākotnes perspektīvas un Latvijas priekšrocības

MI tehnoloģija jau tagad pierāda savu jaudu un praktisko pielietojumu gan individuālos, gan biznesa lietojumos, piemēram, informācijas apkopošanā, atbilžu sagatavošanā un tekstu analīzē. Šāda tehnoloģija būtiski palielina cilvēkresursu kapacitāti un produktivitāti, ļaujot cilvēkiem koncentrēties uz darbiem ar lielāku pievienoto vērtību.

Latvijai kā mazai valstij ir iespēja ātri pieņemt un ieviest jaunas tehnoloģijas. Izveidojot nacionālo lielo valodas modeli, Latvija var nodrošināt vērā ņemamu tehnoloģisko izrāvienu, kas ne tikai saglabās latviešu valodu nākotnes digitālajā pasaulē, bet arī sniegs ekonomiskus ieguvumus, palielinot valsts konkurētspēju globālajā tirgū.

Tāpēc ir būtiski, lai Latvija apzinās šo iespēju un veic nepieciešamos soļus nacionālā valodas modeļa izveidei, stiprinot latviešu valodas un kultūras vietu mākslīgā intelekta laikmetā.

 

Autors ir Tildes valdes priekšsēdētājs

The post Kā saglabāsim latviešu valodu mākslīgā intelekta un lielo valodas modeļu laikmetā? appeared first on IR.lv.

Читайте на 123ru.net

Другие проекты от 123ru.net



Архангельск

ТСД SAOTRON RT41 GUN: практичный, производительный, надёжный



Мир

После отдыха в Турции муж теперь постоянно просит такую яичницу на завтрак: вот рецепт, ингредиенты есть в любом российском магазине






Новости 24 часа

В Москве ежегодно состоялся юбилейный, всероссийский, патриотический гала-концерт «Проза и поэзия» «Россия - семья семей»



Game News

Над Destiny Rising работают бывшие разработчики Diablo Immortal



Москва

Можно ли перевестись из одной автошколы в другую в процессе обучения?



News Every Day

Elle King shares major life update after opening up about 'toxic' relationship with dad Rob Schneider



Авто

Специалисты обозначили наиболее востребованные для приобретения и страхования автомобилей полисы КАСКО.



Москва

В Королеве стартовало строительство поликлиники на 1 тыс посещений в смену



Сергей Брановицкий

Дистрибьюция Музыки. Дистрибьюция Музыки в России. Дистрибьюция музыки в вк. Яндекс музыка дистрибьюция. Цифровая дистрибьюция музыка. Дистрибьюция музыки под ключ.



Москва

Мужчина пытался похитить ребенка с территории школы в Москве



Елена Веснина

«Теннисистки заслуживают зарабатывать на равных с мужчинами». Веснина выступила за соразмерные призовые



Москва

Hybrid запустил онлайн-академию Hybrid Training Hub



Анфиса Чехова

Агния Кузнецова в шоу «Вкусно с Анфисой Чеховой» рассказала, как убедила Балабанова взять на роль её однокурсника



Симферополь

Творческая композиция «Диво дивное руки творят».



Москва

В Москве ежегодно состоялся юбилейный, всероссийский, патриотический гала-концерт «Проза и поэзия» «Россия - семья семей»



Москва

Собянин: Конкурс грантов для НКО побил рекорд по числу одобренных заявок



Москва

Hybrid запустил онлайн-академию Hybrid Training Hub



103news.com — быстрее, чем Я..., самые свежие и актуальные новости Вашего города — каждый день, каждый час с ежеминутным обновлением! Мгновенная публикация на языке оригинала, без модерации и без купюр в разделе Пользователи сайта 103news.com.

Как добавить свои новости в наши трансляции? Очень просто. Достаточно отправить заявку на наш электронный адрес mail@29ru.net с указанием адреса Вашей ленты новостей в формате RSS или подать заявку на включение Вашего сайта в наш каталог через форму. После модерации заявки в течении 24 часов Ваша лента новостей начнёт транслироваться в разделе Вашего города. Все новости в нашей ленте новостей отсортированы поминутно по времени публикации, которое указано напротив каждой новости справа также как и прямая ссылка на источник информации. Если у Вас есть интересные фото Вашего города или других населённых пунктов Вашего региона мы также готовы опубликовать их в разделе Вашего города в нашем каталоге региональных сайтов, который на сегодняшний день является самым большим региональным ресурсом, охватывающим все города не только России и Украины, но ещё и Белоруссии и Абхазии. Прислать фото можно здесь. Оперативно разместить свою новость в Вашем городе можно самостоятельно через форму.

Другие популярные новости дня сегодня


Новости 24/7 Все города России





Топ 10 новостей последнего часа




Новости России

В Подмосковье сотрудники Росгвардии задержали подозреваемого в убийстве

Столичную подземку начали готовить к зимнему сезону

Агния Кузнецова в шоу «Вкусно с Анфисой Чеховой» рассказала, как убедила Балабанова взять на роль её однокурсника

Путин назвал выбором Запада отказ от дешевых энергоносителей РФ


Москва

Можно ли перевестись из одной автошколы в другую в процессе обучения?






Rss.plus

Можно ли перевестись из одной автошколы в другую в процессе обучения?

В Подмосковье сотрудники Росгвардии задержали подозреваемого в убийстве

Обзор известных приложений, созданных на iOS

Агния Кузнецова в шоу «Вкусно с Анфисой Чеховой» рассказала, как убедила Балабанова взять на роль её однокурсника

Moscow.media
Москва

Собянин: Началось строительство нового тоннеля на Рублево-Архангельской линии метро



103news.comмеждународная интерактивная информационная сеть (ежеминутные новости с ежедневным интелектуальным архивом). Только у нас — все главные новости дня без политической цензуры. "103 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. 103news.com — облегчённая версия старейшего обозревателя новостей 123ru.net.

Мы не навязываем Вам своё видение, мы даём Вам объективный срез событий дня без цензуры и без купюр. Новости, какие они есть — онлайн (с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии).

103news.com — живые новости в прямом эфире!

В любую минуту Вы можете добавить свою новость мгновенно — здесь.

Музыкальные новости

Shaman

Shaman закрыл концерт в Перми песней «Я останусь с тобой» и бросил толстовку




Спорт в России и мире

Алексей Смирнов – актер, которого, надеюсь, еще не забыли

Офицеры Управления Росгвардии по Ивановской области стали призерами Чемпионата Центрального округа

Танцевальный день «Двигайся в такт» от спортивного клуба «Колибри» в ТРЦ «Нора»

Чемпионат Центрального округа по летнему офицерскому троеборью завершился в Москве


ATP

Алибек Качмазов поднялся на 73 позиции в рейтинге ATP, достигнув 179-го места



Новости Крыма на Sevpoisk.ru


Москва

Специалисты, к которым хочется возвращаться. Кем может гордиться Москва?



Частные объявления в Вашем городе, в Вашем регионе и в России