Дигитална смърт заплашва българския език
Българският е сред европейските езици, заплашени от дигитална смърт, сочи изследване на водещи европейски експерти в сферата на езиковите технологии.
Изследването е проведено от Европейската мрежа за върхови постижения META-NET, в която членуват 60 изследователски центъра от 34 страни, сред които е и Институтът за български език „Проф. Любомир Андрейчин“, съобщиха от пресцентъра на БАН.
След оценка на състоянието на езиковите технологии за 30 от близо 80-те езика, които се говорят в Европа, експертите достигнаха до извода, че езиковите технологии за 21 от 30-те изследвани езика или са „недоразвити“, или са „слабо развити“.
Проучването е проведено от над 200 експерти и е обобщено в 30 на брой Бели книги за различните езици, които са публикувани от META-NET в печатни издания и онлайн.
Белите книги включват обзор и оценка на състоянието на наличните езикови технологии за всеки език в четири различни категории: автоматичен превод, обработка и синтез на реч, анализ на текст и общо състояние на езиковите ресурси.
В поне една от тези категории 21 от 30-те езика получават най-ниската оценка, т.е. за тях липсват езикови технологии или съществуващите технологии са недоразвити.
Категорията със слаба оценка за българския език е автоматичният превод. В останалите той получава средна оценка.
Няколко езика, сред които исландски, латвийски, литовски и малтийски, получават най-ниска оценка и в четирите категории.
Състоянието на наличните езикови ресурси и технологии не е оценено като „отлично“ за нито един език, ресурсите за английски получават висока оценка, след това се нареждат холандски, френски, немски, италиански и испански език, които са оценени като „средно развити“.
Технологиите и ресурсите за езици като баски, български, каталонски, гръцки, унгарски и полски са категоризирани като „фрагментарно развити“, което означава, че са сред езиците с висок риск от отмиране в дигиталната епоха.
Това означава, че в момента българският език не е застрашен, но ситуацията би могла да се промени значително с навлизането на ново поколение технологии, използващи наистина ефективно естествените езици, подчертават от БАН.
Още по темата:
- » Увеличават заплатите на учени от БАН
- » Представиха BgGPT - първият отворен изкуствен интелект на български език
- » БАН: Близо 40% от българите са енергийно бедни към 2021 година