Дигитална смърт заплашва българския език

25 септември 2012, вторник / 12:41;
Дигитална смърт заплашва българския език
Българският е сред европейските езици, заплашени от дигитална смърт, сочи изследване на водещи европейски експерти в сферата на езиковите технологии.

Българският е сред европейските езици, заплашени от дигитална смърт, сочи изследване на водещи европейски експерти в сферата на езиковите технологии.

Изследването е проведено от Европейската мрежа за върхови постижения META-NET, в която членуват 60 изследователски центъра от 34 страни, сред които е и Институтът за български език „Проф. Любомир Андрейчин“, съобщиха от пресцентъра на БАН.

След оценка на състоянието на езиковите технологии за 30 от близо 80-те езика, които се говорят в Европа, експертите достигнаха до извода, че езиковите технологии за 21 от 30-те изследвани езика или са „недоразвити“, или са „слабо развити“.

Проучването е проведено от над 200 експерти и е обобщено в 30 на брой Бели книги за различните езици, които са публикувани от META-NET в печатни издания и онлайн.

Белите книги включват обзор и оценка на състоянието на наличните езикови технологии за всеки език в четири различни категории: автоматичен превод, обработка и синтез на реч, анализ на текст и общо състояние на езиковите ресурси.

В поне една от тези категории 21 от 30-те езика получават най-ниската оценка, т.е. за тях липсват езикови технологии или съществуващите технологии са недоразвити.

Категорията със слаба оценка за българския език е автоматичният превод. В останалите той получава средна оценка.

Няколко езика, сред които исландски, латвийски, литовски и малтийски, получават най-ниска оценка и в четирите категории.

Състоянието на наличните езикови ресурси и технологии не е оценено като „отлично“ за нито един език, ресурсите за английски получават висока оценка, след това се нареждат холандски, френски, немски, италиански и испански език, които са оценени като „средно развити“.

Технологиите и ресурсите за езици като баски, български, каталонски, гръцки, унгарски и полски са категоризирани като „фрагментарно развити“, което означава, че са сред езиците с висок риск от отмиране в дигиталната епоха.

Това означава, че в момента българският език не е застрашен, но ситуацията би могла да се промени значително с навлизането на ново поколение технологии, използващи наистина ефективно естествените езици, подчертават от БАН.