Компютърът изяжда българския

Новините

26-09-2012, 06:38

Автор:

"Монитор"

Всичко от Автора

Английският и холандският - отличници, исландският и малтийският сред изчезващите.

Компютърните технологии заплашват да унищожат българския и още 20 европейски езика,

защото за тях няма достатъчно програми за проверка на правопис, търсачки и машинни преводачи в интернет, твърдят водещи европейски експерти в сферата на езиковите технологии в изследване на ЕС, алармира  "Монитор".

Оценката на състоянието на езиковите технологии за 30 от близо 80-те езика е проведено от Европейската мрежа за върхови постижения META-NET, в която членуват 60 изследователски центъра от 34 страни, сред които е и Институтът за български език „Проф. Любомир Андрейчин”.Процесите на влияние от и върху езика ни са непрестанни, категорични са езиковедите, а един от най-емблематичнитепримери за натиска на компютритее писането в интернет на смесица от латински букви и цифри вместо на кирилица.

Причините за писането на т.нар. шльокавица вероятно може да се търсят във времето, когато използването на кирилица в интернет не беше възможно или не беше лесно, коментира вчера проф. д-р Светла Коева, директор на Института за български език „Проф. Любомир Андрейчин” и един от авторите на изследването от българска страна. Според други експерти при бързото развитие на дигиталните технологии тази неофициална подмяна на азбуката ни може да се повтори на друго ниво и езикът ни да бъде изместен от някой по-съвместим с компютрите.

Проучването е проведено от над 200 експерти и включва обзор и оценка на състоянието на наличните езикови технологии за всеки език в четири различни категории: автоматичен превод, обработка и синтез на реч, анализ на текст и общо състояние на езиковите ресурси. В поне една от тези категории 21 от 30-те езика получават най-ниската оценка, като за българския категорията е автоматичният превод.„Тази оценка означава, че българският езикняма достатъчно добри системикоито да превеждат автоматично от и на български език (не само с английски, испански, но и с други езици като шведски, холандски и т.н.), коментира вчера за „Монитор” проф. д-р Светла Коева.След най-заплашените от дигитална смърт са исландски, латвийски, литовски и малтийски, като получават най-ниска оценка и в четирите категории.

Състоянието на наличните езикови ресурси и технологии не е оценено като „отлично” за нито един език, но все пак английският получава висока оценка, а след това се нареждат холандският, френският, немският, италианският и испанският език, които са оценени като „средно развити”.Сред останалите езици с висок риск за отмиране освен българският са каталански, гръцки, унгарски и полски.„Резултатите от проведения от нас анализ са силно обезпокоителни. По-голямата част от европейските езици не разполагат с достатъчно количество адекватни ресурси, които да гарантират оцеляването им в епохата на развитите технологии”, казва за резултатите от изследването проф. Ханс Уцкорайт, координатор на инициативата META-№ET и научен директор на Германския център за проучване на изкуствения интелект (DFKI).

Езиковите технологии са главно софтуер, който може да обработва говорима и писмена човешка реч. Добре познати приложения на такъв софтуер са програмите за правописна и граматична корекция и за синтез на реч, интерактивните лични асистенти на смартфоните, диалоговите системи за обработка на въпроси по телефона и системите за автоматичен превод. Към категорията спадат и уебтърсачките, както и синтезаторите на реч в навигационните системи за автомобили.Съвременните системи, базирани на езикови технологии, изискват голям обем данни от писмена и устна реч и за езиците са относително малко носители като българския, те се набират трудно в сравнение с езици като френски, които се използват от цялата френскоговоряща общност.

META-NET показва рисковете
Белите книги на META-NET, издавани в серията „Езиците в европейското информационно общество” (Languages in the European Information Society), предлагат анализ на достъпа до езикови технологии за 30 европейски езика и хвърлят светлина върху най-непосредствените рискове и възможности за развитие. Книгите в серията представят всички официални езици на страните ­ членки на ЕС, както и няколко други езика, които се говорят на територията на Европа. Анализът на експертите на META-NET показва защо повечето европейски езици изпитват сериозни проблеми в дигиталното пространство и посочва онези липси, които са най-опасни за бъдещето на европейските езици. Над 200 автори и консултанти са участвали в изготвянето на Белите книги. META-NET изгражда многоезиковия европейски технологичен алианс META (Multilingual Europe Technology Alliance).